期刊名称:LAHOR: journal for Croatian as mother, second and foreign lanugage
印刷版ISSN:1846-2197
电子版ISSN:1848-4972
出版年度:2013
卷号:2
期号:16
页码:189-205
语种:Croatian
出版社:Crotian Philological Society
摘要:Jezični korpusi priznati su izvori jezičnih podataka. Međutim, dohvat tih podataka može biti složen i dugotrajan za krajnje korisnike. Hrvatski korpus dječjega jezika (HKDJ --- Kovačević 2002) jedini je hrvatski korpus govornoga jezika. Sastoji se od prijepisa uzoraka spontanoga govornoga jezika troje djece. Djeca su uzorkovana u pravilnim vremenskim razmacima, od progovaranja do treće godine. Uzorci su transkribirani u programskom paketu CLAN, u skladu s pravilima CHAT-a. Dostupni su u Svjetskoj bazi dječjega jezika CHILDES . Cilj je HKDJ-a pružiti podatke o leksičkom i gramatičkom razvoju u ranom jezičnom usvajanju. Kako bi se omogućio lakši i precizniji dohvat podataka dostupnih u HKDJ-u, pristupilo se izradi Hrvatskoga čestotnoga rječnika dječjega jezika (DjeČeR) čija je izrada još u tijeku. DjeČeR vjerodostojno odražava specifičnosti HKDJ-a (govorni korpus s razvojnom komponentom) te je sukladno strukturiran. U DjeČeRu je omogućen pregled natuknica triju potkorpusa HKDJ-a zasebno te unije i presjeka potkorpusa triju govornika. Pretražuje se prema čestotnosti, abecednom redu, vremenu pojave i vrsti riječi. U DjeČeRu su dostupni i podatci o morfosintaktičkom opisu natuknica* koje se pojavljuju u HKDJ-u te točan popis njihovih obličnica. *Naziv natuknica različito se tretira u dvije različite tradicije u jezikoslovlju, leksikografskoj i psiholingvističkoj (Jelaska, 2005). Unutar leksikografske tradicije označava osnovu unosa u rječnik, to jest početak rječničkoga članka (u tom se značenju u engleskome osim naziva lemma upotrebljava i naziv headword), a u psiholingvistici označava apstraktni osnovni oblik riječi (eng. lemma), to jest jedinicu umnoga rječnika (Crystal 2003).
关键词:Hrvatski korpus dječjega jezika; Hrvatski čestotni rječnik dječjega jezika; CHILDES; lematizacija; označavanje korpusa; struktura čestotnoga rječnika