首页    期刊浏览 2024年09月20日 星期五
登录注册

文章基本信息

  • 标题:Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive
  • 本地全文:下载
  • 作者:Tadić, Marko
  • 期刊名称:Contemporary linguistics
  • 印刷版ISSN:0586-0296
  • 电子版ISSN:1847-117X
  • 出版年度:1997
  • 卷号:43-44
  • 期号:1-2
  • 页码:387-394
  • 出版社:Hrvatsko filološko društvo
  • 摘要:Članak daje pregled obradbe hrvatskih korpusa. Navode se najvažniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas. Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv (HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa, dok će se u drugoj fazi sav napor preusmjeriti na širenje obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30- milijunskom korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i javnoga testiranja probne inačice korpusa (7,68 milijuna pojavnica) putem WWW-a.
国家哲学社会科学文献中心版权所有