期刊名称:EKAIA Euskal Herriko Unibertsitateko Zientzi eta Teknologi Aldizkaria
印刷版ISSN:0214-9001
出版年度:2014
卷号:0
期号:27
DOI:10.1387/ekaia.11645
语种:Basque
出版社:Euskal Herriko Unibertsitatea
摘要:Euskarak, beste edozein hizkuntzak bezala, testu-corpusak behar ditu mundu modernoan bizirauteko eta normalki erabiltzeko. Alabaina, euskarazko corpusak gutxi eta txikiak dira, beste hizkuntza handiagoenekin konparatuz gero. Hori horrela da beste hizkuntzek «Web-as-Corpus» izeneko planteamendua baliatu dutelako, hau da, weba erabili dutelako corpus gisa edo corpusak osatzeko testu-iturritzat. Artikulu honetan azaltzen dira bere doktorego-tesian lehenengo autoreak, beste bi autoreen zuzendaritzapean, euskarazko corpusgintzarako weba eta metodo automatikoak baliatzeko egindako ikerketak, garatutako tresnak eta lortutako emaitzak. Horietatik ondorioztatu daiteke «Web-as-Corpus» planteamendua baliagarria dela euskarazko corpusen egoera hobetzeko, garatu diren tresna informatikoen bidez weba corpus gisa kontsultatzeko tresna bat eraiki baita eta mota askotako eta kalitatezko corpusak lortu ahal izan baitira (corpus orokor oso handiak, corpus espezializatuak, corpus konparagarriak,..). Horietako asko jada online gizartearen eskura jarri dira.
关键词:Informatika; Hizkuntza-teknologiak; Lengoaia Naturalaren Prozesamendua; Corpus hizkuntzalaritza;euskara; corpusak; weba; web-as-corpus