首页    期刊浏览 2024年11月29日 星期五
登录注册

文章基本信息

  • 标题:Statistilised meetodid murdekorpuse ühendverbide tuvastamisel
  • 本地全文:下载
  • 作者:Kristel Uiboaed
  • 期刊名称:Lähivõrdlusi. Lähivertailuja
  • 印刷版ISSN:1736-9290
  • 出版年度:2010
  • 卷号:6
  • 页码:307-326
  • 语种:English
  • 出版社:Eesti Rakenduslingvistika Ühing
  • 摘要:Sõnadevahelise seose tugevuse mõõtmise statistikuid kasutatakse arvutilingvistikas püsiühendite tuvastamisel. Statistikud võimaldavad korpuses kahele sõnale arvutada nendevahelise seose tugevuse väärtuse, mille põhjal võib otsustada, kas tegemist on püsiühendiga või mitte. Statistikute kasutamise eelis on, et arvesse ei võeta ainult sõnade koosesinemise, vaid ka ühendit moodustavate sõnade eraldiesinemise sagedusi. Artiklis teen katse rakendada statistikuid Eesti murrete korpuse kaheliikmeliste ühendverbide automaatsel tuvastamisel. Katsetatud on kolme murderühma peal eraldi nelja statistikut: t-skoori, vastastikuse informatsiooni väärtust MI, hii-ruut statistikut ning log-tõepära funktsiooni. DOI: http://dx.doi.org/10.5128/ERYa6.19
  • 关键词:arvutilingvistika;korpuslingvistika;murdeuurimine;meetodid ja vahendid;statistika;eesti keel
国家哲学社会科学文献中心版权所有