首页    期刊浏览 2025年12月28日 星期日
登录注册

文章基本信息

  • 标题:Korpusnojezikoslovna obradba tekstova Sportskih novosti
  • 本地全文:下载
  • 作者:Stojanov, Tomislav ; Vučić, Zoran
  • 期刊名称:Filologija
  • 印刷版ISSN:0449-363X
  • 出版年度:2013
  • 期号:59
  • 页码:103-129
  • 出版社:Croatian Academy of Sciences and Arts
  • 摘要:U radu se propitkuje uloga korpusa za jezikoslovna istraživanja i testiraju sučelja dvaju hrvatskih korpusa, Philologic i Bonito, za jezične upite na razini dokumenta i sadržaja, prikazbe te znakova i forme. Za specijalizirane jezikoslovne pretraživačke upite izgradili smo sportsku novinsku bazu internetskih tekstova Sportskih novosti od travnja 2008. do srpnja 2009. godine (3,6 milijuna pojavnica). Pokazat će se računalni postupci dohvaćanja teksta, n‑gramski SQL/regex‑upiti u cilju izvlačenja supojavnih čestotnica i otkrivanja frazema, naziva i stalnijih sintagmema, te njihova vizualizacija u prebirniku (browseru) uz pomoć javaskriptne biblioteke WireIt. Ukazali smo da izgrađena metodologija može poslužiti za dobivanje jedinstvenih informacija za jezikoslovna istraživanja, te usporedili rezultate našega pristupa s tražilicom Google na osnovi kojih smo istaknuli sedam nedostataka rezultata Googleovih pretraživanja za jezikoslovna istraživanja.
  • 关键词:pretraživanje teksta; SQLite; dohvaćanje podataka; tražilica Google; korpusno jezikoslovlje; Sportske novosti; n-gram; kolokacija; hrvatski jezik
国家哲学社会科学文献中心版权所有