摘要:Artikkel räägib püsiühendite automaattöötlusest arvutilingvistikas. Püsiühendi all mõeldakse siin kahe või enama sõna(vormi) ühendit, mida mingi tähenduse väljendamiseks on tavaks koos kasutada; selle definitsiooni alla mahuvad nii idiomaatilised kui ka kollokatiivsed ühendid. Arvutilingvistikas on püsiühendid probleemiks, sest nad komplitseerivad teksti alt-üles analüüsimudelit, mille järgi lause struktuuri ja tähenduse ehituskiviks on üksiksõna. Artikkel annab ülevaate püsiühendite automaattöötluse kolmest etapist – püsiühendite tuvastamisest, nende leksikoni koostamisest ja püsiühendite märgendamisest tekstis. Nende ülesannete lahendamiseks on arvutilingvistikas välja töötatud tüüpilised meetodid, kuid need meetodid on eesti keele kui vaba sõnajärjega morfoloogiliselt keeruka keele analüüsil rakendatavad ainult teatud reservatsioonide ja modifikatsioonidega. Artiklis analüüsitaksegi eesti keele “erivajadusi” selles vallas. DOI: http://dx.doi.org/10.5128/ERYa5.10
关键词:arvutilingvistika;püsiühendid;püsiühendite tuvastamine;püsiühendite leksikon;püsiühendite märgendamine;eesti keel