出版社:Eesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics)
摘要:In reading out a text,pauses and breathing as two of the naturalness parameters of the read-out text are closely related to its functional style (journalism, ction).The results of text study may,apart from contributing to the naturalness of synthetic speech,help recognize the genre of the text,differentiate between functional styles as well as authors,and economize on the use of word lists and grammar in text automatic analysis.The article refers to some studies that relate to breathing and pauses as well as to some other formalizable parameters of Estonian texts,yet have not been considered in language technologies.To verify the above thesis the pauses and breathing in two genres of read-out texts of ction are compared to the available data of a news text.The results prove that the duration of pauses and inhalations as well as their relation to the syntactic structure of the sentence does differ not only according to functional style but also according to genre.The syntactic structure is mainly indicated by punctuation marks.In ction pausing partly depends on reader’s interpretation.In text-to-speech synthesis for the effect of reading aloud breaks and breathing should be generated from the data of extended news texts as a parametrically neutral genre.
其他摘要:Oleme varasemas uurimuses näidanud,et ettelugemisel seostuvad pausid ja hingamine kui etteloetud teksti loomulikkuse tunnused tugevasti funktsionaalstiiliga (ajakirjandustekst,ilukirjandustekst).Tekstiuurimuse andmestik aitab muuta loomulikuks sünteeskõne,kuid ka tuvastada tekstiliiki ehk žanrit,eristada funktsionaalstiile ja autorite sõnastuslaadi ning muuta otstarbekamaks sõnastiku ja grammatika kasutuse teksti automaatses analüüsis.Artiklis osutatakse hingamise ja pausidega seostuvale ja teistele eesti teksti formaliseeritavate parameetrite uurimustele,mida keeletehnoloogia arenduses seni arvestatud ei ole.Varasema kontrollimiseks võrreldakse ilukirjandusteksti kahe žanri ettelugemise pause ja hingamist ajakirjandusuudise seniste andmetega.Tulemused kinnitavad,et pauside ja sissehingamise kestus ning nende seotus lause süntaktilise liigendusega erineb mitte ainult funktsionaalstiilide,vaid ka žanrite kaupa.Süntaktilist liigendust kannavad seejuures peamiselt kirjavahemärgid.Ilukirjanduse puhul mängib pauside tekkes kaasa teksti lugejapoolne interpretatsioon.Tekst–kõne-sünteesis,mis on mõeldud tekstide ettelugemiseks,tuleks pauside ja hingamise genereerimisel lähtuda pikema ajakirjandusliku uudise kui muudeltki parameetritelt neutraalse tekstiliigi andmetest.