摘要:This study presents a methodological toolbox for big data analysis of linguistic constructions by introducing dependency profiles,i.e.,co-occurrences of linguistic elements with syntax information.These were operationalized by reconstructing sentences as delexicalized syntactic biarcs,subtrees of dependency analyses.As a case study,we utilize these dependency profiles to explore usage patterns associated with emoticons,the graphic representations of facial expressions.These are said to be characteristic of Computer-Mediated Communication,but typically studied only in restricted corpora.To analyze the 3.7-billion token Finnish Internet Parsebank we use as data,we apply clustering and support vector machines.The results show that emoticons are associated with three typical usage patterns: stream of the writer’s consciousness,narrative constructions and elements guiding the interaction and expressing the writer’s reactions by means of interjections and discourse particles.Additionally,the more frequent emoticons,such as:),are used differently than the less frequent ones,such as.
其他摘要:Uurimuses esitame metodoloogilise “tööriistakomplekti” keelekonstruktsioonide analüüsimiseks suurandmete põhjal,rakendades sõltuvusprofiile.Sõltuvusprofiil on lingvistiliste elementide koosesinemise esitusviis,kuhu on kaasatud süntaktiline informatsioon.Selleks on laused konstrueeritud sõltuvusanalüüsi alampuudena,kus süntaktiline info on esitatud sõnadevaheliste (kaksik-)kaarte abil.Artiklis rakendame sõltuvusprofiile selleks,et selgitada välja emotikonide kasutusmustrid.Näomiimika graafilised esitused on iseloomulikud arvuti suhtlusele,mida tavaliselt uuritakse piiratud korpuse põhjal,kuid meie kasutame klasterdamist ja tugivektor-masinaid 3,7 miljardi sõna suuruse Soome Interneti Puudepangal.Selgub,et emotikonide kasutus seostub kolme peamise kasutusmustriga: kirjutaja teadvuse vooluga,narratiivsete konstruktsioonidega ning hüüdsõnade ja diskursusepartiklitega,mis juhivad suhtlust ja väljendavad kirjutaja reaktsioone.Lisaks selgub,et sagedastel emotikonidel nagu :),on rohkem erinevaid kasutusi kui harvadel emotikonidel nagu.