出版社:Eesti Rakenduslingvistika Ühing (Estonian Association for Applied Linguistics)
摘要:Data visualization is an integral part of scientific inquiry in order to represent data and communicate findings.Recent developments such as the rise of large-scale corpora show that techniques to relate linguistically informed analysis and spatial data visualization have become increasingly important for quantitative analysis.Although spatial data visualization has gained momentum,these techniques may not be readily available for small or understudied languages.Here,we give an introduction to spatial data visualization using publicly available resources.We use case studies on Estonian and Votic data to illustrate certain basic tasks in quantitative dialectology.We give solutions to create spatial maps based on either self-extracted coordinates or Google Maps.These maps can be used as a base layer and additional information,such as metadata and frequency distributions,can be represented on top of them.This approach can also be applied to statistical analysis.We illustrate this by carrying out a cluster analysis and its visualization using Google Maps.Thus,a toolkit is provided for quantitative analysis and spatial visualization in dialectology.
其他摘要:Keeleteadusliku uurimismaterjali ja -tulemuste geograafiline visualiseerimine on dialektoloogias olnud alati kesksel kohal,kuid see pole omane ainult murdeuurimisele,vaid on oluline osa mis tahes lingvistilisest tööst,kuhu on kaasatud ruumiline komponent.Tänapäeval on olemas arvukalt programme ja kaardiressursse,mis võimaldavad neid ülesandeid täita.Sageli on aga nende kasutamise eelduseks üsna põhjalikud teadmised geoinfosüsteemidest või mõnest konkreetsest programmist.Käesoleva artikli eesmärk on pakkuda üks lihtne ja kiire võimalus geograafiliste andmete esitamiseks,eeldamata kasutajalt suuri tehnilisi oskusi.Pakutud lahendus ja materjalid on vabavarana saadaval ning iga soovija võib neid oma vajadustele vastavalt kohandada või selle baasilt välja töötada enda jaoks sobivad vahendid.Artiklis kasutame andmestikuna eesti murrete korpust,sh vadja keele alamkorpust,kuid võimalused eri andmete esitamiseks ei ole ühe konkreetse andmestikuga piiratud.