首页    期刊浏览 2024年10月01日 星期二
登录注册

文章基本信息

  • 标题:DEFINING COLLOCATION FOR SLOVENIAN LEXICAL RESOURCES
  • 其他标题:OPREDELITEV KOLOKACIJ V LEKSIKALNIH VIRIH ZA SLOVENŠČINO
  • 本地全文:下载
  • 作者:Iztok KOSEM ; Simon KREK ; Polona GANTAR
  • 期刊名称:Slovenščina 2.0: empirical, applied and interdisciplinary research
  • 电子版ISSN:2335-2736
  • 出版年度:2020
  • 卷号:8
  • 期号:2
  • 页码:1-27
  • DOI:10.4312/slo2.0.2020.2.1-27
  • 语种:Slovenian
  • 出版社:Trojina, Institute for Applied Slovene Studies
  • 摘要:In this paper,we define the notion of collocation for the purpose of its use in machine-readable language resources,which will be used in the creation of electronic dictionaries and language applications for Slovene. Based on theoretical and lexicographically-driven studies we define collocation as a lexical phenomenon,defined by three key aspects: statistical,syntactic,and semantic. We take lexicographic relevance as a point of departure for defining collocations within the typology of word combinations,as well as for distinguishing them from free combinations. Free combinations are (frequent) syntactically valid word combinations without lexicographic value and consequently there is no need for the description of their meaning,or syntactic role. Next,we distinguish collocations from all multiword lexical units (compounds,phraseological units and lexico-grammatical units) using the lexicographic view that multiword lexical units,whose meaning is not a sum of its parts,require a description of their meaning whereas collocations do not. In the final part,we return to the three aspects of collocation and their role in automatic extraction of collocational information from corpora. Semantic criterion or dictionary relevance of extracted collocations has particularly exposed the problem of semantically broad collocates such as certain types of adverbs, adjectives and verbs,and word which feature in different syntactic roles (e.g. pronouns and adjuncts). We discuss a particular issue of collocations related to proper names and the decisions about their inclusion into the dictionary based on the evaluation of lexicographers.
  • 其他摘要:V prispevku definiramo pojem kolokacije za namene vključitve v strojno procesljive jezikovne vire,ki bodo služili izdelavi elektronskih jezikovnih priročnikov in različnih jezikovnih aplikacij za slovenščino. Na podlagi teoretičnih in slovarsko usmerjenih študij definiramo kolokacijo kot leksikalni jezikovni pojav,pri čemer izhajamo iz treh ključnih vidikov: statističnega,skladenjskega,in pomenskega. Kot izhodišče za opredelitev kolokacij znotraj vseh besednih kombinacij v jeziku in za ločevanje kolokacij od prostih besednih zvez štejemo njihovo slovarsko relevantnost. Proste besedne zveze v jeziku obstajajo kot (pogoste) skladenjsko ustrezne besedne kombinacije,ki pa nimajo slovarske vrednosti v smislu pomenskega opisa ali opisa njihove skladenjske ali gramatične vloge. Nadaljnja delitev temelji na slovarsko-semantičnem kriteriju,ki ločuje kolokacije od vseh drugih slovarsko relevantnih enot na podlagi leksikografske odločitve,da besedna zveza potrebuje opis pomena (t. i. večbesedne leksikalne enote). Pri naši opredelitvi kolokacije ne potrebujejo pomenskega opisa,kar jih v temelju ločuje od zvez z neidiomatičnim pomenom (stalne besedne zveze),različnih frazeoloških enot pa tudi od t. i. leksikalno-gramatičnih enot,ki imajo primarno besedilno povezovalne in druge skladenjske vloge. Pri opredeljevanju kolokacij kot slovarskih enot se znova vrnemo k trem ključnim kriterijem,ki jih podrobneje opišemo z vidika avtomatskega luščenja kolokacijskih podatkov iz korpusov. Slovarska relevantnost izluščenih kolokacij je izpostavila predvsem problem semantično odprtih kolokatorjev,kot so določeni tipi prislovov,pridevnikov in glagolov,in besed, ki se pojavljajo v različnih skladenjskih vlogah (e.g. zaimki in členki). Posebej opišemo problem lastnoimenskih kolokatorjev in odločitve pri vključevanju takih primerov v slovar na podlagi evalvacije med leksikografi.
  • 关键词:collocation;multiword lexical unit;word combination;Slovene;lexicography;dictionary database
  • 其他关键词:kolokacija;večbesedna leksikalna enota;besedna kombinacija; slovenščina;leksikografija;slovarska baza
国家哲学社会科学文献中心版权所有