摘要:En este artículo presentamos un método para identificar colocaciones de manera automática en definiciones de verbos extraídas del diccionario explicativo de la Real Academia Española (RAE) con el fin de probar que las colocaciones pueden identificarse aplicando heurísticas sencillas que consideran solo criterios semánticos en contextos textuales bien estructurados, como es el caso de las definiciones lexicográficas. Los candidatos a colocaciones se caracterizan porque están situados al inicio de las definiciones y tienen como particularidad que la base de la colocación candidata pertenece a la familia léxica del verbo definido (1.347 casos). La evaluación de las combinaciones de palabras obtenidas se realizó de manera semiautomática, considerando criterios estadísticos y sintáctico-semánticos. Ésta arrojó como resultado que el 61% de las combinaciones de palabras extraídas de esta manera son colocaciones, logrando alcanzar una cobertura del 36%.
其他摘要:In this paper we present a method for identifying collocations in an automatic way in verb definitions extracted from the explanatory dictionary of the Royal Spanish Academy, in order to test that collocations can be identified by applying simple heuristics considering only semantic criteria in well-structured textual contexts, as lexicographic definitions are presented. The method identifies candidates for collocations located at the beginning of the definitions that have a special feature: the base of the candidate collocation belongs to the lexical family of the defined verb (1,347 cases). The evaluation of the obtained word combinations was performed both manually and automatically following various statistical and syntactic-semantic criteria. The results of our experiment show that 61% of the extracted verb combinations are collocations, obtaining a recall of 36%.
关键词:Colocaciones; unidades fraseológicas; diccionario explicativo; extracción automática de colocaciones.
其他关键词:Collocations; phraseological units; explanatory dictionaries; automatic extraction of collocations.