摘要:Este artículo presenta un método para la creación de diccionarios marcados con un valor específico (por ejemplo, las emociones, la polaridad) para su uso en varias tareas de procesamiento de lenguaje natural realizadas por computadoras. En el diccionario creado las palabras seleccionadas se han etiquetado con seis emociones básicas. Para eso, las palabras primero fueron analizadas (anotadas) manualmente por múltiples evaluadores y ponderadas automáticamente a base de estas. El método se aplicó para el idioma español. Las palabras que conforman el diccionario fueron etiquetadas con las categorías emocionales básicas: alegría, enojo, miedo, tristeza, sorpresa y repulsión. A diferencia de otros diccionarios para computadoras, el diccionario propuesto contiene ponderaciones —porcentajes de probabilidad de ser usadas con un sentido emocional—. Cada palabra fue valorada por múltiples evaluadores, y posteriormente se realizó un análisis de concordancia con el método de kappa ponderado, adaptándolo para evaluadores múltiples. Con los resultados obtenidos, se propuso una medida que estima qué tan frecuente es el uso afectivo de una palabra: factor de probabilidad de uso afectivo (FPA), el cual sirve para dotar a las palabras potencialmente emocionales con un factor de peso. El FPA puede ser incluido como información en sistemas automáticos, por ejemplo, para la detección de sentimientos en texto. El FPA se refiere a la tendencia del uso de cada palabra, no es una característica absoluta. Así, es útil para los sistemas automáticos.
其他摘要:This paper presents a method for creation of dictionaries marked with specific values (for example, emotions, polarity) for use in various tasks of automatic natural language processing. In the created dictionary, the selected words are tagged with six basic emotions. For this, they are first analyzed (annotated) manually by multiple annotators and automatically weighted on the basis of these evaluations. The method was applied to the Spanish language. The paradigm chosen for tagging the words that form the dictionary corresponds to basic emotional categories: joy, anger, fear, sadness, surprise and disgust. Unlike other dictionaries, our dictionary contains weightings that correspond to percentages of probability of being used with the sense related to emotion. Each word was evaluated by multiple annotators, and, subsequently, the agreement between them was analyzed with the method of weighted kappa adapted for multiple entries. On the basis of these results, we propose a new measure that estimates the probability of the affective use: probability factor of affective use (PFA), which serves to provide potentially emotional words with the weight. PFA can be used as data in automatic systems for emotional analysis of texts. PFA refers to the use tendency of each word, which is useful for automatic systems.
关键词:Diccionario marcado con emociones; factor de probabilidad de uso afectivo; concordancia entre evaluadores; análisis de sentimientos; método de kappa ponderado;Emotional dictionary; probability factor of affective use; agreement between annotators; sentiment analysis; method of weighted kappa