首页    期刊浏览 2024年10月01日 星期二
登录注册

文章基本信息

  • 标题:Ambigüedad en nombres hispanos
  • 本地全文:下载
  • 作者:Grettel Barceló ; Eduardo Cendejas ; Igor Bolshakov
  • 期刊名称:Revista Signos
  • 印刷版ISSN:0035-0451
  • 电子版ISSN:0718-0934
  • 出版年度:2009
  • 卷号:42
  • 期号:70
  • 页码:153-169
  • 语种:Spanish
  • 出版社:Pontificia Universidad Católica de Valparaíso
  • 摘要:La constitución de los nombres hispanos presupone en muchos casos un grado de ambigüedad. La estructura de las secuencias denominativas en países hispanos conlleva a la presencia de cinco problemas fundamentales que obstaculizan su interpretación: (1) la doble deducción de sexo en nombres personales, por ejemplo 'Guadalupe'; (2) la asociación de nombres y/o apellidos en un solo elemento, como en 'Jorge Luis', cuyos constituyentes existen aisladamente; (3) la composición de los elementos mediante un conectivo; (4) la dualidad nombre/apellido; y (5) la omisión permitida de alguno de los elementos en la secuencia denominativa. Nuestro estudio está orientado a detectar y analizar la ambigüedad mencionada de manera automática. Se desarrolló una gramática formal que determina las interpretaciones válidas de las cadenas nominales, por medio de un etiquetado automático de todos los elementos que la componen. Además, se presentan gráficas que muestran la distribución de los nombres y apellidos, de lo cual, el hallazgo más importante es que la frecuencia de estos cumple con la ley de Zipf. Se utilizó como fuente de conocimiento un corpus con 745.084 registros personales, de los cuales se extrajeron 93.998 nombres y 13.779 apellidos únicos, entre simples, compuestos y asociados. Partiendo de estos, se detectaron 77.162 fuentes de ambigüedad en nombres y 2.739 en apellidos, lo que representa el 82% y el 20% respectivamente. Del total de los registros personales estudiados, 241.922 presentan al menos dos interpretaciones válidas en la denominación, lo cual corresponde al 33% de la muestra.
  • 其他摘要:The constitution of Hispanic names assumes a degree of ambiguity in many cases. The structure of the denominative sequences in Hispanic countries presents five fundamental problems that obstruct their interpretation: (1) the double sex deduction in personal names, as in Guadalupe; (2) the association of names and/or surnames in one name, as in Jorge Luis, whose components exist separately; (3) the composition of the elements by means of a connector; (4) the name/surname duality; and (5) the accepted omission of some of the elements of the denominative sequences. This study focuses on the automatic detection and analysis of these types of ambiguities (uncertainties). A formal grammar that determines valid interpretations of the nominal chains was developed by means of the automatic labeling of all the elements of which this grammar is composed. Furthermore, graphs of the distribution of the names and surnames are presented, the most important of which reveals that the frequency abides by Zipf's law. A corpus of 745,084 personal records was used as a data source. From these records, 93,998 type names, and 13,779 type surnames, including simple, compound, and associate ones, were taken. From these, 77,162 (82%) ambiguity sources in names and 2,739 (20%) ambiguity sources in surnames were detected. From all of the personal records analyzed, 241,992 (33%) present at least two valid interpretations in the denomination.
  • 关键词:Ambigüedad; secuencia denominativa; gramática generativa; asociación; composición;Ambiguity; denominative sequence; generative grammar; association; composition
国家哲学社会科学文献中心版权所有