期刊名称:Dilemas Contemporáneos: Educación, Política y Valores
电子版ISSN:2007-7890
出版年度:2019
页码:1-14
DOI:10.46377/dilemas.v27i1.1579
出版社:Asesorías y Tutorías para la Investigación Científica en la Educación Puig-Salabarría S.C.
摘要:El estudio ha sido diseñado para aplicar marcas diacríticas a 1000 palabras del Punjabi, incluidos 800 nombres y 200 verbos. El corpus de 2 millones de palabras ha sido tomado de diferentes libros, periódicos, revistas, artículos y novelas. Punjabi Shahmukhi carece de recursos digitales en línea para desarrollar diferentes herramientas del Procesamiento de Lenguaje Natural (PLN), lo que ayudaría a reconocer su estado internacional. Punjabi Shahmukhi tiene una escritura "Perso-árabe" y ha sido ignorada por los lingüistas para digitalizar su literatura. El estudio es significativo ya que servirá para el desarrollo de wordnet, ayudando a desarrollar un etiquetador de la parte del habla del Punjabi Shahmukhi, digitalizará su literatura y ayudará a los maestros y no nativos a desarrollarse una armonía intercultural.
其他摘要:The study has been designed to apply diacritical marks to 1000 Punjabi words including 800 nouns and 200 verbs. The corpus of 2 million words has been taken from the different books, newspapers, magazines, articles and novels. Punjabi Shahmukhi lacks any online digital resource to develop different tools of Natural Language Processing (NLP), which will help to recognize the international status of it. Punjabi Shahmukhi has “Perso-Arabic” script and has been ignored by linguists to digitize its literature. The study is significant as it will serve its part in the development of WordNet and will help to develop a Part of Speech (POS) tagger of Punjabi Shahmukhi, digitize the literature of Punjabi Shahmukhi and be helpful for the teachers and non-natives to develop an intercultural harmony.
关键词:digitalización;diacríticos;Procesamiento del Lenguaje Natural (PNL);Punjabi Shahmukhi;WordNet