Desde julio de 2023 nuestro analizador morfológico viene siendo modificado. Por una parte se están adaptando etiquetas debido al renombramiento de algunos sufijos y otros elementos del mapudüngun. Por otra, el sistema puede presentar cambios en lo que se refiere a los análisis, ya que puede variar la interpretación de la formación de temas verbales. Todos estos cambios, o los que lo ameriten, serán publicados en artículos que los justifiquen desde un punto de vista teórico-lingüístico.
En este sitio ofrecemos, a medida de nuestras posibilidades y pequeños logros, las herramientas que podamos ir desarrollando para el tratamiento y procesamiento de textos en mapudüngun.
El Düngupeyüm es un analizador y generador morfólógico para mapudüngun construído con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos.
En su proceso, el Düngupeyüm aplica reglas de unificación ortográfica y después analiza el texto.
Las reglas generadas para el funcionamiento del Düngupeyüm, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets en su libro "A Grammar of Mapuche" del mapudüngun.
[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Part VIII, Texts. Berlin, New York: Mouton de Gruyter, 2008]
Aplicación basada en el Düngupeyüm.
Estamos trabajando para convertirlo en una aplicación útil, de momento es un prototipo, por lo tanto podría presentar fallas.
Esta interfaz, CQPWeb, fue creada por Andrew Hardie (Universidad de Lancaster). Nuestra versión está adaptada y en proceso de traducción, aunque también ofrecemos la posibilidad de utilizarla en inglés.
Los corpus en mapudüngun están etiquetados con Düngupeyüm, en cambio los corpus en castellano o inglés están etiquetados con FreeLing [condiciones de uso].
Esta interfaz ha sido completamente desarrollada por chandia.net, aunque también se basa en el lenguaje de consultas a corpus (CQP) desarrollado por CWB. Es un intento de facilitar al usuario poco experimentado en herramientas de explotación de corpus, el acceso a los datos de los corpus etiquetados por nosotros.
Los corpus son exactamente los mismos que están disponibles en IECMap.
El KMT es una herramienta de unificación ortográfica para el mapudüngun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua.
La versión actual está desarrollada, casi en su totalidad, con python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web, y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde el área de texto.
Es el primer corpus de acceso libre creado para el mapudüngun, y que se propone facilitar y promover el acceso a la mayor cantidad posible de obras lexicográficas en lengua mapuche, y así estimular la investigación sobre esta lengua y su cultura.
Este es un juguete sin ninguna otra pretensión más que la de entretenerse un rato...
El ashngellupeyüm se basa en el Düngupeyüm, nuestro analizador y generador morfológico para mapudüngun.
En vez de mostrar toda la información que muestra la interfaz de análisis al procesar palabras, el ashngellupeyüm despliega las partes de que se compone la palabra (los morfemas -sufijos-) en diferentes colores.
Además, al pasar el cursor del mouse sobre estos colores se reproduce el sonido de una püfüllka tocando notas aleatorias.
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional