En este sitio ofrecemos, a medida de nuestras posibilidades y pequeños logros, las herramientas que podamos ir desarrollando para el tratamiento y procesamiento de textos en mapudüngun.
Düngupeyüm (herramienta del lenguaje)
El Düngupeyüm es un analizador y generador morfólógico para mapudüngun construído con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos.
En su proceso, el Düngupeyüm aplica reglas de unificación ortográfica y después analiza el texto.
Las reglas generadas para el funcionamiento del Düngupeyüm, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets en su libro "A Grammar of Mapuche" del mapudüngun.
[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Part VIII, Texts. Berlin, New York: Mouton de Gruyter, 2008]
Ngülamwirinten (Corrector ortográfico para mapudüngun [prototipo])
Aplicación basada en el Düngupeyüm.
Estamos trabajando para convertirlo en una aplicación útil, de momento es un prototipo, por lo tanto podría presentar fallas.
IECMap (interfaz de explotación de corpus del mapudüngun)
Esta interfaz, CQPWeb, fue creada por Andrew Hardie (Universidad de Lancaster). Nuestra versión está adaptada y en proceso de traducción, aunque también ofrecemos la posibilidad de utilizarla en inglés.
Los corpus en mapudüngun están etiquetados con Düngupeyüm, en cambio los corpus en castellano o inglés están etiquetados con FreeLing [condiciones de uso].
ISECMap (interfaz sencilla de explotación de corpus del mapudüngun)
Esta interfaz ha sido completamente desarrollada por chandia.net, aunque también se basa en el lenguaje de consultas a corpus (CQP) desarrollado por CWB. Es un intento de facilitar al usuario poco experimentado en herramientas de explotación de corpus, el acceso a los datos de los corpus etiquetados por nosotros.
Los corpus son exactamente los mismos que están disponibles en IECMap.
KMT - Kümewirin Mapudüngun Trapümwe (unificador ortográfico de mapudüngun)
El NMT es una herramienta de unificación ortográfica para el mapudüngun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua.
La versión actual está desarrollada, casi en su totalidad, con python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web, y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde el área de texto.
CORLEXIM (corpus lexicográfico del mapudüngun)
Es el primer corpus de acceso libre creado para el mapudüngun, y que se propone facilitar y promover el acceso a la mayor cantidad posible de obras lexicográficas en lengua mapuche, y así estimular la investigación sobre esta lengua y su cultura.
ashngellupeyüm (ñi mollfüñelngen) (juguete en desarrollo)
Este es un juguete sin ninguna otra pretensión más que la de entretenerse un rato...
El ashngellupeyüm se basa en el Düngupeyüm, nuestro analizador y generador morfológico para mapudüngun.
En vez de mostrar toda la información que muestra la interfaz de análisis al procesar palabras, el ashngellupeyüm despliega las partes de que se compone la palabra (los morfemas -sufijos-) en diferentes colores.
Además, al pasar el cursor del mouse sobre estos colores se reproduce el sonido de una püfüllka tocando notas aleatorias.