küdawkawe - herramientas lingüísticas para el mapudungun

En esta sección ofrecemos, a medida de nuestras posibilidades y pequeños logros, las herramientas que podamos ir desarrollando para el tratamiento y procesamiento de textos en mapudungun.

 

Dungupeyem (herramienta del lenguaje)

El Dungupeyem es un analizador y generador morfólógico para mapudungun construído con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/), una aplicación de código abierto para compilar transductores de estados finitos.

En su proceso, el Dungupeyem aplica reglas de unificación ortográfica y después analiza el texto.

Las reglas generadas para el funcionamiento del Dungupeyem, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets en su libro "A Grammar of Mapuche" del mapudungun.

[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Part VIII, Texts. Berlin, New York: Mouton de Gruyter, 2008]

 

IECMap (interfaz de explotación de corpus del mapudungun)

Esta interfaz, CQPWeb, fue creada por Andrew Hardie (Universidad de Lancaster). Nuestra versión está adaptada y en proceso de traducción, aunque también ofrecemos la posibilidad de utilizarla en inglés.

Los corpus en mapudungun están etiquetados con Dungupeyem, en cambio los corpus en castellano o inglés están etiquetados con FreeLing [condiciones de uso].

 

ISECMap (interfaz sencilla de explotación de corpus del mapudungun)

Esta interfaz ha sido completamente desarrollada por chandia.net, aunque también se basa en el lenguaje de consultas a corpus (CQP) desarrollado por CWB. Es un intento de facilitar al usuario poco experimentado en herramientas de explotación de corpus, el acceso a los datos de los corpus etiquetados por nosotros.

Los corpus son exactamente los mismos que están disponibles en IECMap.

 

NMT - Norwirin Mapudungun Trapümfe (unificador ortográfico de mapudungun)

El NMT es una herramienta de unificación ortográfica para el mapudungun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua.

La versión actual está desarrollada, casi en su totalidad, con python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web, y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde el área de texto.

 

CORLEXIM (corpus lexicográfico del mapudungun)

Es el primer corpus de acceso libre creado para el mapudungun, y que se propone facilitar y promover el acceso a la mayor cantidad posible de obras lexicográficas en lengua mapuche, y así estimular la investigación sobre esta lengua y su cultura.

FacebookTwitterGoogle+Share