Mostrar el registro sencillo del ítem
| dc.contributor.author | Bagnarello Hernández, Gianfranco | |
| dc.date.accessioned | 2026-03-18T22:13:08Z | |
| dc.date.available | 2026-03-18T22:13:08Z | |
| dc.date.issued | 2025-12 | |
| dc.identifier.uri | xmlui/handle/123456789/643 | |
| dc.description.abstract | Esta investigación desarrolló un sistema de reconocimiento automático de voz (ASR) para el idioma Bribri, lengua indígena costarricense de bajos recursos, utilizando el modelo Whisper Tiny de OpenAI mediante técnicas de aprendizaje por transferencia. El principal aporte técnico consistió en demostrar que, mediante un riguroso proceso de preparación de datos que incluyó normalización textual, segmentación manual precisa y alineamiento audio-texto, fue posible superar el estado del arte previo (79% WER con Whisper Large v2), alcanzando un 76.19% WER utilizando un modelo 38 veces más pequeño (39 millones vs 1,500 millones de parámetros). Se realizaron 111 experimentos automatizados de optimización de hiperparámetros utilizando las plataformas Optuna y Weights & Biases. Los datos provinieron del Corpus Pandialectal Oral de la Lengua Bribri y del portal SE'IE, totalizando 279 segmentos de 30 segundos cada uno después del preprocesamiento. La investigación demuestra que la calidad en la preparación de datos puede compensar limitaciones en tamaño de modelo y recursos computacionales, logrando resultados superiores con una sola GPU de consumo (NVIDIA RTX 4070 8GB) en comparación con infraestructura HPC utilizada en estudios previos. Estos hallazgos tienen implicaciones importantes para el desarrollo de tecnologías del habla en lenguas indígenas de bajos recursos, reduciendo significativamente las barreras de entrada para comunidades e investigadores. | es_MX |
| dc.language.iso | es | es_MX |
| dc.publisher | Universidad Cenfotec | es_MX |
| dc.subject | Bribri | es_MX |
| dc.subject | Reconocimiento automático de voz | es_MX |
| dc.subject | Lenguas de bajos recursos | es_MX |
| dc.subject | Aprendizaje por transferencia | es_MX |
| dc.subject | Whisper | es_MX |
| dc.subject | Preservación lingüística | es_MX |
| dc.title | Creación de un sistema de procesamiento lenguaje natural para la preservación e identificación del lenguaje Bribri | es_MX |
| dc.type | Thesis | es_MX |