Repositorio Institucional CENFOTEC

Valoración de la eficiencia y eficacia de algoritmo GDS para ubicación espacial de nombres personales como apoyo a la detección de duplicados ingresados con un teclado QWERTY Latinoamericano.

Mostrar el registro sencillo del ítem

dc.contributor.author Alvarado Cantillano, Keyla
dc.contributor.author Carvajal Pérez, Rigoberto
dc.date.accessioned 2023-01-05T23:05:04Z
dc.date.available 2023-01-05T23:05:04Z
dc.date.issued 2015-04
dc.identifier.uri xmlui/handle/123456789/304
dc.description.abstract Una de las mayores oportunidades de mejora que se encuentra hoy en día en las empresas está relacionada con la calidad de los datos. La mayoría de técnicas, herramientas y algoritmos que se encuentran han sido desarrollados para el manejo de palabras de uso cotidiano y nombres de personas. La corrección de nombres de personas, dada la cantidad de variantes que pueden existir, no ha sido una tarea fácil y esta genera muchos problemas, los cuales pueden limitar la toma de decisiones, incluso la creación de nuevas aplicaciones que permitan agilizar los procesos tanto internos como externos en las organizaciones. En el siguiente trabajo se presenta un nuevo algoritmo llamado GDS (Geometric Distance for Strings), que ubica espacialmente cadenas de texto en un espacio tridimensional, predefiniendo clústeres de valores similares. Al combinarse GDS con la función de similitud SIMIL se convierte en una solución efectiva y eficiente para la detección de datos duplicados, que representan nombres de personas. Se realizaron evaluaciones con datos reales y una comparación con algoritmos existentes para validar los resultados. El algoritmo ha sido desarrollado en código abierto, con el fin de que se puedan realizar aportes futuros de cualquier otra persona que esté interesada en el tema. es_MX
dc.language.iso es es_MX
dc.publisher Universidad Cenfotec es_MX
dc.subject GDS es_MX
dc.subject Geometric Distance for Strings es_MX
dc.subject Spatial location for strings es_MX
dc.subject Algoritmo híbrido es_MX
dc.subject Deduplicación es_MX
dc.subject Calidad de datos es_MX
dc.subject Vecino más cercano es_MX
dc.title Valoración de la eficiencia y eficacia de algoritmo GDS para ubicación espacial de nombres personales como apoyo a la detección de duplicados ingresados con un teclado QWERTY Latinoamericano. es_MX
dc.type Thesis es_MX


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem