Por favor, use este identificador para citar o enlazar este ítem: http://infotec.repositorioinstitucional.mx/jspui/handle/1027/443
Métodos para la creación de modelos de texto independientes del lenguaje y robustos a errores aplicados a problemas de clasificación
Eric Sadit Téllez Avila
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Semántica
Objetivo: Crear modelos de texto que se adapten de manera efectiva a problemas de dominio específico, de manera más precisa, que se optimicen de manera automática para el lenguaje y la tarea por resolver. Objetivos específicos: 1. Determinar un conjunto suficiente de trasnformaciones de texto y tokenizadores que funcionen de manera independiente del lenguaje y que a su vez sean capaces de soportar errores léxicos comunes en textos informales, 2. Creación de un esquema de optimización combinatoria sobre las configuraciones resultantes de las transformaciones y tokenizadores que maximice el desempeño par una tarea de clasificación de texto fijando el proceso para el esquema pesado de términos y el esquema de clasificación, 3. Especialización del esquema para optimización combinatoria basadas en búsqueda estocástica como random search, hill climbing, tabu search, simulated annealing, principalmente, 4. Optimización del esquema de pesado de términos específico para una configuración y una tarea dada, 5. Adentrarse en esquemas de modelado semántico robusto a errores, 6. Creación de un sistema de código abierto que implemente la investigación desarrollada en este proyecto con el fin de permitir a otros investigadores comparar nuestro método fácilmente, así como también crear demostraciones de categorizadores, 7. Aplicación en diferentes dominios, tanto en problemas definidos de manera natural en texto como en aquellos que requieren una transformación a texto. Protocolo de investigación
INFOTEC Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación
2018-02
Protocolo de investigación
Español
Investigadores
Público en general
Téllez Avila, E. S. (2018). Métodos para la creación de modelos de texto independientes del lenguaje y robustos a errores aplicados a problemas de clasificación. INFOTEC.
OTRAS ESPECIALIDADES TECNOLÓGICAS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Estudios no vigentes

Cargar archivos: