Por favor, use este identificador para citar o enlazar este ítem:
http://infotec.repositorioinstitucional.mx/jspui/handle/1027/443
Métodos para la creación de modelos de texto independientes del lenguaje y robustos a errores aplicados a problemas de clasificación | |
Eric Sadit Téllez Avila | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Semántica | |
Objetivo: Crear modelos de texto que se adapten de manera efectiva a problemas de dominio específico, de manera más precisa, que se optimicen de manera automática para el lenguaje y la tarea por resolver. Objetivos específicos: 1. Determinar un conjunto suficiente de trasnformaciones de texto y tokenizadores que funcionen de manera independiente del lenguaje y que a su vez sean capaces de soportar errores léxicos comunes en textos informales, 2. Creación de un esquema de optimización combinatoria sobre las configuraciones resultantes de las transformaciones y tokenizadores que maximice el desempeño par una tarea de clasificación de texto fijando el proceso para el esquema pesado de términos y el esquema de clasificación, 3. Especialización del esquema para optimización combinatoria basadas en búsqueda estocástica como random search, hill climbing, tabu search, simulated annealing, principalmente, 4. Optimización del esquema de pesado de términos específico para una configuración y una tarea dada, 5. Adentrarse en esquemas de modelado semántico robusto a errores, 6. Creación de un sistema de código abierto que implemente la investigación desarrollada en este proyecto con el fin de permitir a otros investigadores comparar nuestro método fácilmente, así como también crear demostraciones de categorizadores, 7. Aplicación en diferentes dominios, tanto en problemas definidos de manera natural en texto como en aquellos que requieren una transformación a texto. Protocolo de investigación | |
INFOTEC Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación | |
2018-02 | |
Protocolo de investigación | |
Español | |
Investigadores Público en general | |
Téllez Avila, E. S. (2018). Métodos para la creación de modelos de texto independientes del lenguaje y robustos a errores aplicados a problemas de clasificación. INFOTEC. | |
OTRAS ESPECIALIDADES TECNOLÓGICAS | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Estudios no vigentes |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
2S_2_1_3-Dr_Eric_Téllez-Protocolo de Investigación(Métodos para la creación).pdf | 9.72 MB | Adobe PDF | Visualizar/Abrir |