Mi INFOTEC Alertas Editar Perfil

Por favor, use este identificador para citar o enlazar este ítem: http://infotec.repositorioinstitucional.mx/jspui/handle/1027/443

Título :	Métodos para la creación de modelos de texto independientes del lenguaje y robustos a errores aplicados a problemas de clasificación
Autor:	Eric Sadit Téllez Avila
Nivel de acceso:	Acceso Abierto
Licencia:	Atribución-NoComercial-SinDerivadas
Materia:	Semántica
Resumen o descripción:	Objetivo: Crear modelos de texto que se adapten de manera efectiva a problemas de dominio específico, de manera más precisa, que se optimicen de manera automática para el lenguaje y la tarea por resolver. Objetivos específicos: 1. Determinar un conjunto suficiente de trasnformaciones de texto y tokenizadores que funcionen de manera independiente del lenguaje y que a su vez sean capaces de soportar errores léxicos comunes en textos informales, 2. Creación de un esquema de optimización combinatoria sobre las configuraciones resultantes de las transformaciones y tokenizadores que maximice el desempeño par una tarea de clasificación de texto fijando el proceso para el esquema pesado de términos y el esquema de clasificación, 3. Especialización del esquema para optimización combinatoria basadas en búsqueda estocástica como random search, hill climbing, tabu search, simulated annealing, principalmente, 4. Optimización del esquema de pesado de términos específico para una configuración y una tarea dada, 5. Adentrarse en esquemas de modelado semántico robusto a errores, 6. Creación de un sistema de código abierto que implemente la investigación desarrollada en este proyecto con el fin de permitir a otros investigadores comparar nuestro método fácilmente, así como también crear demostraciones de categorizadores, 7. Aplicación en diferentes dominios, tanto en problemas definidos de manera natural en texto como en aquellos que requieren una transformación a texto. Protocolo de investigación
Editor:	INFOTEC Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación
Fecha de publicación :	2018-02
Tipo de publicación :	Protocolo de investigación
Idioma:	Español
Audiencia:	Investigadores Público en general
Forma de citación:	Téllez Avila, E. S. (2018). Métodos para la creación de modelos de texto independientes del lenguaje y robustos a errores aplicados a problemas de clasificación. INFOTEC.
Área de conocimiento:	OTRAS ESPECIALIDADES TECNOLÓGICAS
Versión de la publicación:	Versión aceptada
Versión de la publicación:	acceptedVersion - Versión aceptada
Aparece en las colecciones:	Estudios no vigentes

Cargar archivos:

Fichero	Tamaño	Formato
2S_2_1_3-Dr_Eric_Téllez-Protocolo de Investigación(Métodos para la creación).pdf	9.72 MB	Adobe PDF	Visualizar/Abrir