Please use this identifier to cite or link to this item: http://infotec.repositorioinstitucional.mx/jspui/handle/1027/300
Automatic Generation of Summary Obfuscation Corpus for Plagiarism Detection
SABINO MIRANDA JIMENEZ
Efstathios Stamatatos
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Tecnologías de la Información y Comunicación
Lingüística aplicada
Sistemas de detección de plagio
En este artículo, describimos un enfoque para crear un corpus de ofuscación de resumen para la tarea de detección de plagio. Nuestro método se basa en información de las Conferencias de comprensión de documentos relacionadas con los años 2001 y 2006, para el idioma inglés. En general, un resumen no atribuido utilizado en el documento de otra persona se considera un tipo de plagio porque las ideas principales del autor siguen siendo sucintas. Para crear el corpus, usamos un Reconocidor de Entidades Nombradas (NER) para identificar las entidades dentro de un documento original, sus resúmenes asociados y documentos de destino. Después, estas entidades, junto con párrafos similares en los documentos de destino, se utilizan para falsificar documentos sospechosos y documentos plagiados. El corpus fue probado en competencia de plagio.
Research Gate
2017-09
Artículo
Acta Polytechnica Hungarica
Inglés
Bibliotecarios
Investigadores
Público en general
OTRAS
Versión publicada
publishedVersion - Versión publicada
Appears in Collections:Artículos

Upload archives