Por favor, use este identificador para citar o enlazar este ítem:
http://infotec.repositorioinstitucional.mx/jspui/handle/1027/300
Automatic Generation of Summary Obfuscation Corpus for Plagiarism Detection | |
SABINO MIRANDA JIMENEZ Efstathios Stamatatos | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Tecnologías de la Información y Comunicación Lingüística aplicada Sistemas de detección de plagio | |
En este artículo, describimos un enfoque para crear un corpus de ofuscación de resumen para la tarea de detección de plagio. Nuestro método se basa en información de las Conferencias de comprensión de documentos relacionadas con los años 2001 y 2006, para el idioma inglés. En general, un resumen no atribuido utilizado en el documento de otra persona se considera un tipo de plagio porque las ideas principales del autor siguen siendo sucintas. Para crear el corpus, usamos un Reconocidor de Entidades Nombradas (NER) para identificar las entidades dentro de un documento original, sus resúmenes asociados y documentos de destino. Después, estas entidades, junto con párrafos similares en los documentos de destino, se utilizan para falsificar documentos sospechosos y documentos plagiados. El corpus fue probado en competencia de plagio. | |
Research Gate | |
2017-09 | |
Artículo | |
Acta Polytechnica Hungarica | |
Inglés | |
Bibliotecarios Investigadores Público en general | |
OTRAS | |
Versión publicada | |
publishedVersion - Versión publicada | |
Aparece en las colecciones: | Artículos |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
Automatic Generation of Summary Obfuscation Corpus-2-15.pdf | 481.07 kB | Adobe PDF | Visualizar/Abrir |