Tres anotadores igualmente experimentados proporcionaron anotaciones a nivel de aspectos a un subconjunto de 300 comentarios seleccionados al azar de INEX Amazon/LibraryThing Book Corpus*. El conjunto de datos completo contiene 2,7 millones de archivos xml, cada uno combinado con los metadatos de los libros de Amazon y LibraryThing. Cada descripción contiene metadatos formales (título del libro, autor, editor, etc.), metadatos del tema (encabezamientos de materia de la biblioteca y códigos de clasificación) y contenido generado por el usuario (calificaciones de los usuarios, reseñas y etiquetas).
Las reseñas seleccionadas para este conjunto de datos se encuentran anotados a nivel de frase con información sobre los aspectos y categorías y el sentimiento asociado.
Usos Permitidos:
1. La información puede únicamente ser utilizada con fines investigadores y de desarrollo de sistemas de procesamiento de lenguaje natural, recuperación de información o sistemas de adquisición de conocimiento.
2. Los resúmenes, análisis e interpretaciones de las características lingüísticas de la información pueden derivarse y publicarse, siempre que no sea posible reconstruir la información de estos resúmenes.
3. Se podrán mostrar pequeños extractos de la información en un contexto científico o técnico, con el único fin de describir la investigación y el desarrollo y cuestiones relacionadas. Cualquiera de estos usos no infringirá los derechos de ningún tercero incluyendo, pero no limitando, a los autores y editores de los extractos.
Si usa este conjunto de datos, se ruega mencione la siguiente cita: Tamara Álvarez-López, Milagros Fernández-Gavilanes, Enrique Costa-Montenegro, Jonathan Juncal-Martínez, Silvia García-Méndez and Patrice Bellot: A Book Reviews Dataset for Aspect Based Sentiment Analysis. To be published in: Proceedings of the 8th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics (LTC 2017).
* Koolen, Marijn, Toine Bogers, Maria Gäde, Mark Hall, Iris Hendrickx, Hugo Huurdeman, Jaap Kamps, Mette Skov, Suzan Verberne, and David Walsh, 2016. Overview of the clef 2016 social book search lab. In International Conference of the Cross-Language Evaluation Forum for European Languages.