Predicción de la respuesta en un sistema de búsqueda de respuesta semántico

En este articulo se describe un primer prototipo que se ha desarrollado para la tarea de Predicción de la Categoría planteada en el desafío SMART. Este problema se puede plantear como una tarea de clasificación multiclase, pues toma preguntas en lenguaje natural y devuelve la categoría (resource, li...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Oyarzun, Matías, Roger, Sandra
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/149629
Aporte de:
Descripción
Sumario:En este articulo se describe un primer prototipo que se ha desarrollado para la tarea de Predicción de la Categoría planteada en el desafío SMART. Este problema se puede plantear como una tarea de clasificación multiclase, pues toma preguntas en lenguaje natural y devuelve la categoría (resource, literal, boolean) a la que pertenecen. Para el entrenamiento, se utilizaron los datasets de DBPedia y Wikidata de los SMART 2020 y 2021. En este prototipo, se entrenaron 4 modelos de aprendizaje automático con distintas combinaciones de los datasets para hallar el más preciso. El mejor modelo, obtuvo una precisión del 97, 2% y 96,8% para los datasets de DBpedia y Wikidata, respectivamente. En ambos casos, se utilizó el clasificador Support-Vector Machines (SVM). Posteriormente, se busca también la construcción de un modelo para la tarea de Predicción del Tipo de Respuesta. Esto permitirá, finalmente, la implementación de un Sistema de Búsqueda de Respuestas eficiente.