Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia

El estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnic...

Descripción completa

Detalles Bibliográficos
Autor principal: Iguaran Fernández, Juan José
Otros Autores: Pérez, Juan Manuel
Formato: Tesis de maestría publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2023
Materias:
NLP
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n7536_IguaranFernandez
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7536_IguaranFernandez_oai
Aporte de:
id I28-R145-tesis_n7536_IguaranFernandez_oai
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
spellingShingle BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
Iguaran Fernández, Juan José
Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
topic_facet BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
description El estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnicas, la detección de emociones en el texto es especialmente relevante, ya que permite identificar la respuesta subjetiva de las personas ante los distintos eventos sociales presentados. Los modelos de lenguaje basados en redes neuronales, como los Transformers y específicamente BERT, han reemplazado las técnicas tradicionales de NLP debido a su capacidad para capturar el sentido y las relaciones entre las palabras en el texto. Sin embargo, en español hay pocos estudios de detección de emociones en redes sociales y ninguno que utilice modelos de lenguaje basados en Transformers en un contexto político. El objetivo del trabajo fue utilizar modelos basados en BERT para detectar emociones en Twitter durante las elecciones presidenciales de Colombia en 2022, etiquetando manualmente un conjunto de tweets y realizando experimentos de clasificación con modelos pre-entrenados en español. Los resultados de predicción de los modelos sirvieron para analizar las respuestas emocionales de los usuarios, asociando los tweets a sectores políticos, así como la variación temporal. Se encontró una mayor presencia de las emociones asco y alegría en los tweets etiquetados manualmente, lo que resultó en un mejor rendimiento de los modelos en tweets etiquetados con estas emociones. Además, el modelo RoBERTuito se destacó en su desempeño en todas las emociones debido a su pre entrenamiento específico para tweets en español. También se observó que los tweets asociados a la derecha expresaba más asco, mientras que aquellos asociados a la izquierda mostraban más alegría, y que los días con eventos políticos relevantes generaban más etiquetas emocionales.
author2 Pérez, Juan Manuel
author_facet Pérez, Juan Manuel
Iguaran Fernández, Juan José
format Tesis de maestría
Tesis de maestría
publishedVersion
author Iguaran Fernández, Juan José
author_sort Iguaran Fernández, Juan José
title Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_short Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_full Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_fullStr Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_full_unstemmed Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_sort identificación de emociones en twitter durante el proceso electoral de 2022 en colombia
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2023
url https://hdl.handle.net/20.500.12110/tesis_n7536_IguaranFernandez
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7536_IguaranFernandez_oai
work_keys_str_mv AT iguaranfernandezjuanjose identificaciondeemocionesentwitterduranteelprocesoelectoralde2022encolombia
AT iguaranfernandezjuanjose emotionidentificationontwitterduringthe2022electoralprocessincolombia
_version_ 1824354433576730624
spelling I28-R145-tesis_n7536_IguaranFernandez_oai2024-12-06 Pérez, Juan Manuel Iguaran Fernández, Juan José 2023-11-28 El estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnicas, la detección de emociones en el texto es especialmente relevante, ya que permite identificar la respuesta subjetiva de las personas ante los distintos eventos sociales presentados. Los modelos de lenguaje basados en redes neuronales, como los Transformers y específicamente BERT, han reemplazado las técnicas tradicionales de NLP debido a su capacidad para capturar el sentido y las relaciones entre las palabras en el texto. Sin embargo, en español hay pocos estudios de detección de emociones en redes sociales y ninguno que utilice modelos de lenguaje basados en Transformers en un contexto político. El objetivo del trabajo fue utilizar modelos basados en BERT para detectar emociones en Twitter durante las elecciones presidenciales de Colombia en 2022, etiquetando manualmente un conjunto de tweets y realizando experimentos de clasificación con modelos pre-entrenados en español. Los resultados de predicción de los modelos sirvieron para analizar las respuestas emocionales de los usuarios, asociando los tweets a sectores políticos, así como la variación temporal. Se encontró una mayor presencia de las emociones asco y alegría en los tweets etiquetados manualmente, lo que resultó en un mejor rendimiento de los modelos en tweets etiquetados con estas emociones. Además, el modelo RoBERTuito se destacó en su desempeño en todas las emociones debido a su pre entrenamiento específico para tweets en español. También se observó que los tweets asociados a la derecha expresaba más asco, mientras que aquellos asociados a la izquierda mostraban más alegría, y que los días con eventos políticos relevantes generaban más etiquetas emocionales. The study of Twitter as a means for analyzing social phenomena through natural language processing (NLP) techniques has generated great interest in recent years due to the availability of large amounts of data in a relatively spontaneous environment. Within these techniques, emotion detection in text is particularly relevant as it allows for identifying the subjective response of individuals to different social events presented. Language models based on neural networks, such as Transformers and specifically BERT, have replaced traditional NLP techniques due to their ability to capture the meaning and relationships between words in text. However, there are few studies on emotion detection in Spanish social networks and none that use language models based on Transformers in a political context. The objective of the study was to use BERT-based models to detect emotions on Twitter during the 2022 Colombian presidential elections, manually labeling a set of tweets and conducting classification experiments with pre-trained models in Spanish. The prediction results of the models were used to analyze users’ emotional responses, associating tweets with political sectors as well as temporal variation. A higher presence of emotions such as disgust and joy was found in manually labeled tweets, resulting in better model performance on tweets labeled with these emotions. Additionally, the RoBERTuito model stood out in its performance on all emotions due to its specific pre-training for Spanish tweets. It was also observed that tweets associated with the right expressed more disgust, while those associated with the left showed more joy, and that days with relevant political events generated more emotional labels. Fil: Iguaran Fernández, Juan José. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n7536_IguaranFernandez spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar BERT NLP COLOMBIA ELECCIONES DETECCION DE EMOCIONES BERT NLP COLOMBIA ELECTIONS EMOTION IDENTIFICATION Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia Emotion identification on twitter during the 2022 electoral process in Colombia info:eu-repo/semantics/masterThesis info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7536_IguaranFernandez_oai