Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
La minería de textos está compuesta por técnicas que permiten descubrir patrones en un conjunto grande de documentos. El primer paso de este análisis consiste en el procesamiento de los textos originales a fin de convertirlos en una matriz de términos de documentos, previa creación y limpieza del co...
Autor principal: | |
---|---|
Formato: | Objeto de conferencia Resumen |
Lenguaje: | Español |
Publicado: |
2018
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/72761 http://47jaiio.sadio.org.ar/sites/default/files/LatinR_46.pdf |
Aporte de: |
id |
I19-R120-10915-72761 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas Política minería de texto Perú modelamiento de temas redes sociales corpus |
spellingShingle |
Ciencias Informáticas Política minería de texto Perú modelamiento de temas redes sociales corpus Gamboa Unsihuay, Jesús Eduardo Topic modeling en datos de Twitter: una aplicación en el contexto político peruano |
topic_facet |
Ciencias Informáticas Política minería de texto Perú modelamiento de temas redes sociales corpus |
description |
La minería de textos está compuesta por técnicas que permiten descubrir patrones en un conjunto grande de documentos. El primer paso de este análisis consiste en el procesamiento de los textos originales a fin de convertirlos en una matriz de términos de documentos, previa creación y limpieza del corpus; este paso puede ser desarrollado empleando el paquete tm. La siguiente etapa consiste en aplicar una técnica en particular: en esta investigación se presenta y aplica el modelamiento de temas, más conocido como Topic Modeling, el cual permite identificar los asuntos de los cuales trata un documento y se construye en base a dos principios: cada documento está estructurado según una mixtura de temas y cada tema es explicado mediante una mixtura de palabras. Para ello, emplea el modelo bayesiano de Alocación Latente de Dirichlet cuyos parámetros no pueden ser estimados analíticamente sino mediante el algoritmo EM con inferencia variacional o algoritmos MCMC, siendo posible fijar el número de temas de antemano u optimizar dicha cantidad; para esta tarea se hace uso de los paquetes topicmodels y LDAvis. |
format |
Objeto de conferencia Resumen |
author |
Gamboa Unsihuay, Jesús Eduardo |
author_facet |
Gamboa Unsihuay, Jesús Eduardo |
author_sort |
Gamboa Unsihuay, Jesús Eduardo |
title |
Topic modeling en datos de Twitter: una aplicación en el contexto político peruano |
title_short |
Topic modeling en datos de Twitter: una aplicación en el contexto político peruano |
title_full |
Topic modeling en datos de Twitter: una aplicación en el contexto político peruano |
title_fullStr |
Topic modeling en datos de Twitter: una aplicación en el contexto político peruano |
title_full_unstemmed |
Topic modeling en datos de Twitter: una aplicación en el contexto político peruano |
title_sort |
topic modeling en datos de twitter: una aplicación en el contexto político peruano |
publishDate |
2018 |
url |
http://sedici.unlp.edu.ar/handle/10915/72761 http://47jaiio.sadio.org.ar/sites/default/files/LatinR_46.pdf |
work_keys_str_mv |
AT gamboaunsihuayjesuseduardo topicmodelingendatosdetwitterunaaplicacionenelcontextopoliticoperuano |
bdutipo_str |
Repositorios |
_version_ |
1764820483144941571 |