Topic modeling en datos de Twitter: una aplicación en el contexto político peruano

La minería de textos está compuesta por técnicas que permiten descubrir patrones en un conjunto grande de documentos. El primer paso de este análisis consiste en el procesamiento de los textos originales a fin de convertirlos en una matriz de términos de documentos, previa creación y limpieza del co...

Descripción completa

Detalles Bibliográficos
Autor principal: Gamboa Unsihuay, Jesús Eduardo
Formato: Objeto de conferencia Resumen
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/72761
http://47jaiio.sadio.org.ar/sites/default/files/LatinR_46.pdf
Aporte de:
id I19-R120-10915-72761
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Política
minería de texto
Perú
modelamiento de temas
redes sociales
corpus
spellingShingle Ciencias Informáticas
Política
minería de texto
Perú
modelamiento de temas
redes sociales
corpus
Gamboa Unsihuay, Jesús Eduardo
Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
topic_facet Ciencias Informáticas
Política
minería de texto
Perú
modelamiento de temas
redes sociales
corpus
description La minería de textos está compuesta por técnicas que permiten descubrir patrones en un conjunto grande de documentos. El primer paso de este análisis consiste en el procesamiento de los textos originales a fin de convertirlos en una matriz de términos de documentos, previa creación y limpieza del corpus; este paso puede ser desarrollado empleando el paquete tm. La siguiente etapa consiste en aplicar una técnica en particular: en esta investigación se presenta y aplica el modelamiento de temas, más conocido como Topic Modeling, el cual permite identificar los asuntos de los cuales trata un documento y se construye en base a dos principios: cada documento está estructurado según una mixtura de temas y cada tema es explicado mediante una mixtura de palabras. Para ello, emplea el modelo bayesiano de Alocación Latente de Dirichlet cuyos parámetros no pueden ser estimados analíticamente sino mediante el algoritmo EM con inferencia variacional o algoritmos MCMC, siendo posible fijar el número de temas de antemano u optimizar dicha cantidad; para esta tarea se hace uso de los paquetes topicmodels y LDAvis.
format Objeto de conferencia
Resumen
author Gamboa Unsihuay, Jesús Eduardo
author_facet Gamboa Unsihuay, Jesús Eduardo
author_sort Gamboa Unsihuay, Jesús Eduardo
title Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
title_short Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
title_full Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
title_fullStr Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
title_full_unstemmed Topic modeling en datos de Twitter: una aplicación en el contexto político peruano
title_sort topic modeling en datos de twitter: una aplicación en el contexto político peruano
publishDate 2018
url http://sedici.unlp.edu.ar/handle/10915/72761
http://47jaiio.sadio.org.ar/sites/default/files/LatinR_46.pdf
work_keys_str_mv AT gamboaunsihuayjesuseduardo topicmodelingendatosdetwitterunaaplicacionenelcontextopoliticoperuano
bdutipo_str Repositorios
_version_ 1764820483144941571