Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos

El problema de la clasificación de unidades en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir este propósito. Este trabajo se propone la clasificación de textos científicos y no científicos comparando las técnicas de...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Beltrán, Celina
Formato: article artículo publishedVersion
Lenguaje:Español
Publicado: Grupo Infosur 2019
Materias:
Acceso en línea:http://hdl.handle.net/2133/14287
http://hdl.handle.net/2133/14287
Aporte de:
id I15-R121-2133-14287
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic logística
árboles
clasificación
multivariado
spellingShingle logística
árboles
clasificación
multivariado
Beltrán, Celina
Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos
topic_facet logística
árboles
clasificación
multivariado
description El problema de la clasificación de unidades en grupos o poblaciones conocidas es de gran interés en estadística, por esta razón se han desarrollado varias técnicas para cumplir este propósito. Este trabajo se propone la clasificación de textos científicos y no científicos comparando las técnicas de Árboles de Clasificación (AC) y Regresión logística (RL). Los textos científicos corresponden a resúmenes de publicaciones en revistas científicas y actas de congresos de distintas disciplinas y los textos no científicos corresponden a noticias periodísticas de interés general publicadas en páginas web de periódicos argentinos. La información resultante del análisis morfológico de dichos textos es utilizada como variables explicativas en las técnicas multivariadas aplicadas en este trabajo. El desempeño de las técnicas fue medido con la tasa de mala clasificación (TMC), la precisión (PR) y la cobertura (CO), calculadas sobre una muestra de textos no incluidos en la estimación del modelo y construcción del árbol. El árbol de clasificación presentó una TMC inferior a la del modelo logístico logrando clasificar con mayor precisión los textos científicos. Para el AC la TMC, PR y CO resultaron 4%, 84% y 96% para los textos científicos y 28%, 92% y 72% para los textos no científicos, respectivamente. Para el modelo de RL la TMC, PR y CO resultaron 14%, 83% y 86% para los textos científicos y 26%, 77% y 74% para los textos no científicos, respectivamente.
format article
artículo
publishedVersion
author Beltrán, Celina
author_facet Beltrán, Celina
author_sort Beltrán, Celina
title Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos
title_short Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos
title_full Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos
title_fullStr Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos
title_full_unstemmed Técnicas estadísticas de clasificación. Una aplicación en la clasificación de textos según el género: Textos Científicos y Textos No Científicos
title_sort técnicas estadísticas de clasificación. una aplicación en la clasificación de textos según el género: textos científicos y textos no científicos
publisher Grupo Infosur
publishDate 2019
url http://hdl.handle.net/2133/14287
http://hdl.handle.net/2133/14287
work_keys_str_mv AT beltrancelina tecnicasestadisticasdeclasificacionunaaplicacionenlaclasificaciondetextossegunelgenerotextoscientificosytextosnocientificos
bdutipo_str Repositorios
_version_ 1764820408355258369