Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse

El presente trabajo tiene como objetivo desarrollar un estudio comparativo entre Apache Flink y Apache Spark, partiendo de la medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse. Para ello, la presente investigación se sustenta en el paradigma cuantitativo de t...

Descripción completa

Detalles Bibliográficos
Autor principal: Jaime, Rubén Alejandro
Otros Autores: Hasperué, Waldo
Formato: Tesis Trabajo de especializacion
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/126780
Aporte de:
id I19-R120-10915-126780
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Apache Spark
Big Data
Apache Flink
spellingShingle Ciencias Informáticas
Apache Spark
Big Data
Apache Flink
Jaime, Rubén Alejandro
Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
topic_facet Ciencias Informáticas
Apache Spark
Big Data
Apache Flink
description El presente trabajo tiene como objetivo desarrollar un estudio comparativo entre Apache Flink y Apache Spark, partiendo de la medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse. Para ello, la presente investigación se sustenta en el paradigma cuantitativo de tipo comparativo. Las técnicas de investigación son el análisis de documento y análisis de contenido. Los resultados develan que de tratarse de un proyecto que requiere de amplio volumen de procesamiento de datos, la opción es emplear Apache Spark, dada la facilidad para codificar y realizar numerosas tareas; adicionalmente se pudo develar que este framework dispone de abundante información y profesionales con competencias y experiencia para trabajar en este sistema. Por su parte Apache Flink se distingue por ser un framework diseñado para procesamiento de streaming, no cuenta con mucha información de fácil acceso y existe un número reducido de especialistas con dominio y experiencia en este campo; siendo dos desventajas para su selección. Además, es importante señalar que ambos framework son eficientes en la ejecución de tareas, aunque en cuanto a versatilidad se distingue Apache Spark, por cuanto que permite emplear su potencial en diversos lenguajes de programación. Asimismo, es de destacar que a través de la experimentación los mejores tiempos obtenidos para ambas herramientas se logran al modificar el storage y cuando se lo trabaja en un formato columnar.
author2 Hasperué, Waldo
author_facet Hasperué, Waldo
Jaime, Rubén Alejandro
format Tesis
Trabajo de especializacion
author Jaime, Rubén Alejandro
author_sort Jaime, Rubén Alejandro
title Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
title_short Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
title_full Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
title_fullStr Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
title_full_unstemmed Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
title_sort estudio comparativo entre apache flink y apache spark : medición de la performance en la ejecución de algoritmos tradicionales de un datawarehouse
publishDate 2021
url http://sedici.unlp.edu.ar/handle/10915/126780
work_keys_str_mv AT jaimerubenalejandro estudiocomparativoentreapacheflinkyapachesparkmediciondelaperformanceenlaejecuciondealgoritmostradicionalesdeundatawarehouse
bdutipo_str Repositorios
_version_ 1764820451181199361