Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse
El presente trabajo tiene como objetivo desarrollar un estudio comparativo entre Apache Flink y Apache Spark, partiendo de la medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse. Para ello, la presente investigación se sustenta en el paradigma cuantitativo de t...
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis Trabajo de especializacion |
Lenguaje: | Español |
Publicado: |
2021
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/126780 |
Aporte de: |
id |
I19-R120-10915-126780 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas Apache Spark Big Data Apache Flink |
spellingShingle |
Ciencias Informáticas Apache Spark Big Data Apache Flink Jaime, Rubén Alejandro Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse |
topic_facet |
Ciencias Informáticas Apache Spark Big Data Apache Flink |
description |
El presente trabajo tiene como objetivo desarrollar un estudio comparativo entre Apache Flink y Apache Spark, partiendo de la medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse. Para ello, la presente investigación se sustenta en el paradigma cuantitativo de tipo comparativo. Las técnicas de investigación son el análisis de documento y análisis de contenido. Los resultados develan que de tratarse de un proyecto que requiere de amplio volumen de procesamiento de datos, la opción es emplear Apache Spark, dada la facilidad para codificar y realizar numerosas tareas; adicionalmente se pudo develar que este framework dispone de abundante información y profesionales con competencias y experiencia para trabajar en este sistema. Por su parte Apache Flink se distingue por ser un framework diseñado para procesamiento de streaming, no cuenta con mucha información de fácil acceso y existe un número reducido de especialistas con dominio y experiencia en este campo; siendo dos desventajas para su selección. Además, es importante señalar que ambos framework son eficientes en la ejecución de tareas, aunque en cuanto a versatilidad se distingue Apache Spark, por cuanto que permite emplear su potencial en diversos lenguajes de programación. Asimismo, es de destacar que a través de la experimentación los mejores tiempos obtenidos para ambas herramientas se logran al modificar el storage y cuando se lo trabaja en un formato columnar. |
author2 |
Hasperué, Waldo |
author_facet |
Hasperué, Waldo Jaime, Rubén Alejandro |
format |
Tesis Trabajo de especializacion |
author |
Jaime, Rubén Alejandro |
author_sort |
Jaime, Rubén Alejandro |
title |
Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse |
title_short |
Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse |
title_full |
Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse |
title_fullStr |
Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse |
title_full_unstemmed |
Estudio comparativo entre Apache Flink y Apache Spark : Medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse |
title_sort |
estudio comparativo entre apache flink y apache spark : medición de la performance en la ejecución de algoritmos tradicionales de un datawarehouse |
publishDate |
2021 |
url |
http://sedici.unlp.edu.ar/handle/10915/126780 |
work_keys_str_mv |
AT jaimerubenalejandro estudiocomparativoentreapacheflinkyapachesparkmediciondelaperformanceenlaejecuciondealgoritmostradicionalesdeundatawarehouse |
bdutipo_str |
Repositorios |
_version_ |
1764820451181199361 |