RT Conference Proceedings
T1 Propuesta arquitectónica para la ejecución de tareas en Apache Spark para entornos heterogéneos
A1 Serrano López, Estefania
A1 García Blas, Francisco Javier
A1 Carretero Pérez, Jesús
A1 Abella García, Mónica
AB Las desventajas presentes en las plataformas de computación actuales y la fácil migración a la computación en la nube, han logrado que cada vez más aplicaciones científicas se adapten a los distintos frameworks de computación distribuida basadas en flujo de tareas. Sin embargo, muchas de ellas ya han sido optimizadas para su ejecución en aceleradores tales como GPUs. En este trabajo se presenta una arquitectura que facilita la ejecuión de aplicaciones tradicionalmente basadas en entornos HPC al nuevo paradigma de computación Big Data. Además, se demuestra cómo gracias a una mayor capacidad de memoria, el reparto automático de tareas y a la mayor potencia de cálculo de los sistemas heterogéneos se puede converger a un nuevo modelo de ejecución altamente distribuido. En ese trabajo se presenta un estudio de viabilidad de esta propueta mediante la utilización de GPUs dentro de la infraestructura de cómputo Spark. Esta arquitectura será evaluada a través de una aplicación de tratamiento de imagen médica. Los resultados demuestran que aunque nuestra arquitectura sobre un nodo no produce resultados absolutos mejores que la aplicación original, según se aumenta el número de GPUs y por lo tanto la ocupación de estas influye más la aplicación basada en Spark se acerca al rendimiento del simulador original. Finalmente, realizamos un estudio de la ocupación de las GPUs empleadas para las distintas políticas propuestas, demostrando que al tener en cuenta las características dinámicas de la GPUs (número de tareas en ejecución) podemos tener una mayor ganancia de rendimiento.
PB Universidad de Salamanca
SN 978-84-9012-626-4
YR 2016
FD 2016-09-16
LK https://hdl.handle.net/10016/33897
UL https://hdl.handle.net/10016/33897
LA spa
NO Este trabajo ha sido parcialmente subvencionado por el Ministerio de Economia y Competitividad, bajo el proyecto TIN2013-41350-P, Scalable Data Management Techniques for High-End Computing Systems.
DS e-Archivo
RD 18 jul. 2024