Serrano López, EstefaniaGarcía Blas, Francisco JavierCarretero Pérez, JesúsAbella García, Mónica2022-01-182022-01-182016-09-16Serrano, E., García Blás, J., Carretero, J., Abella, M. (2'016). Propuesta arquitectónica para la ejecución de tareas en Apache Spark para entornos heterogéneos. En Actas jornadas SARTECO 2016 (299-304). Universidad de Salamanca978-84-9012-626-4https://hdl.handle.net/10016/33897Las desventajas presentes en las plataformas de computación actuales y la fácil migración a la computación en la nube, han logrado que cada vez más aplicaciones científicas se adapten a los distintos frameworks de computación distribuida basadas en flujo de tareas. Sin embargo, muchas de ellas ya han sido optimizadas para su ejecución en aceleradores tales como GPUs. En este trabajo se presenta una arquitectura que facilita la ejecuión de aplicaciones tradicionalmente basadas en entornos HPC al nuevo paradigma de computación Big Data. Además, se demuestra cómo gracias a una mayor capacidad de memoria, el reparto automático de tareas y a la mayor potencia de cálculo de los sistemas heterogéneos se puede converger a un nuevo modelo de ejecución altamente distribuido. En ese trabajo se presenta un estudio de viabilidad de esta propueta mediante la utilización de GPUs dentro de la infraestructura de cómputo Spark. Esta arquitectura será evaluada a través de una aplicación de tratamiento de imagen médica. Los resultados demuestran que aunque nuestra arquitectura sobre un nodo no produce resultados absolutos mejores que la aplicación original, según se aumenta el número de GPUs y por lo tanto la ocupación de estas influye más la aplicación basada en Spark se acerca al rendimiento del simulador original. Finalmente, realizamos un estudio de la ocupación de las GPUs empleadas para las distintas políticas propuestas, demostrando que al tener en cuenta las características dinámicas de la GPUs (número de tareas en ejecución) podemos tener una mayor ganancia de rendimiento.spa© Ediciones Universidad de Salamanca, 2016sparkimagen médicapyCUDAGPUPropuesta arquitectónica para la ejecución de tareas en Apache Spark para entornos heterogéneosconference outputInformáticaopen access299304Actas Jornadas SARTECO 2016CC/0000024435