RT Generic T1 Sistema recomendador de taxis para Big Data A1 Barata González, Jorge AB Este documento propone un sistema para maximizar los ingresos de los taxistas,recomendando las zonas de la ciudad con mayor frecuencia de viajes y más cercanas a laposición del taxista en ese momento.Analizando 10M de trazas de viajes realizados por los Taxis Amarillos de Nueva Yorkcon un cluster Spark, encontramos correlaciones entre los beneficios y el tiempo,distancia y número de pasajeros. También se encuentran que los lugares más frecuenciade viajes cambian cada hora y cada día.Mediante clustering, el sistema computa las agrupaciones más lucrativas para cada hora ydía de la semana, dando una puntuación a cada uno de los grupos basado en lascorrelaciones encontradas. El sistema se ejecuta varias veces sobre un clúster Spark,buscando la configuración más óptima.Los resultados se guardan en una base de datos geoespacial, y puede consultarsemediante una aplicación web introduciendo la hora, día de la semana, y ubicación. Elsistema recomienda las diez ubicaciones más cercanas, ordenadas por beneficio.El sistema puede ser interesante para los Taxistas Amarillos de Nueva York, como unaforma de incrementar los beneficios influyendo en sus desplazamientos de forma directo,libertad que los servicios competidores como Uber y Cabify no ofrecen, ya que losobjetivos de tales taxistas les son fijados por la compañía. AB This document proposes a system to maximize the income of taxi drivers, recommendingthe areas of the city with more frequency of trips and closer to the position of the taxidriver at the time of the query.Analyzing 10M traces of trips made by the New York Yellow Taxis with a Spark cluster,we found correlations between the benefits and the time, distance and number ofpassengers. We also found that more frequent travel places change every hour and everyday.Through clustering, the system computes the most profitable groups for each hour andday of the week, giving a score to each of the groups based on the correlations found. Thesystem runs several times on a Spark cluster, looking for the most optimal configuration.The results are stored in a geospatial database, and can be viewed through a webapplication by entering the time, day of the week, and location. The system recommendsthe top ten closest locations, sorted by profit.The system may be of interest to the Yellow Taxi drivers in New York, as a way toincrease profits by influencing their wandering, something that competing services likeUber and Cabify do not offer, since the objectives of such taxi drivers are fixed by thecompany. YR 2017 FD 2017-09-20 LK https://hdl.handle.net/10016/27164 UL https://hdl.handle.net/10016/27164 LA spa DS e-Archivo RD 1 sept. 2024