RT Dissertation/Thesis T1 Novel usage of deep learning and high-performance computing in long-baseline neutrino oscillation experiments A1 Alonso Monsalve, Saúl AB Deep-learning methods are playing a crucial role in numerous scientific and industrialapplications. Over the past two decades, these techniques have helped in the collection,reconstruction, and analysis of large data samples in particle physics experiments. Themain topic of this PhD research is the study of deep-learning techniques in long-baselineneutrino oscillation experiments. Neutrinos are mysterious light elementary particles,and their investigation is essential to shed light on some of the remaining open questionsin physics. The work presented here describes an algorithm based on a convolutionalneural network developed to provide highly accurate and efficient selections of electronneutrino and muon neutrino interactions in the Deep Underground Neutrino Experiment(DUNE). With this algorithm, the electron neutrino (antineutrino) selection efficiencypeaks at 90% (94%) and exceeds 85% (90%) for reconstructed neutrino energies between2-5 GeV. The selection efficiency for muon neutrino (antineutrino) interactions is foundto have a maximum of 96% (97%) and exceeds 90% (95%) efficiency for reconstructedneutrino energies above 2 GeV. When considering all electron neutrino and antineutrinointeractions as signal (both those appearing from oscillations and those intrinsic tothe beam), a selection purity of 90% is achieved. These event selections are criticalto maximise the sensitivity of the experiment to CP-violating effects, key to furtherunderstand the matter-antimatter asymmetry of the Universe.In high-energy physics experiments, deep learning has also been explored for producingfast simulations and physically-motivated manipulations of simulated images. Some ofthose simulations, such as the light production and detection, are very computationallyexpensive and require novel methods to produce the necessary samples while controllingthe varied underlying physics model parameters. To do so, we invented the model-assistedgenerative adversarial network (MAGAN), first validated on simple generic case studiesand then successfully applied to the DUNE photon-detector simulation.Moreover, we also developed graph neural networks for 3D-voxel classification ofambiguities and optical crosstalk for a different particle physics experiment, most preciselyfor the proposed SuperFGD. This novel 3D-granular plastic-scintillator neutrino detectorwill be used to upgrade the near detector of the T2K neutrino oscillation experiment, and our method reports efficiencies and purities of 94-96% per event in the classificationof particle track voxels.Due to the growth and complexity of deep neural networks, researchers have beeninvestigating techniques to train those networks in a more computationally-efficient way.Many efforts have been made by the community to optimise deep-learning models byparallelising or distributing their training computation across multiple devices. In thisthesis, we study an approach based on data locality for those neural networks that cannotbenefit from scaling their computation due to a significant bottleneck in the data I/O.The research also includes a detailed study on the performance of deep neural networkson hardware accelerator boards. AB Los métodos de aprendizaje profundo son cada vez más utilizados en numerosas aplicacionescientíficas e industriales hoy en día. Durante las dos últimas décadas, estastécnicas se han empleado en la recolección, reconstrucción y análisis de la gran cantidadde datos generados por experimentos de física de partículas. El tema principal de estatesis doctoral es el uso de estos modelos de aprendizaje profundo en experimentos defísica de neutrinos, en concreto en los experimentos de larga distancia DUNE y T2K. Losneutrinos, partículas fundamentales neutras, de las más ligeras del Universo, pueden serclave para explicar algunas de las cuestiones todavía sin resolver en física fundamental.Entre las diferentes contribuciones que esta tesis ha hecho a su estudio, cabe destacar eldesarrollo de un algoritmo basado en una red de neuronas convolucional para seleccionarcon gran eficiencia y precisión las interacciones de neutrinos electrónicos y muónicos enel Deep Underground Neutrino Experiment (DUNE). La eficiencia de selección obtenidapara neutrinos (antineutrinos) electrónicos alcanza un máximo del 90% (94%) y supera el85% (90%) para neutrinos con energías reconstruidas en el rango 2-5 GeV. La selección deneutrinos (antineutrinos) muónicos tiene una eficiencia máxima del 96% (97%) y excedeel 90% (95%) para neutrinos con energías reconstruidas de más de 2 GeV. Considerandocomo señal todas las interacciones de neutrinos y antineutrinos electrónicos (procedentestanto de oscilaciones como intrínsecos en el haz inicial), se logra una pureza en la seleccióndel 90%. Dichas selecciones de eventos son fundamentales para maximizar la sensibilidaddel experimento a los efectos de violación de CP, necesarios para entender la asimetríaentre materia y antimateria en el universo.Por otro lado, también se ha explorado el uso de métodos de aprendizaje profundoen otras tareas en experimentos de altas energías, como por ejemplo el desarrollo deredes generativas adversarias para producir simulaciones rápidas y manipulaciones de lasimágenes simuladas. Tales simulaciones, como en el caso de la producción y detección deluz procedente de las interacciones de neutrinos, son computacionalmente muy costosasy requieren métodos nuevos para producir los datos necesarios controlando la variaciónde los parámetros del modelo físico que los describe. Para ello, hemos propuesto unnuevo tipo de red generativa adversaria asistida por modelos (MAGAN, del inglés modelassistedgenerative adversarial networks), validando su funcionamiento en casos simples y genéricos primero, para después aplicarla con éxito a la simulación de detección defotones en DUNE.Además, en esta tesis se ha estudiado también el uso de redes neuronales aplicadas agrafos para la clasificación tridimensional de vóxeles evitando ambigüedades y diafoníaóptica en el SuperFGD, un nuevo detector de neutrinos de centelleo en plástico, granular entres dimensiones, que se utilizará en la futura mejora del detector cercano del experimentode oscilación de neutrinos T2K, donde nuestro método alcanza eficiencias y purezas del94-96% por evento en la clasificación de vóxeles producidos por trazas de partículas.Debido a la expansión y complejidad de las redes neuronales profundas, se estáninvestigando diferentes técnicas para entrenar estas redes de manera más eficiente. Lacomunidad ha llevado a cabo intentos para optimizar los modelos de aprendizaje profundomediante paralelización y distribución del cómputo de entrenamiento en múltiples dispositivos.En esta tesis hemos estudiado esta optimización mediante un enfoque basado en lalocalidad de datos para aquellas redes de neuronas que no pueden beneficiarse de escalarsu cómputo debido a un embotellamiento en la E/S de los datos. Nuestra investigacióntambién incluye un estudio detallado sobre el rendimiento de redes neuronales profundasen placas de aceleración de hardware. YR 2021 FD 2021-02 LK https://hdl.handle.net/10016/32403 UL https://hdl.handle.net/10016/32403 LA eng NO Mención Internacional en el título de doctor NO This PhD dissertation has been mostly developedat CERN, supported by the CERN Doctoral StudentProgramme (from February 1, 2018 to January31, 2021).This PhD dissertation has been partially supportedby the Spanish Ministry of Education,Culture and Sports under an FPU fellowship withidentifier FPU16/01957 (from October 1, 2017 toJanuary 31, 2018). DS e-Archivo RD 18 jul. 2024