RT Dissertation/Thesis T1 Cardiovascular information for improving biometric recognition A1 Tirado Martín, Paloma AB The improvements of the last two decades in data modeling and computing have leadto new biometric modalities. The Electrocardiogram (ECG) modality is part of them, andhas been mainly researched by using public databases related to medical training. Despiteof being useful for initial approaches, they are not representative of a real biometricenvironment. In addition, publishing and creating a new database is none trivial dueto human resources and data protection laws.The main goal of this thesis is to successfully use ECG as a biometric signal whilegetting closer to the real case scenario. Every experiment considers low computationalcalculations and transformations to help in potential portability. The core experimentsin this work come from a private database with different positions, time and heart ratescenarios. An initial segmentation evaluation is achieved with the help of fiducial pointdetection which determines the QRS selection as the input data for all the experiments.The approach of training a model per user (open-set) is tested with different machinelearning algorithms, only getting an acceptable result with Gaussian Mixture Models(GMM). However, the concept of training all users in one model (closed-set) showsmore potential with Linear Discriminant Analysis (LDA), whose results were improvedin 40%. The results with LDA are also tested as a multi-modality technique, decreasingthe Equal Error Rate (EER) of fingerprint verification in up to 70.64% with score fusion,and reaching 0% in Protection Attack Detection (PAD).The Multilayer Perceptron (MLP) algorithm enhances these results in verificationwhile applying the first differentiation to the signal. The network optimization is achievedwith EER as an observation metric, and improves the results of LDA in 22% for the worstcase scenario, and decreases the EER to 0% in the best case. Complexity is added creatinga Convolutional Neural Network (CNN) and Long-Short Term Memory (LSTM) basednetwork, BioECG. The tuning process is achieved without extra feature transformationand is evaluated through accuracy, aiming for good identification. The inclusion of asecond day of enrollment in improves results from MLP, reaching the overall lowestresults of 0.009%–1.352% in EER.Throughout the use of good quality signals, position changes did not noticeably impactthe verification. In addition, collecting data in a different day or in a different hour didnot clearly affect the performance. Moreover, modifying the verification process based onattempts, improves the overall results, up to reach a 0% EER when applying BioECG.Finally, to get closer to a real scenario, a smartband prototype is used to collect newdatabases. A private database with limited scenarios but controlled data, and anotherlocal database with a wider range of scenarios and days, and with a more relaxed use ofthe device. Applying the concepts of first differentiation and MLP, these signals required the Stationary Wavelet Transform (SWT) and new fiducial point detection to improvetheir results. The first database gave subtle chances of being used in identification withup to 78.2% accuracy, but the latter was completely discarded for this purpose. Theserealistic experiments show the impact of a low fidelity sensor, even considering the samemodifications in previous successful experiments with better quality data, reaching up to13.530% EER. In the second database, results reach a range of 0.068%–31.669% EER.This type of sensor is affected by heart rate changes, but also by position variations, givenits sensitivity to movement. AB Las mejoras en modelado de datos y computación de las últimas dos décadas,han llevado a la creación de nuevas modalidades biométricas. La modalidad deelectrocardiograma (ECG) es una de ellas, la cual se ha investigado usando bases de datospúblicas que fueron creadas para entrenamiento de profesional médico. Aunque estosdatos han sido útiles para los estados iniciales de la modalidad, no son representativos deun entorno biométrico real. Además, publicar y crear bases de datos nuevas son problemasno triviales debido a los recursos humanos y las leyes de protección de datos.El principal objetivo de esta tesis es usar exitosamente datos de ECG como señalesbiométricas a la vez que nos acercamos a un escenario realista. Cada experimentoconsidera cálculos y transformadas de bajo coste computacional para ayudar en supotencial uso en aparatos móviles. Los principales experimentos de este trabajo seproducen con una base de datos privada con diferentes escenarios en términos de postura,tiempo y frecuencia cardíaca. Con ella se evalúan las diferentes seleccións del complejoQRS mediante detección de puntos fiduciales, lo cual servirá como datos de entrada parael resto de experimentos.El enfoque de entrenar un modelo por usuario (open-set) se prueba con diferentesalgoritmos de aprendizaje máquina (machine learning), obteniendo resultados aceptablesúnicamente mediante el uso de modelos de mezcla de Gaussianas (Gaussian MixtureModels, GMM). Sin embargo, el concepto de entrenar un modelo con todos los usuarios(closed-set) demuestra mayor potencial con Linear Discriminant Analysis (Análisis deDiscriminante Lineal, LDA), cuyos resultados mejoran en un 40%. Los resultados deLDA también se utilizan como técnica multi-modal, disminuyendo la Equal Error Rate(Tasa de Igual Error, EER) de la verificación mediante huella en hasta un 70.64% confusión de puntuación, y llegando a un sistema con un 0% de EER en Detección de Ataquesde Presentación (Presentation Attack Detection, PAD).El algoritmo de Perceptrón Multicapa (Multilayer Perceptron, MLP) mejora losresultados previos en verificación aplicando la primera derivada a la señal. Laoptimización de la red se consigue en base a su EER, mejora la de LDA en hasta un 22%en el peor caso, y la lleva hasta un 0% en el mejor caso. Se añade complejidad creando unared neural convolucional (Convolutional Neural Network, CNN) con una red de memoriaa largo-corto plazo (Long-Short Term Memory, LSTM), llamada BioECG. El proceso deajuste de hiperparámetros se lleva acabo sin transformaciones y se evalúa observando laaccuracy (precisión), para mejorar la identificación. Sin embargo, incluir un segundo díade registro (enrollment) con BioECG, estos resultados mejoran hasta un 74% para el peorcaso, llegando a los resultados más bajos hasta el momento con 0.009%–1.352% en laEER.Durante el uso de señales de buena calidad, los cambios de postura no afectaron notablemente a la verificación. Además, adquirir los datos en días u horas diferentestampoco afectó claramente a los resultados. Asimismo, modificar el proceso deverificación en base a intentos también produce mejoría en todos los resultados, hastael punto de llegar a un 0% de EER cuando se aplica BioECG.Finalmente, para acercarnos al caso más realista, se usa un prototipo de pulsera paracapturar nuevas bases de datos. Una base de datos privada con escenarios limitados perodatos más controlados, y otra base de datos local con más espectro de escenarios y días yun uso del dispositivo más relajado. Para estos datos se aplican los conceptos de primeradiferenciación en MLP, cuyas señales requieren la Transformada de Wavelet Estacionaria(Stationary Wavelet Transform, SWT) y un detector de puntos fiduciales para mejorar losresultados. La primera base de datos da opciones a ser usada para identificación con unmáximo de precisión del 78.2%, pero la segunda se descartó completamente para estepropósito. Estos experimentos más realistas demuestran el impact de tener un sensor debaja fidelidad, incluso considerando las mismas modificaciones que previamente tuvieronbuenos resultados en datos mejores, llegando a un 13.530% de EER. En la segunda basede datos, los resultados llegan a un rango de 0.068%–31.669% en EER. Este tipo de sensorse ve afectado por las variaciones de frecuencia cardíaca, pero también por el cambio deposición, dado que es más sensible al movimiento. YR 2022 FD 2022 LK https://hdl.handle.net/10016/34914 UL https://hdl.handle.net/10016/34914 LA eng NO Mención Internacional en el título de doctor DS e-Archivo RD 27 jul. 2024