RT Dissertation/Thesis T1 Pathology detection mechanisms through continuous acquisition of biological signals A1 Sánchez Casanova, Jorge AB Pattern identification is a widely known technology, which is used on a daily basisfor both identification and authentication. Examples include biometric identification(fingerprint or facial), number plate recognition or voice recognition.However, when we move into the world of medical diagnostics this changessubstantially. This field applies many of the recent innovations and technologies, butit is more difficult to see cases of pattern recognition applied to diagnostics. In addition,the cases where they do occur are always supervised by a specialist and performed incontrolled environments. This behaviour is expected, as in this field, a false negative(failure to identify pathology when it does exists) can be critical and lead to seriousconsequences for the patient. This can be mitigated by configuring the algorithm to be safeagainst false negatives, however, this will raise the false positive rate, which may increasethe workload of the specialist in the best case scenario or even result in a treatment beinggiven to a patient who does not need it. This means that, in many cases, validation of thealgorithm’s decision by a specialist is necessary, however, there may be cases where thisvalidation is not so essential, or where this first identification can be treated as a guidelineto help the specialist. With this objective in mind, this thesis focuses on the developmentof an algorithm for the identification of lower body pathologies.This identification is carried out by means of the way people walk (gait). People’s gaitdiffers from one person to another, even making biometric identification possible throughits use. however, when the people has a pathology, both physical or psychological, thegait is affected. This alteration generates a common pattern depending on the type ofpathology. However, this thesis focuses exclusively on the identification of physicalpathologies. Another important aspect in this thesis is that the different algorithms arecreated with the idea of portability in mind, avoiding the obligation of the user to carryout the walks with excessive restrictions (both in terms of clothing and location).First, different algorithms are developed using different configurations of smartphonesfor database acquisition. In particular, configurations using 1, 2 and 4 phones areused. The phones are placed on the legs using special holders so that they cannot movefreely. Once all the walks have been captured, the first step is to filter the signals toremove possible noise. The signals are then processed to extract the different gait cycles(corresponding to two steps) that make up the walks. Once the feature extraction processis finished, part of the features are used to train different machine learning algorithms,which are then used to classify the remaining features. However, the evidence obtainedthrough the experiments with the different configurations and algorithms indicates that itis not feasible to perform pathology identification using smartphones. This can be mainlyattributed to three factors: the quality of the signals captured by the phones, the unstablesampling frequency and the lack of synchrony between the phones. Secondly, due to the poor results obtained using smartphones, the capture device ischanged to a professional motion acquisition system. In addition, two types of algorithmare proposed, one based on neural networks and the other based on the algorithms usedpreviously. Firstly, the acquisition of a new database is proposed. To facilitate the captureof the data, a procedure is established, which is proposed to be in an environment offreedom for the user. Once all the data are available, the preprocessing to be carried out issimilar to that applied previously. The signals are filtered to remove noise and the differentgait cycles that make up the walks are extracted. However, as we have information fromseveral sensors and several locations for the capture device, instead of using a commoncut-off frequency, we empirically set a cut-off frequency for each signal and position.Since we already have the data ready, a recurrent neural network is created based on theliterature, so we can have a first approximation to the problem. Given the feasibility ofthe neural network, different experiments are carried out with the aim of improving theperformance of the neural network.Finally, the other algorithm picks up the legacy of what was seen in the first part of thethesis. As before, this algorithm is based on the parameterisation of the gait cycles for itssubsequent use and employs algorithms based on machine learning. Unlike the use of timesignals, by parameterising the cycles, spurious data can be generated. To eliminate thisdata, the dataset undergoes a preparation phase (cleaning and scaling). Once a prepareddataset has been obtained, it is split in two, one part is used to train the algorithms, whichare used to classify the remaining samples. The results of these experiments validatethe feasibility of this algorithm for pathology detection. Next, different experimentsare carried out with the aim of reducing the amount of information needed to identifya pathology, without compromising accuracy. As a result of these experiments, it can beconcluded that it is feasible to detect pathologies using only 2 sensors placed on a leg. AB La identificación de patrones es una tecnología ampliamente conocida, la cual seemplea diariamente tanto para identificación como para autenticación. Algunos ejemplosde ello pueden ser la identificación biométrica (dactilar o facial), el reconocimiento dematrículas o el reconocimiento de voz.Sin embargo, cuando nos movemos al mundo del diagnóstico médico esto cambiasustancialmente. Este campo aplica muchas de las innovaciones y tecnologías recientes,pero es más difícil ver casos de reconocimiento de patrones aplicados al diagnóstico.Además, los casos donde se dan siempre están supervisados por un especialista y serealizan en ambientes controlados. Este comportamiento es algo esperado, ya que, eneste campo, un falso negativo (no identificar la patología cuando esta existe) puedeser crítico y provocar consecuencias graves para el paciente. Esto se puede intentarpaliar, configurando el algoritmo para que sea seguro frente a los falsos negativos, noobstante, esto aumentará la tasa de falsos positivos, lo cual puede aumentar el trabajodel especialista en el mejor de los casos o incluso puede provocar que se suministre untratamiento a un paciente que no lo necesita.Esto hace que, en muchos casos sea necesaria la validación de la decisión delalgoritmo por un especialista, sin embargo, pueden darse casos donde esta validación nosea tan esencial, o que se pueda tratar a esta primera identificación como una orientaciónde cara a ayudar al especialista. Con este objetivo en mente, esta tesis se centra en eldesarrollo de un algoritmo para la identificación de patologías del tren inferior. Estaidentificación se lleva a cabo mediante la forma de caminar de la gente (gait, en inglés).La forma de caminar de la gente difiere entre unas personas y otras, haciendo posibleincluso la identificación biométrica mediante su uso. Sin embargo, esta también se veafectada cuando se presenta una patología, tanto física como psíquica, que afecta a laspersonas. Esta alteración, genera un patrón común dependiendo del tipo de patología. Noobstante, esta tesis se centra exclusivamente la identificación de patologías físicas. Otroaspecto importante en esta tesis es que los diferentes algoritmos se crean con la idea dela portabilidad en mente, evitando la obligación del usuario de realizar los paseos conexcesivas restricciones (tanto de vestimenta como de localización).En primer lugar, se desarrollan diferentes algoritmos empleando diferentesconfiguraciones de teléfonos inteligentes para la adquisición de la base de datos. Enconcreto se usan configuraciones empleando 1, 2 y 4 teléfonos. Los teléfonos se colocanen las piernas empleando sujeciones especiales, de tal modo que no se puedan moverlibremente. Una vez que se han capturado todos los paseos, el primer paso es filtrarlas señales para eliminar el posible ruido que contengan. Seguidamente las señalesse procesan para extraer los diferentes ciclos de la marcha (que corresponden a dospasos) que componen los paseos. Una vez terminado el proceso de extracción de características, parte de estas se emplean para entrenar diferentes algoritmos de machinelearning, los cuales luego son empleados para clasificar las restantes características. Sinembargo, las evidencias obtenidas a través de la realización de los experimentos con lasdiferentes configuración y algoritmos indican que no es viable realizar una identificaciónde patologías empleando teléfonos inteligentes. Principalmente esto se puede achacara tres factores: la calidad de las señales capturadas por los teléfonos, la frecuencia demuestreo inestable y la falta de sincronía entre los teléfonos.Por otro lado, a raíz de los pobres resultados obtenidos empleado teléfonosinteligentes se cambia el dispositivo de captura a un sistema profesional de adquisiciónde movimiento. Además, se plantea crear dos tipos de algoritmo, uno basado en redesneuronales y otro basado en los algoritmos empleados anteriormente. Primeramente,se plantea la adquisición de una nueva base de datos. Para ellos se establece unprocedimiento para facilitar la captura de los datos, los cuales se plantea han de ser en unentorno de libertad para el usuario. Una vez que se tienen todos los datos, el preprocesadoque se realizar es similar al aplicado anteriormente. Las señales se filtran para eliminarel ruido y se extraen los diferentes ciclos de la marcha que componen los paseos. Sinembargo, como para el dispositivo de captura tenemos información de varios sensores yvarias localizaciones, el lugar de emplear una frecuencia de corte común, empíricamentese establece una frecuencia de corte para cada señal y posición. Dado que ya tenemos losdatos listos, se crea una red neuronal recurrente basada en la literatura, de este modopodemos tener una primera aproximación al problema. Vista la viabilidad de la redneuronal, se realizan diferentes experimentos con el objetivo de mejorar el rendimientode esta.Finalmente, el otro algoritmo recoge el legado de lo visto en la primera parte de latesis. Al igual que antes, este algoritmo se basa en la parametrización de los ciclos dela marcha, para su posterior utilización y emplea algoritmos basado en machine learning.A diferencia del uso de señales temporales, al parametrizar los ciclos, se pueden generardatos espurios. Para eliminar estos datos, el conjunto de datos se somete a una fase depreparación (limpieza y escalado). Una vez que se ha obtenido un conjunto de datospreparado, este se divide en dos, una parte se usa para entrenar los algoritmos, los cualesse emplean para clasificar las muestras restantes. Los resultados de estos experimentosvalidan la viabilidad de este algoritmo para la detección de patologías. A continuación,se realizan diferentes experimentos con el objetivo de reducir la cantidad de informaciónnecesaria para identificar una patología, sin perjudicar a la precisión. Resultado de estosexperimentos, se puede concluir que es viable detectar patologías empleando únicamente2 sensores colocados en una pierna. YR 2021 FD 2021-12 LK https://hdl.handle.net/10016/34913 UL https://hdl.handle.net/10016/34913 LA eng NO Mención Internacional en el título de doctor DS e-Archivo RD 1 sept. 2024