RT Dissertation/Thesis
T1 Statistical classification of images
A1 Giuliodori, María Andrea
AB Image classification is a burgeoning field of study. Despite the advances achieved in this camp, there is no general agreement about what is the most effective methods for the classification of digital images. This dissertation contributes to this line of research by developing different statistical methods aim to classifying digital images. In Chapter 1 we introduce basic concepts of image classification and review some results and methodologies proposed previously in the literature. In Chapter 2 we propose a method to classify images by their content. We are able to distinguish between landscape from non-landscape pictures by using three features obtained directly from images. We obtain better classification rates than those obtained by other authors dealing with similar kind of scene classification. In Chapter 3 we address the handwritten digit recognition. We suggest a set of intuitive features to perform the classification. Since the features are calculated with the binary image, we propose a novel technique to obtain the optimum threshold to binarize images, based on statistical concepts associated to the written trace of the digit. The classification is conducted by applying multivariate and probabilistic approaches, concluding that both methods provide similar results in terms of test-error rate (3.5%). In Chapter 4 we propose the application of Functional Data Analysis to analyze and classify images. While a limited number of authors have suggested the application of FDA for image classification [Florindo et al. (2010)], we suggest that this branch of statistics has represents a promising approach and offers several avenues for future research. We close the dissertation in Chapter 5 with a set of concluding remarks. Overall, the methods suggested in this dissertation are simple to apply, intuitive in their interpretation and their performance is comparable with other complex methods applied to the same problem. Moreover, the features suggested require less processing time than other methods (as support vector machine classifiers) and therefore require less computational capacity
AB La clasificación de imágenes es un campo de estudio de rápido crecimiento. Apesar de los avances logrados en esta área, no existe un acuerdo generalizado acercade cuál es el método más eficaz para la clasificación de imágenes digitales. Esta tesiscontribuye a esta línea de investigación mediante el desarrollo de diferentes métodosestadísticos que tienen como objetivo la clasificación de imágenes digitales. En elcapítulo 1 se introduce los conceptos básicos de clasificación y se revisan algunos resultadosde las metodologías propuestas previamente en la literatura. En el capítulo 2se propone un método para clasificar las imágenes por su contenido. Somos capaz dedistinguir entre una imagen de un paisaje de una que no lo es a partir del uso de tresvariables obtenidas directamente de las imágenes. Obtenemos mejores tasas de clasificaciónque las alcanzadas por otros autores que han trabajado clasificación de escenassimilares. En el capítulo 3 abordamos el reconocimiento de dígitos escritos a mano.Sugerimos una serie de variables intuitivas para llevar a cabo la clasificación. Dadoque las variables se calculan con imágenes binarias, se propone una novedosa técnicapara obtener el umbral óptimo para imágenes binarizadas, basado en los conceptosestadísticos asociados al trazo de escritura del dígito. La clasificación se lleva a cabomediante la aplicación de métodos multivariantes y probabilísticos, concluyendo queambos métodos proporcionan resultados similares en términos de tasa de error (3,5 %).En el capítulo 4 se propone la aplicación del Análisis Funcional de Datos para estudiary clasificar imágenes digitales. Mientras que un número limitado de autores han sugeridola aplicación de ADF para la clasificación de la imagen [Florindo et al. (2010)],creemos que este rama de la estadística representa un enfoque prometedor y ofrecediversas alternativas para la investigación futura. Cerramos la tesis en el capítulo 5con un conjunto de observaciones finales. En general, los métodos propuestos en estatesis son fáciles de aplicar, intuitivos en su interpretación y su rendimiento es comparablecon otros métodos complejos aplicados al mismo problema. Por otra parte, lascaracterísticas sugeridas requieren menos tiempo de procesamiento que otros métodos(como los clasificadores de técnicas de vector soporte)
YR 2011
FD 2011-05
LK https://hdl.handle.net/10016/12279
UL https://hdl.handle.net/10016/12279
LA eng
DS e-Archivo
RD 1 jun. 2024