Statistical classification of images

Giuliodori, María Andrea

Publication:
Statistical classification of images

Identifiers

URI: http://hdl.handle.net/10016/12279

Files

mariaandrea_giuliodori_tesis.pdf (1.7 MB)

Publication date

2011-05

Defense date

2011-09-19

Authors

Giuliodori, María Andrea

Advisors

Lillo Rodríguez, Rosa Elvira

Peña, Daniel

Impact

Export

Abstract

Image classification is a burgeoning field of study. Despite the advances achieved in this camp, there is no general agreement about what is the most effective methods for the classification of digital images. This dissertation contributes to this line of research by developing different statistical methods aim to classifying digital images. In Chapter 1 we introduce basic concepts of image classification and review some results and methodologies proposed previously in the literature. In Chapter 2 we propose a method to classify images by their content. We are able to distinguish between landscape from non-landscape pictures by using three features obtained directly from images. We obtain better classification rates than those obtained by other authors dealing with similar kind of scene classification. In Chapter 3 we address the handwritten digit recognition. We suggest a set of intuitive features to perform the classification. Since the features are calculated with the binary image, we propose a novel technique to obtain the optimum threshold to binarize images, based on statistical concepts associated to the written trace of the digit. The classification is conducted by applying multivariate and probabilistic approaches, concluding that both methods provide similar results in terms of test-error rate (3.5%). In Chapter 4 we propose the application of Functional Data Analysis to analyze and classify images. While a limited number of authors have suggested the application of FDA for image classification [Florindo et al. (2010)], we suggest that this branch of statistics has represents a promising approach and offers several avenues for future research. We close the dissertation in Chapter 5 with a set of concluding remarks. Overall, the methods suggested in this dissertation are simple to apply, intuitive in their interpretation and their performance is comparable with other complex methods applied to the same problem. Moreover, the features suggested require less processing time than other methods (as support vector machine classifiers) and therefore require less computational capacity
La clasificación de imágenes es un campo de estudio de rápido crecimiento. A pesar de los avances logrados en esta área, no existe un acuerdo generalizado acerca de cuál es el método más eficaz para la clasificación de imágenes digitales. Esta tesis contribuye a esta línea de investigación mediante el desarrollo de diferentes métodos estadísticos que tienen como objetivo la clasificación de imágenes digitales. En el capítulo 1 se introduce los conceptos básicos de clasificación y se revisan algunos resultados de las metodologías propuestas previamente en la literatura. En el capítulo 2 se propone un método para clasificar las imágenes por su contenido. Somos capaz de distinguir entre una imagen de un paisaje de una que no lo es a partir del uso de tres variables obtenidas directamente de las imágenes. Obtenemos mejores tasas de clasificación que las alcanzadas por otros autores que han trabajado clasificación de escenas similares. En el capítulo 3 abordamos el reconocimiento de dígitos escritos a mano. Sugerimos una serie de variables intuitivas para llevar a cabo la clasificación. Dado que las variables se calculan con imágenes binarias, se propone una novedosa técnica para obtener el umbral óptimo para imágenes binarizadas, basado en los conceptos estadísticos asociados al trazo de escritura del dígito. La clasificación se lleva a cabo mediante la aplicación de métodos multivariantes y probabilísticos, concluyendo que ambos métodos proporcionan resultados similares en términos de tasa de error (3,5 %). En el capítulo 4 se propone la aplicación del Análisis Funcional de Datos para estudiar y clasificar imágenes digitales. Mientras que un número limitado de autores han sugerido la aplicación de ADF para la clasificación de la imagen [Florindo et al. (2010)], creemos que este rama de la estadística representa un enfoque prometedor y ofrece diversas alternativas para la investigación futura. Cerramos la tesis en el capítulo 5 con un conjunto de observaciones finales. En general, los métodos propuestos en esta tesis son fáciles de aplicar, intuitivos en su interpretación y su rendimiento es comparable con otros métodos complejos aplicados al mismo problema. Por otra parte, las características sugeridas requieren menos tiempo de procesamiento que otros métodos (como los clasificadores de técnicas de vector soporte)

Keywords

Imágenes, Clasificación, Métodos estadísticos, Análisis funcional

Collections

Tesis Doctorales

Full item page

Publication:
Statistical classification of images

Identifiers

Files

Publication date

Defense date

Authors

Advisors

Tutors

Journal Title

Journal ISSN

Volume Title

Publisher

Impact

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Description

Keywords

Bibliographic citation

Collections

Publication: Statistical classification of images

Identifiers

Files

Publication date

Defense date

Authors

Advisors

Tutors

Journal Title

Journal ISSN

Volume Title

Publisher

Impact

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Description

Keywords

Bibliographic citation

Collections

Publication:
Statistical classification of images