Publication:
Estudio experimental de costes para aprendizaje estadístico con etiquetas parciales

Loading...
Thumbnail Image
Identifiers
Publication date
2014-06
Defense date
2014-07-10
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
En este trabajo se aborda el estudio del comportamiento de conjuntos de datos dotados tanto de un etiquetado supervisado como de etiquetas parciales. Dicho estudio se realiza mediante el análisis de costes para la función NLL o verosimilitud logarítmica negativa. Se realizan además procesos de optimización con dos algoritmos clásicos, steepest descent y Newton's method. La optimización se realiza sobre la función NLL, empleándose observaciones generadas artificialmente. La creación de los datos y su etiquetado, tanto supervisado como parcial, viene acompañada de un modelo probabilístico ofrecido por la regresión logística. Se trata por tanto de una evaluación de algoritmos de entrenamiento para un problema de clasificación basado en etiquetas parciales. Todas las implementaciones se llevan a cabo empleando técnicas de aprendizaje máquina y siguiendo metodologías del aprendizaje. La evaluación y las conclusiones sobre los resultados ofrecen las diferencias entre ambos tipos de etiquetas y las pérdidas que se producen con los dos modelos.
This work deals with the study of di erent types of data clusters. These ones are classiffied with supervised labels and partial labels. An analysis is performed about costs over the function NLL or negative log-likelihood. Also classic optimization methods are applied, for example: steepest descent and Newton's method. All the optimization process is done using arti cially generated observations. The creation of data and its labeling, both partial as supervised, is followed by a probabilistic model originated with logistic regression. Each implementation is made with machine learning techniques and using also learning methodology. Evaluation of results and conclusions provide di erences between both types of labeling and losses that are produced by the two models.
Description
Keywords
Ingeniería del conocimiento, Aprendizaje, Etiquetas parciales, Regresión logística
Bibliographic citation