Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información

Moreiro González, José Antonio

Publication:
Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información

Identifiers

URI: http://hdl.handle.net/10016/20150

ISSN: 1575-2437

UXXI: AR/0000000034

Files

aplicaciones_moreiro_AD_2002.pdf (383.38 KB)

Publication date

2002

Authors

Moreiro González, José Antonio

Publisher

Universidad de Murcia

Impact

Export

Abstract

Reflexión sintética para revisar las propuestas más relevantes que, siguiendola teoría matemática de la comunicación de Shannon y Weaver, hayanafectado a los procedimientos del análisis automático del contenido documental.Partiendo del empleo de la teoría matemática en Ciencia de la Información se explicansus aplicaciones metodológicas en nuestra especialidad, en especial respectoa las técnicas de recuperación de la información. Para después describir los modelosmatemáticos aplicados al análisis automático del contenido: leyes de Zipf yGoffman, antidiccionarios para índices permutados, Indización Estadística de Términospor Frecuencias, algoritmos n-grams y de stemming, así como los referidosa los métodos de agrupación y clasificación como clusters por valor de discriminacióny por relevancia de los términos como son los métodos de agrupación basadosen Grafos Teóricos, los basados en Centros de masas, el algoritmo K-vecinos o Kmedias,el K-vecinos axial o incremental, y el algoritmo ISODATA. Para luegoexponer los clasificadores cienciométricos como el método de Chen y finalmentelos métodos con sistemas de aprendizaje.
This paper analyzes the most important proposals following the Shannon and Weaver's Mathematic Theory of Communication that have influenced in proceedings of automatic content analysis. It's explained the methodological applications of this theory in our discipline, especially about information retrieval. After this, describes the mathematical models applied to automatic content analysis: Laws of Zipf and Goffman, anti-dictionaries to permuted indexes, Statistical Indexation of terms by frequencies, n-grams and stemming algorisms. Also studies the methods of relation and classification like clusters by value of discrimination and by relevance of terms: for example, methods of relations based in Graph Theory, mass core, the K-means or incremental K-means, and the ISODATA algorism. Finally, explains the scientometrics indicators as Chen's coowording and methods with learning systems

Keywords

Análisis de contenido textual, Análisis automático, Elementos matemáticos, Métodos estadísticos, Métodos probabilísticos, Redes neuronales, Coocurrencias, Métodos basados en centroides, Clustering, Textual content analysis., Automatic analysis, Statistical methods, Probabilistic methods, Neural nets, Co-occurrences, Core methods, Clustering

Bibliographic citation

Anales de documentación: revista de biblioteconomía y documentación. N. 5 (2002), pp. 273-286

Collections

DBD - Artículos de Revistas

Full item page

Publication:
Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información

Identifiers

Files

Publication date

Defense date

Authors

Advisors

Tutors

Journal Title

Journal ISSN

Volume Title

Publisher

Impact

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Description

Keywords

Bibliographic citation

Collections

Publication: Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información

Identifiers

Files

Publication date

Defense date

Authors

Advisors

Tutors

Journal Title

Journal ISSN

Volume Title

Publisher

Impact

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Description

Keywords

Bibliographic citation

Collections

Publication:
Aplicaciones al análisis automático del contenido provenientes de la teoría matemática de la información