Descripción
Presentación:
En el presente curso se aprenderá el uso de R.Temis en el análisis de documentos de texto en diferentes formatos (TXT, CSV, HTML, etc.). R.TeMiS es un entorno gráfico de trabajo sobre R que permite realizar análisis de textos y obtener imágenes y múltiples gráficos de los resultados. Pueden ser analizados: documentos de texto plano, encuestas, archivos exportados de bases de datos documentales, registros HTML de las base de datos Factiva, LexisNexis o Europresse, y, ficheros de Alceste o de Twitter. El alumno aprenderá las diferentes técnicas de análisis y de gestión del conjunto de documentos: visualización del corpus de documentos, obtención de vocabularios, creación de subcorpus, obtención de términos específicos, análisis de coocurrencias, realización de clasificaciones de los textos mediante Hierarchical clustering y realización de mapas de documentos y de términos mediante Correspondence analysis.
Temario
Temario:
Introducción a R y RCommander. Comenzando a trabajar con R.TeMiS
Importar conjuntos de documentos. Visualización del corpus activo y de los diccionarios de términos
Gestión y distribución del corpus. Selección o exclusión de términos. Creación y análisis de subconjuntos de documentos
Obtención de gráficas de distribución de documentos o términos según una o dos variables
Análisis descriptivo del léxico. Resumen cuantitativo del vocabulario de términos. Tabla de disimilaridad. Términos más frecuentes. Términos específicos. Coocurrencia de términos
Análisis de correspondencias aplicado al corpus de documentos. Clasificación de los documentos del corpus. Ayuda a la interpretación del análisis de correspondencias y de la clasificación ascendente jerárquica
7) Creación de informes. Exportación de resultados