MINERÍA DE TEXTOS. APLICACIÓN A PREGUNTAS ABIERTAS EN ENCUESTAS

MINERÍA DE TEXTOS. APLICACIÓN A PREGUNTAS ABIERTAS EN ENCUESTAS

BECUE BERTAUT, MONICA

8,00 €
IVA incluido
No disponible Pregúntanos antes de pagar
Editorial:
LA MURALLA EDITORIAL
Año de edición:
2010
Materia
Matematicas/estadistica
ISBN:
978-84-7133-793-1
Páginas:
120
Encuadernación:
Rústica
Colección:
CUADERNOS DE ESTADISTICA
8,00 €
IVA incluido
No disponible Pregúntanos antes de pagar

INTRODUCCIÓN
1. LAS RESPUESTAS ABIERTAS, UN MATERIAL PARA EL ESTUDIO ESTADÍSTICO: UNIDADES Y TABLAS LÉXICAS
1.1. Las encuestas por cuestionario y el cuestionamiento abierto
1.2. Presentación del ejemplo. Identidad
1.3. Estadística y variable textual
1.4. Recogida de las respuestas libres
1.5. Preproceso del corpus y segmentación del corpus en unidades léxicas
1.5.1. Corpus
1.5.2. Preproceso del corpus
1.5.3. Unidad léxica: palabra o lema
1.5.4. Interés de la lematización
1.5.5. Stoplist
1.5.6. Unidad léxica compuesta: el segmento repetido
1.5.7. ?Stematización? y/o reagrupación de sinónimos
1.5.8. Umbral de frecuencia
1.6. Codificación del texto y tablas léxicas
1.6.1. Tabla léxica individuos × palabras
1.6.2. Tabla léxica agregada palabras × categorías
2. PRINCIPIOS BÁSICOS DEL SOFTWARE SPAD7
2.1. Introducción
2.2. Ejemplo de proyecto SPAD
2.2.1. El archivo BASE de SPAD
2.2.2. Construcción de una cadena
2.2.3. Apertura de una cadena favorita
2.2.4. Creación de una cadena favorita
2.3. Importación y exportación de archivos
2.4. Conexiones
2.5. Familias de métodos
3. GLOSARIOS Y CONCORDANCIAS
3.1. Introducción
3.2. Preproceso del corpus. Identidad
3.2.1. Selección de la pregunta abierta, de los individuos y de los delimitadores
3.2.2. Selección del vocabulario
3.2.3. Modificación del vocabulario
3.3. Glosario de palabras y segmentos
3.3.1. Glosario de palabras
3.3.2. Glosarios de segmentos
3.3.3. Temas más frecuentes
3.4. Concordancias de palabras
3.5. Medidas estilísticas
3.5.1. Distribución de las frecuencias
3.5.2. Longitud de las respuestas abiertas
3.5.3. Riqueza del vocabulario
4. COMPARACIÓN DE CATEGORÍAS DE RESPUESTAS. ANÁLISIS DE CORRESPONDENCIAS DE UNA TABLA LÉXICA AGREGADA
4.1. Introducción
4.2. Construcción de la tabla léxica agregada
4.2.1. Breve resumen cuantitativo sobre las ocho categorías de respuestas
4.2.2. Tabla léxica agregada
4.2.3. Visualización de la tabla léxica agregada
4.3. Análisis de correspondencias de una tabla léxica agregada
4.3.1. Análisis de correspondencias y análisis textual
4.3.2. Análisis de correspondencias: formulación matemática
4.3.2.1. Transformación de la tabla de efectivos en tabla de proporciones
4.3.2.2. Tablas de perfiles-fila y de perfiles-columna
4.3.2.3. Enfoque geométrico
4.3.2.4. Inercia de las nubes de perfiles-fila y de la nube de perfiles-columna
4.3.2.5. Visualización de la estructura de las nubes de perfiles-fila y de perfiles-columna
4.3.2.6. Ejes principales y vectores de coordenadas principales
4.3.2.7. Formulas de transición y elementos suplementarios
4.3.2.8. Análisis de correspondencias de una tabla léxica
4.4. Pequeño ejemplo
4.5. Análisis de correspondencias de la tabla léxica agregada por Sexo × Edad
4.5.1. Inercia de los factores
4.5.1.1. Inercia y valores propios
4.5.1.2. Número de factores a conservar e interpretar
4.5.2. Interpretación de los factores
4.5.2.1. Contribuciones de las filas y columnas
4.5.2.2. Interpretación de un factor
4.5.2.3. Interpretación de un plano
4.5.2.4. Primer plano principal
4.5.2.5. Breve síntesis
5. COMPARACIÓN DE CATEGORÍAS DE RESPUESTAS. SELECCIÓN DE PALABRAS Y RESPUESTAS CARACTERÍSTICAS
5.1. Introducción
5.2. Cadena de análisis
5.3. Palabras características
5.3.1. Palabras características de las ocho categorías de Edad_Sexo
5.4. Respuestas características
5.4.1. Selección a partir de las palabras características
5.4.2. Selección a partir de la distancia del c2 entre perfiles léxicos
5.4.3. Lectura global de los resultados
6. ANÁLISIS DIRECTO DE LAS RESPUESTAS
6.1. Introducción
6.2. Análisis de correspondencias de la tabla léxica
6.2.1. Procedimiento SPAD para el análisis directo del corpus.Identidad
6.2.2. Valores propios
6.2.2.1. Conjuntos sintagmáticos de palabras
6.2.3. Identificación de los grupos sintagmáticos
6.2.3.1. Nube y contribución de los individuos
6.2.3.2. Nube y contribución de las palabras
6.2.3.3. Identificación de los grupos sintagmáticos
6.2.3.4. Detección de los grupos sintagmáticos asociados a los dos primeros ejes en el corpus. Identidad
6.2.3.5. Los segmentos como elementos suplementarios
6.2.4. Categorías como elementos suplementarios
6.2.4.1. Características sociodemográficas, una ayuda a la interpretación
6.2.4.2. Valores-test
6.2.4.3. Variables continuas suplementarias
6.3. Conclusión y perspectivas
CONCLUSIÓN
REFERENCIAS BIBLIOGRÁFICAS

Este libro está dedicado al análisis estadístico de respuestas a preguntas abiertas, planteadas como complemento de preguntas cerradas más clásicas. No obstante, las herramientas presentadas se pueden aplicar a una gran variedad de documentos textuales acompañados de información paratextual tal como la fecha de publicación, el autor, etc.
Se muestra la aportación de los métodos estadísticos para extraer la información contenida en las respuestas abiertas. Se privilegia el análisis de correspondencias, que constituye una herramienta muy versátil, aunque la especificidad de los datos textuales haya conducido a elaborar métodos originales.
La metodología se expone de forma crítica, insistiendo sobre las características particulares del material textual. Se insiste sobre las estrategias de análisis a aplicar, es decir, sobre la combinación o encadenamiento de métodos que permiten contestar a las preguntas del usuario.
La exposición metodológica se apoya sobre un ejemplo real, disponible para el lector, tratado con el software SPAD.