Guía paso a paso para la investigación educativa

Análisis de contenido
asistido por LLM

Procedimiento sistemático para integrar modelos de lenguaje de gran tamaño en el análisis de contenido, manteniendo el rigor metodológico y la responsabilidad interpretativa del investigador.

Autor
Javier Vidal
Institución
EVORI · Universidad de León
EVORI Universidad de León
Versión Mayo 2026
Información del documento

Análisis de contenido asistido por LLM

Guía paso a paso para la investigación educativa
Autor
Javier Vidal Grupo EVORI · Universidad de León
Versión
Mayo 2026 Edición digital y para distribución académica
Proyecto
AiRISES · Aplicación de la IA en el análisis de redes informales sociales para la orientación en Educación Superior. PID2021-125405NB-I00 · Ministerio de Ciencia e Innovación
Equipo
IP: Javier Vidal · María José Vieira Camino Ferreira · Agustín Rodríguez-Esteban · Diego González-Rodríguez · Alba González-Moreira · Estela Mayor-Alonso · Yaiza Viñuela · María Álvarez-Godos · Ainhoa Martínez-Rodríguez · Héctor González-Mayorga
Citar como Vidal, J. (2026). Análisis de contenido asistido por LLM: Guía paso a paso para la investigación educativa. Universidad de León.
ISBN [pendiente] · Disponible en https://evori.net
JV
Sobre el autor
Javier Vidal
Catedrático de Métodos de Investigación en Educación
Universidad de León · Grupo EVORI

Catedrático de Métodos de Investigación en Educación en la Universidad de León (España) y director del grupo de investigación EVORI. Su trabajo académico ha estado siempre vinculado al estudio de la educación superior, la calidad universitaria y la relación entre formación, innovación y sociedad, combinando investigación y docencia con responsabilidades institucionales en la universidad y en la administración educativa española.

Ha colaborado con organismos nacionales e internacionales —entre ellos la Comisión Europea, la ANECA, la OEI y el Banco Mundial— en proyectos centrados en la evaluación educativa, la orientación universitaria y las políticas de educación superior. En los últimos años su trabajo se ha orientado especialmente hacia el impacto de la inteligencia artificial y las tecnologías digitales en la educación y la investigación.

Autor de numerosas publicaciones científicas y divulgativas, mantiene una visión interdisciplinar y humanista de la educación, atenta tanto a los desafíos tecnológicos actuales como a las personas y contextos que protagonizan los procesos de aprendizaje y transformación social.

Parte I

Fundamentos

El análisis de contenido y el uso responsable de los LLM en investigación educativa.
Capítulo 1

Introducción

Un poco de contexto. El análisis de contenido asistido por modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) se ha convertido en una herramienta de creciente interés en la investigación educativa. La disponibilidad de sistemas como ChatGPT, Gemini o Claude, capaces de procesar grandes volúmenes de texto y generar resúmenes, categorías y explicaciones, permite optimizar procesos que tradicionalmente son laboriosos y exigen un tiempo considerable de lectura, codificación y comprensión. Pero es importante que desde el principio quede claro que el empleo de LLM es un apoyo metodológico que no sustituye la responsabilidad del investigador. Esta guía se plantea desde un enfoque combinado: (a) realizar un análisis de contenido tradicional, fundamentado en el rigor metodológico, la transparencia y el análisis crítico de los resultados, (b) incorporando el LLM como apoyo técnico para agilizar tareas y organizar la información, insisto, sin sustituir el criterio ni la interpretación del investigador.

El procedimiento de análisis que te presento en este documento es el resultado directo del trabajo desarrollado en el proyecto Aplicación de la Inteligencia Artificial en el análisis de redes informales sociales para la orientación en Educación Superior (AiRISES), financiado por el Ministerio de Ciencia e Innovación (PID2021-125405NB-I00), del que hemos sido investigadores principales María José Vieira y yo mismo. Su elaboración se sustenta en más de tres años de investigación continuada, en los que hemos combinado técnicas de análisis automatizado y revisión experta para abordar de forma rigurosa un corpus amplio y complejo de mensajes provenientes de foros informales. Este procedimiento es la síntesis final del conocimiento acumulado por todo el equipo implicado en el proyecto, tanto del equipo de investigación, Camino Ferreira, Agustín Rodríguez-Esteban, Diego González-Rodríguez y Alba González-Moreira, como del equipo de trabajo, integrado por Estela Mayor-Alonso, Yaiza Viñuela, María Álvarez-Godos, Ainhoa Martínez-Rodríguez y Héctor González-Mayorga. La versión final que aquí presento no habría sido posible sin sus aportaciones, que han enriquecido de manera constante el enfoque, la comprensión del objeto de estudio y la solidez del método.

Propósito de la guía

El propósito principal de esta guía es ofrecerte un procedimiento detallado, paso a paso, para realizar análisis de contenido asistido por LLM en investigación educativa. Combina fundamentos conceptuales, indicaciones prácticas, ejemplos e instrucciones listas para usar, de modo que puedas adaptar el proceso a tu propio estudio, ya se trate de corpus grandes con cientos de documentos o de encuestas breves con pocas respuestas.

El objetivo final es que puedas llevar a cabo un análisis de contenido riguroso, reproducible y éticamente informado, integrando el LLM como un asistente experto, que agilizará el trabajo técnico, pero sin sustituir en ningún caso tu propio criterio ni tu responsabilidad interpretativa (me pondré un poco pesado insistiendo en esto).

A quién va dirigida

La guía está pensada para personas como tú, investigadoras en formación, docentes que realizan estudios de investigación o innovación y equipos que quieran integrar LLM en sus flujos de trabajo y no presupone conocimientos de programación ni experiencia previa con LLM. Sí presupone, en cambio, que debes estar familiarizada con los conceptos fundamentales del análisis de contenido. Quizás sea útil que eches un vistazo a algún manual o documento antes de seguir.

Caso AiRISES
Siguiendo el caso AiRISES: Imagina que tu reto no es analizar mensajes sueltos, sino comprender todo un ecosistema educativo complejo. En AiRISES nos enfrentamos a 7.408 mensajes. Al principio, solo veíamos "dudas", pero gracias al análisis asistido descubrimos tres grandes mundos: la transición desde secundaria (donde el rendimiento académico preocupa al 64%), la identidad propia de la FP (que representa el 25% de las dudas totales) y el miedo estructural al mercado laboral. Conseguimos identificar que estos mensajes eran un indicador de las inquietudes de miles de estudiantes.

Alcance y límites de los LLM en análisis de contenido

Los LLM pueden ser aliados potentes para apoyar el análisis de contenido, pero su utilidad depende de un uso controlado y acompañado por el criterio del investigador. Son especialmente buenos para resumir, organizar, agrupar, reescribir y proponer, pero no sustituyen la comprensión contextual, teórica y ética de quien analiza. Pueden introducir sesgos heredados de sus datos de entrenamiento, sobreinterpretar información o inventar detalles. Por ello, requieren instrucciones precisas y supervisión constante.

Es importante entender bien sus capacidades y limitaciones.

Tabla 1. Capacidades y límites de los LLM
Dimensión Elementos clave
Lo que un LLM sí hace bien Resumir grandes volúmenes de texto; identificar patrones preliminares o temas tentativos; sugerir estructuras categoriales iniciales; codificar textos en matrices organizadas; elaborar borradores de síntesis e informes.
Lo que no debe delegarse al LLM Interpretación final de los hallazgos; atribución de significado profundo o contextual; construcción autónoma de categorías sin supervisión humana; juicio teórico y relevancia conceptual; responsabilidad ética en el tratamiento de los datos.
Aspectos críticos para vigilar Razonamientos circulares o tautológicos; sobreinterpretaciones o inferencias no justificadas; generalizaciones excesivas; inconsistencias en la codificación entre fragmentos similares; falta de documentación que comprometa la transparencia del proceso.

En resumen, el análisis asistido por LLM es siempre un proceso interactivo: el modelo acelera tareas repetitivas y estructurales; la investigadora interpreta, valida y decide.

Justificación del uso de LLM en investigación educativa

En investigación educativa, la información que se recoge suele ser abundante, diversa y rica en matices: cuestionarios abiertos, entrevistas, diarios de aula, reflexiones del alumnado, informes de tutores, portafolios, transcripciones de grupos de discusión, planes docentes, o incluso mensajes de foros virtuales. Analizar todo esto manualmente consume tiempo y, en ocasiones, ralentiza las fases exploratorias.

Aquí es donde los LLM aportan un valor claro: permiten agilizar procesos sin renunciar al rigor, siempre que el control interpretativo permanezca en manos de la investigadora.

Aun así, es imprescindible recordar que los modelos pueden cometer errores, sintetizar en exceso o introducir inferencias que no están presentes en los datos. Los LLM no comprenden el contexto educativo, institucional o social más allá de lo que se les proporcione y por tanto su aporte siempre requiere verificación crítica.

Recuerda que, aunque el LLM te entregue una tabla impecable, la que firma el artículo eres tú. Si el modelo se inventa algo y no lo pillas, tú te llevarás un disgusto cuando te pregunten los revisores y la máquina ni se inmutará. Peor aún, te dirá: Lo siento, tienes razón. Me equivoqué. El LLM acelera el proceso de análisis; la investigadora interpreta. Ese es el principio central. Aquí van unos ejemplos.

Ejemplo 1. Respuesta abierta de alumnado (cuestionario)

Dato original (alumna de 2.º ESO):

“Me gusta cuando trabajamos en grupos pequeños porque así puedo preguntar sin vergüenza. En clase grande me pierdo enseguida.”

Qué puede hacer el LLM aquí:

  • identificar patrones preliminares (comodidad, participación, clima emocional),

  • proponer categorías tentativas: participación, apoyo entre iguales, barreras en gran grupo,

  • extraer citas textuales relevantes sin reescrituras.

Qué no debe hacer:

  • interpretar que la alumna “tiene baja autoestima”,

  • sugerir causas no mencionadas,

  • inferir características personales.

Ejemplo 2. Comentarios en un foro institucional (universidad)

Mensaje de una estudiante en Moodle:

“A veces no entiendo bien qué pide cada práctica porque las instrucciones están en sitios distintos. Me ayudaría tener todo unificado.”

Qué puede hacer el LLM:

  • identificar necesidades de claridad, gestión de materiales, experiencia del estudiante,

  • proponer una categoría como: demandas de organización de la docencia,

  • sugerir citas representativas.

Qué no debe hacer:

  • deducir que el profesor “no planifica bien”,

  • afirmar que esto impacta en el rendimiento académico.

Aspectos formales de la guía

En primer lugar, en esta guía utilizo de forma preferente el término LLM (Large Language Model) en lugar de la denominación más amplia IA (Inteligencia Artificial). La razón es que el análisis de contenido asistido que se describe aquí se basa específicamente en modelos de lenguaje generativos —como ChatGPT, Claude o Gemini— capaces de procesar texto, generar respuestas y aplicar criterios analíticos complejos. Estos modelos forman parte del campo más amplio de la inteligencia artificial, pero el término IA es excesivamente genérico y abarca tecnologías muy distintas (visión por computador, sistemas expertos, robótica, analítica predictiva). En cambio, el LLM identifica con precisión la herramienta concreta que interviene en el análisis de contenido, facilita describir de forma técnica el proceso y evita confusiones conceptuales. Por ello, y con el fin de mantener rigor terminológico y claridad metodológica, esta guía emplea el término LLM para referirse al agente asistente en todas las fases del análisis.

En segundo lugar, esta guía se ha elaborado tomando como referencia las capacidades de los modelos de lenguaje disponibles en diciembre de 2025. Aunque el funcionamiento de los LLM evoluciona con rapidez, el procedimiento descrito aquí pretende ser útil y duradero, porque se fundamenta en los principios clásicos del análisis de contenido y en una interacción estructurada con el modelo. Es previsible que las futuras mejoras en los LLM (mayor estabilidad en la aplicación de criterios analíticos, reducción de errores y capacidades más sólidas de razonamiento) incrementen la validez y fiabilidad de los resultados, disminuyendo paulatinamente la necesidad de supervisión humana directa en cada paso del proceso. Aun así, el juicio interpretativo del investigador seguirá siendo indispensable y esta guía ofrece una base metodológica tanto para las capacidades actuales como para las que se desarrollen en el futuro.

En tercer lugar, en esta guía se incluyen una serie de instrucciones pensadas para guiar el uso del LLM durante el análisis de contenido. Para diferenciarlas del texto explicativo, estas indicaciones aparecen destacadas en cajas de línea simple, fáciles de reconocer y de copiar directamente cuando sea necesario. Cada caja contiene una acción concreta que puedes pedir al modelo, o una regla que el modelo debe respetar. Yo prefiero llamarlas instrucciones, aunque todos se refieren a ellas como prompts. Un prompt puede ser “buenos días”, es decir, algo que provoca que el LLM responda. Aquí me centro solo en las instrucciones que queremos que siga. Por eso, usaré los dos términos, aunque con el mismo significado. Tendrán el formato de este ejemplo:

Instrucción para el LLM

Si detectas inconsistencias, sesgos o tareas imposibles, señala el problema antes de continuar.

Aprovecho para aclarar que estos son ejemplos, son propuestas. Los más expertos en este tema dicen que el prompting es tanto un arte como una ciencia. Así que, hacer pruebas para ver lo que funciona mejor es casi una necesidad.

Teniendo en cuenta que lo que aquí explico, puede usarse en su totalidad o parcialmente dependiendo del enfoque de la investigación y las decisiones metodológicas que tomes. Lo he hecho así para que puedan leerse cada capítulo de forma independiente, sin omitir las advertencias que creo que son imprescindibles (lo que te llevará a ver algunas de estas repetidas).

Principios operativos transversales (obligatorios en todo el proceso)

Estos principios se aplican en todas las fases (construcción, refinamiento, codificación, síntesis e informe). No los olvides. Esto lo pongo aquí para que ajustes tus expectativas sobre qué puede hacer un LLM para ayudarte y qué no. Pero, como he comentado en el párrafo anterior, insistiré en ellos en cada apartado.

P1El LLM propone; el investigador decide y se responsabiliza. El modelo no "valida" resultados: apoya, sugiere y estructura; la decisión metodológica final es tuya.
P2No inventar ni inferir fuera del texto. El análisis se limita al corpus proporcionado. Si algo no puede determinarse, debe indicarse explícitamente.
P3Trazabilidad y versionado. Toda salida relevante debe guardarse (sistema de categorías, definiciones, tablas, prompts y decisiones), con versión y fecha, asegurando la trazabilidad completa del proceso. Esto implica poder replicar y verificar el proceso.
P4Control de calidad continuo. Se exige revisión manual por muestras, contraste entre iteraciones y detección de incoherencias/sesgos; si aparecen fallos, se corrigen instrucciones o se revisa el sistema.
P5Privacidad y protección de datos. Antes de usar plataformas externas, se deben anonimizar datos, minimizar información sensible y revisar condiciones de uso; cuando haya restricciones, se emplearán alternativas seguras.
P6Documentación y reproducibilidad. Debes registrar decisiones (fusiones, eliminaciones, cambios de criterios, ejemplos) y describir el uso que has hecho del LLM en el informe final.
Capítulo 2

Fundamentos del análisis de contenido

En este capítulo te presento los principios conceptuales que sostienen el procedimiento de análisis de contenido asistido por LLM. Aunque espero que ya tengas una idea clara de qué es el análisis de contenido, hago una síntesis para situarte en el marco metodológico que utilizaré al aplicarlo en los siguientes capítulos.

Definiciones y conceptos clave

Análisis de contenido

El análisis de contenido es un método de análisis sistemático para identificar, organizar e interpretar significados presentes en datos textuales. En investigación educativa se utiliza para analizar:

  • respuestas abiertas de cuestionarios,

  • entrevistas,

  • foros, correos o chats educativos,

  • portafolios o diarios,

  • evidencias de aprendizaje,

  • otros tipos de documentos que contengan textos abiertos.

El objetivo es transformar datos textuales en información organizada y, de ahí, en interpretación fundamentada. Los datos (corpus) solo adquieren ese estatud cuando son interpretados en un marco coherente y estable.

Unidades de análisis

Lo primero que hay que decidir es cuál es la unidad de análisis, es decir, el conjunto textual que analizará: respuestas completas a una pregunta en una encuesta, frases sueltas, párrafos, o unidades semánticas definidas por la investigadora (ej., ideas completas). Ejemplo, un mensaje en un foro (reproducción literal, ortografía sin corregir):

ID03216 - Hola quisiera saber donde es en terminos relativos , ingenieria tecnica industrial, menos dura, numero de egresados donde puede verse de cada universidad o alguna informacion en relacion al tema

Categorías

En cada unidad de análisis puede haber una o varias categorías: etiquetas o conceptos que representan patrones, ideas o temas identificados en el texto. Ejemplos: rendimiento académico, Familia profesional, Acceso a la universidad, Empleo, …

Codificación

Para identificar las categorías en las unidades de análisis, utilizamos un proceso que denominamos codificación. Hay dos niveles de aplicación en los textos abiertos: (a) codificación interna por segmentos (frases, unidades semánticas, párrafos) y (b) codificación a nivel de documento cuando una categoría funciona como un atributo o variable del caso (por ejemplo, clasificar el documento por nivel educativo del que responde (Educación Superior/FP/…), perfil (hombre/mujer/…) u otras variables analíticas. Ejemplos:

Codificar un segmento de un mensaje: identificar en el texto la frase 'no sé si hacer el grado superior' y asignarle el código FP Grado Superior. Codificar un documento: analizar un mensaje completo para determinar, mediante indicadores lingüísticos, si el autor es hombre, mujer o neutro (género del usuario).

Tema (o dimensiones)

Las categorías pueden tener elementos en común. En ese caso, realizamos agrupaciones que integran varias categorías y expresa una idea central o un patrón significativo. Las categorías deben ser el último nivel de una estructura jerarquizada, que puede tener más de dos niveles de agrupación, que podemos llamar temas o dimensiones. Ejemplos:

Dimensión temporal: el tema "Etapas", que agrupa categorías jerárquicamente inferiores como: Preuniversitaria, EBAU, Universidad y Empleo.

Dimensión de contenido: el tema "Aspectos Actitudinales", que integra las categorías de Emociones (miedo, esperanza), Intenciones y Dificultad percibida.

Tipos de análisis: inductivo, deductivo y mixto

Figura 2
Árbol de decisión para seleccionar el tipo de análisis
Figura 2. Árbol de decisión para seleccionar el tipo de análisis

Inductivo

En el proceso de codificación podemos utilizar una estrategia inductiva, con la que creamos las categorías a partir de lo que encontramos en el texto.

Esta estrategia es útil cuando se exploran fenómenos poco estudiados, no existe un marco teórico previo, se explora un fenómeno nuevo o se desea capturar el contenido del texto sin forzar interpretaciones previas.

Un LLM es útil aquí para sugerir patrones iniciales.

Deductivo

También podemos utilizar una estrategia deductiva. En ella utilizamos categorías previas que se derivan de teorías, investigación existente, marcos conceptuales, rúbricas o cuestionarios previos.

Esta estrategia es útil cuando el objetivo es comprobar, contrastar o aplicar teorías previas.

Un LLM actúa como asistente para aplicar el sistema categorial predefinido a las unidades de análisis.

Mixto

El enfoque mixto combina ambos, aplicando categorías previas y permitiendo que surjan nuevas. Combina categorías predefinidas y emergentes.

Es el más habitual en estudios complejos y un LLM permite ajustar y enriquecer el sistema.

Riesgos

En el enfoque inductivo, el principal riesgo al usar LLM es sobredimensionar las propuestas iniciales y aceptar categorías poco fundamentadas; en el deductivo, el peligro es forzar los datos para que encajen en marcos teóricos preestablecidos; en enfoques mixtos, ambos riesgos coexisten y exigen una vigilancia especialmente cuidadosa.

Aquí tienes una tabla con el resumen.

Tabla 2. Enfoques de análisis de contenido: inductivo, deductivo y mixto
Criterio Inductivo Deductivo Mixto
Punto de partida Los datos Marco teórico previo Teoría y datos
Sistema de categorías Emergen progresivamente del corpus Definidas antes del análisis Categorías iniciales que se revisan y ajustan
Relación con la teoría La teoría se construye a partir de los datos La teoría guía el análisis La teoría orienta, pero se revisa a la luz de los datos
Grado de apertura Muy alto Bajo Medio–alto
Ventajas principales Descubre temas no previstos; alta sensibilidad al contexto Mayor control conceptual; facilita la comparabilidad Equilibrio entre rigor y apertura; alta adaptabilidad
Riesgos o límites Dispersión inicial; categorías inestables Forzar los datos; perder información relevante Requiere mayor control metodológico
Uso típico en investigación educativa Estudios exploratorios, análisis de experiencias del alumnado Evaluación de programas, aplicación de modelos teóricos Investigación educativa aplicada (muy frecuente)
Papel del LLM Apoya la identificación de patrones preliminares, la exploración temática y la propuesta inicial de categorías, siempre bajo revisión humana Aplica de forma sistemática un sistema categorial previamente definido y facilita la codificación consistente del corpus Apoya tanto la exploración inicial como el refinamiento y ajuste de categorías, facilitando iteraciones rápidas entre teoría y datos

Unidades de análisis y segmentación del texto.

La calidad del análisis depende en gran medida de la definición precisa de la unidad de análisis.

Tabla 3. Tipos más comunes de unidades de análisis
Tipo Descripción ¿Cuándo usarlo?
Respuesta completa Se codifica cada respuesta como un todo Cuestionarios cortos o muy directos
Frase Segmento delimitado por signo de puntuación Respuestas largas pero estructuradas
Unidad semántica Idea completa independientemente de la longitud Entrevistas, narrativa compleja
Párrafo Bloques textuales extensos Documentos institucionales o reflexiones largas
Turno de habla Intervención de un participante Grupos de discusión
Entrada de diario Texto de un día o entrada en un diario Diarios

Los LLM trabajan bien con cualquiera de estos niveles, pero requiere instrucciones explícitas para cada caso. Además, conviene distinguir si vas a:

  • codificar dentro de cada documento (segmentos/unidades de significado),

  • codificar el documento completo cuando la categoría se usa como atributo/variable del caso (p. ej., presencia de tema, tipo de documento, perfil del respondiente, etc.).

Ejemplos de instrucciones:

Instrucción para el LLM

Utiliza la frase como unidad de análisis y no dividas en unidades más pequeñas.

Identifica unidades de significado dentro de cada respuesta.

Trata cada respuesta completa como un caso y asigna variables/atributos a nivel de documento.

El papel del investigador en la interpretación.

Aunque los LLM pueden sugerir categorías, resumir, codificar y sintetizar, no comprenden el contexto educativo en el sentido profundo que requiere un análisis riguroso. El investigador aporta:

  • sensibilidad hacia el contexto institucional y sociocultural,

  • conocimiento teórico,

  • criterio para valorar pertinencia,

  • capacidad reflexiva para interpretar,

  • revisión crítica del trabajo del modelo.

El principio que se debe seguir siempre es el P1: el LLM propone y tú decides.

Diferencias entre análisis manual y asistido por LLM

El análisis manual y el asistido comparten principios metodológicos, pero difieren en ritmo y recursos. Frente al análisis manual, el asistido por LLM presenta las siguientes:

Ventajas

  • Reducción del tiempo de lectura inicial.

  • Identificación rápida de patrones preliminares.

  • Generación automática de propuestas de categorías.

  • Codificación ordenada en tablas.

  • Ayuda en la redacción de síntesis y borradores sobre los resultados.

  • Consistencia en el tratamiento de grandes volúmenes de texto.

Limitaciones

  • Riesgo de sobreinterpretación.

  • Categorías demasiado generales si no se ajustan.

  • Codificación mecánica sin matices.

  • Falta de sensibilidad hacia detalles de contexto.

  • Requiere supervisión constante y revisión transversal.

Recomendación: El análisis asistido por un LLM no reemplaza al análisis manual, sino que lo optimiza, lo hace más eficiente. La mejor práctica consiste en usar el LLM para acelerar tareas, proporcionar alternativas y generar estructura, mientras tú mantienes el control interpretativo.

Aquí tienes una tabla resumen.

Tabla 4. Diferencias entre análisis de contenido manual y análisis asistido por LLM
Dimensión Análisis manual Análisis asistido por LLM
Velocidad Lenta en corpus grandes Alta incluso con grandes volúmenes
Escalabilidad Limitada por tiempo humano Alta
Consistencia Puede variar entre sesiones Alta si las instrucciones son estables
Riesgo de sesgos Humanos explícitos Humanos + sesgos del modelo
Transparencia Alta si se documenta bien Requiere documentación explícita
Rol del investigador Codifica e interpreta Interpreta, valida y decide
Tipo de tareas Interpretativas y técnicas Técnicas aceleradas + supervisión humana

Ya tienes el mapa conceptual. Sabes qué es el análisis de contenido, cómo funciona un LLM en ese proceso y qué tipo de análisis vas a hacer. Ahora toca bajar al terreno: antes de pedirle nada al modelo, tienes que preparar tus datos. Si esta fase se hace bien, todo lo demás fluye. Si se hace mal, tarde o temprano tendrás que volver aquí. Vamos a la Parte II.

Parte II

Preparación

Preparar los datos y configurar el LLM antes de iniciar el análisis.
Capítulo 3

Preparación de los datos

  • Define las preguntas de investigación y los objetivos del estudio. → Cap. 1.1
  • Decide el enfoque del análisis: inductivo, deductivo o mixto. → Cap. 2.2
  • Identifica el tipo de corpus que vas a analizar y la unidad de análisis adecuada. → Cap. 2.3

La calidad del análisis asistido por un LLM depende inicialmente de la calidad de los datos que recibe el modelo. En este capítulo, te explico cómo recolectar, procesar y organizar los textos antes de pedirle a un LLM que los analice. Una preparación adecuada reduce errores, mejora la consistencia y permite aprovechar mejor sus capacidades.

Hay que evitar detectar errores en los datos durante el proceso de análisis. Si surgen, entonces, lo más habitual es que tengas que retroceder, corregirlos y rehacer parte del trabajo. Esto te hará perder tiempo y, muy probablemente, la serenidad. Así que dedica tiempo a depurar bien tus textos iniciales.

Recolección de datos: fuentes habituales en investigación educativa

En investigación educativa es habitual trabajar con diferentes tipos de texto. Antes de iniciar el análisis, conviene revisar su relevancia, su relación con las preguntas de investigación y valorar la conveniencia de incorporar información de contexto.

Los LLM pueden trabajar con cualquier tipo de texto, pero recuerda que en investigación educativa los materiales más comunes son:

  • Respuestas abiertas de cuestionarios (frecuentes en estudios de percepciones, competencias, satisfacción…).

  • Entrevistas semiestructuradas o grupos focales (transcritos).

  • Diarios de aprendizaje y reflexiones del alumnado.

  • Informes y documentos institucionales (p. ej., planes de centro, memorias de innovación).

  • Mensajes en plataformas educativas (foros, Moodle, Teams, chats…).

  • Producciones escritas del alumnado (ensayos, portafolios, comentarios).

Cada tipo de dato requiere decisiones específicas:

  • ¿Cuál será la unidad de análisis?

  • ¿Se segmentará en frases, párrafos, unidades semánticas?

  • ¿Se necesitan datos contextuales adicionales?

  • ¿Debe anonimizarse?

Limpieza y anonimización

Figura 3
Semáforo ético de seguridad de datos antes de cargarlos en un LLM
Figura 3. Semáforo ético de seguridad de datos antes de cargarlos en un LLM

Antes de usar un LLM es imprescindible:

A. Eliminar información personal o sensible.

  • nombres de estudiantes o docentes,

  • centros educativos,

  • teléfonos, direcciones,

  • identificadores directos,

  • datos de salud y

  • otra información de especial protección.

  • Si la presencia de ciertos datos es analíticamente relevante (por ejemplo, el rol de una persona), conviene sustituir ese dato por etiquetas, por ejemplo, Docente A, Alumno 3 o Centro X.

B. Corregir errores que dificulten la lectura del modelo

  • No es necesario corregir todo, pero sí lo que pueda impedir comprensión, como textos duplicados, líneas incompletas, saltos de página o formatos irrelevantes.

C. Unificar el formato

  • Aunque en esto no hay una norma única, estas son algunas recomendaciones de formato: texto plano o tabla simple, sin colores ni sangría y con caracteres estándar.

Tu Semáforo de Seguridad Ética.

Antes de subir cualquier dato a la plataforma, detente un segundo y comprueba en qué color estás. Recuerda que la privacidad es un principio obligatorio (P5):

🟢 VERDE (Adelante): Datos totalmente anonimizados (p. ej., "Participante 1"), documentos públicos de centros o textos donde has borrado cualquier rastro personal.
🟡 ÁMBAR (Precaución): Has sustituido nombres por roles (p. ej., "Docente A", "Madre B"). Es seguro, pero asegúrate de que el contexto de la respuesta no permita identificar a la persona indirectamente.
🔴 ROJO (¡Para!): El texto contiene nombres reales, correos, teléfonos o datos sensibles de salud o de menores sin procesar. Bajo ningún concepto los subas así a plataformas externas.
Caso AiRISES
Siguiendo el caso AiRISES, para construir nuestra base de datos, realizamos un scraping masivo de 8 años completos (2016-2023). Partimos de un "ruido" inicial de 13.328 registros que tuvimos que depurar. Aplicando nuestro Semáforo de Seguridad, eliminamos 754 duplicados y mensajes de menos de 25 palabras que no aportaban valor analítico. Un reto ético adicional fue la identificación del género: como investigadora, debes decidir si esta variable es relevante. En nuestro caso, descubrimos que los mensajes masculinos se concentran en áreas técnicas, mientras que los femeninos lo hacen en cuidados, lo que nos obligó a anonimizar con doble cautela para evitar sesgos de género en el análisis posterior.

Formatos recomendados

Los modelos trabajan bien con listas numeradas, bloques de texto delimitados (comas, tabuladores, …), tablas sencillas y párrafos claros. Es preferible evitar formatos complejos y priorizar el texto plano bien estructurado. La numeración de respuestas (R1, R2, R3…) facilita la trazabilidad durante la codificación.

Ejemplo para un bloque de datos:

ID RESPUESTA
R1 Creo que la competencia digital es importante para motivar a los estudiantes.
R2 Uso TIC, pero siento que me falta formación.
R3 La escuela no dispone de suficientes recursos tecnológicos.

Gestión por bloques de análisis

La mayoría de los modelos funcionan mejor cuando se evitan cargas excesivas. En lugar de enviar todo el corpus de una vez, puedes trabajar por bloques (por ejemplo, 50–200 respuestas breves o una entrevista completa). Usa nombres claros para cada bloque. Por ejemplo:

  • Bloque A: percepción sobre recursos digitales

  • Bloque B: formación docente

Si cargas muchos datos de una vez el modelo puede saturarse, perder contexto, generar categorías demasiado generales u olvidar instrucciones anteriores. Al hacerlo por partes, el LLM mantienen mejor el contexto, reduce problemas de longitud y permite ir refinando el sistema categorial de forma incremental.

Casos especiales: respuestas cortas, ruido y multilenguaje

Las respuestas muy cortas, el ruido, el multilenguaje y la ortografía deficiente pueden requerir decisiones específicas: marcarlas como no codificables, pedir al modelo que traduzca o que corrija solo ortografía sin alterar el contenido. Estas decisiones deben documentarse, pues afectan a la interpretación.

A. Respuestas muy cortas

  • Ejemplo: “Sí”, “No”, “Depende”, pueden ser respuestas insuficientes o no relevantes para la investigación. En ese caso una posible solución es:

Instrucción para el LLM

Detecta respuestas no codificables o insuficientes (como “Sí”, “No”, “Depende”) y agrúpalas en una categoría general llamada “Respuestas mínimas”, sin asignarles interpretación temática.

B. Ruido o textos irrelevantes

  • Pueden aparecer frases sueltas, respuestas en blanco, duplicados, … En estos casos, hay que eliminarlos antes del análisis o pedir al modelo que los marque como no analizables.

C. Datos en varios idiomas

  • Si se da este caso (no muy habitual), hay que tener en cuenta que el LLM puede procesarlos, pero conviene indicarlo explícitamente dando instrucciones como:

Instrucción para el LLM

Este conjunto contiene respuestas en español, inglés y catalán.

Instrucción para el LLM

No traduzcas nada y analiza cada respuesta en su idioma original.

Instrucción para el LLM

Traduce primero todo el corpus al español de forma literal y sin interpretar. No cambies el contenido.

D. Ortografía deficiente

Los modelos suelen manejarla bien, pero si afecta la comprensión debes dar instrucciones como:

Instrucción para el LLM

Reescribe estas respuestas corrigiendo solo ortografía y puntuación.


Capítulo 4

Configurar el LLM para el análisis de contenido

  • Recoge, limpia y anonimiza los datos. → Cap. 3
  • Aplica el semáforo de seguridad ética antes de cargar datos en plataformas externas. → Cap. 3.2
  • Organiza el corpus en bloques numerados y en formato legible para el LLM. → Cap. 3.3

Configurar correctamente un modelo de lenguaje es uno de los pasos más críticos del proceso. La calidad del análisis final depende en gran medida de cómo se prepara el modelo, qué instrucciones recibe y qué restricciones conceptuales se establecen desde el inicio.

Este capítulo contiene un conjunto de principios e instrucciones para configurar ChatGPT, Gemini, Claude u otros LLM de forma orientada a investigación educativa.

El “rol analítico” del LLM

Los LLM no poseen intencionalidad ni comprensión profunda; funcionan por predicción estadística (aunque no lo parezca). Por ello, para que el modelo actúe como aliado metodológico hay que asignarle un rol. En este caso, de asistente experto en análisis de contenido en investigación educativa, cuidadoso con la interpretación, respetuoso con los datos y atento a solicitar aclaraciones ante la ambigüedad.

El rol debe incluir:

  • competencia en análisis de contenido,

  • atención a instrucciones metodológicas,

  • énfasis en no inventar,

  • obligación de pedir aclaración ante ambigüedad,

  • respeto al idioma del corpus, criterios de transparencia y trazabilidad.

El rol se puede repetir al inicio de cada sesión o recordarlo periódicamente para mayor consistencia.

Prompt maestro: qué debe incluir

Es conveniente dar unas instrucciones de contexto y de actuación. El prompt maestro define el marco de trabajo: enfoque (inductivo, deductivo o mixto), estilo de respuesta, restricciones (no inventar, no generalizar más allá del corpus) y protocolos para señalar inconsistencias. Esta instrucción se debe utilizar al inicio de cada sesión o fase del análisis.

El prompt maestro es la configuración inicial que orienta toda la conversación. Es utilizable para, por ejemplo, ChatGPT, Gemini y Claude sin cambios significativos.

Dile al modelo:

A. El rol (como se vio en 4.1. )

Instrucción para el LLM

Actúa como asistente experto en análisis de contenido en investigación educativa. Tu función es ayudarme a explorar, categorizar y sintetizar datos textuales, siguiendo criterios de rigor académico. No inventes información. Solicita aclaraciones cuando sea necesario.

B. El marco metodológico

Instrucción para el LLM

Trabajaremos mediante un análisis de contenido inductivo/deductivo/mixto.

Sigue los pasos de exploración, categorización y síntesis que te indicaré.

C. El estilo de respuesta

Instrucción para el LLM

El estilo de la respuesta debe ser claro/estructurado/académico, pero no excesivamente técnico/técnico/con ejemplos/con citas textuales/ …

D. Restricciones

Instrucción para el LLM

No realices inferencias que no estén basadas en datos.

Si algo no puede determinarse, indícalo.

Instrucción para el LLM

No generalices más allá del corpus proporcionado.

E. Control de errores

Instrucción para el LLM

Si detectas inconsistencias, sesgos o tareas imposibles, señala el problema antes de continuar.

Gestión de versiones y memoria conversacional.

Figura 4
Configuración y gestión de sesiones del LLM a lo largo del análisis
Figura 4. Configuración y gestión de sesiones del LLM a lo largo del análisis

Los LLM funcionan mediante hilos o sesiones. Es recomendable separar sesiones por etapas (exploración, categorías, codificación, síntesis), repetir el prompt maestro cuando se abre un nuevo hilo y recordar siempre qué versión del sistema categorial se está utilizando. Guardar las salidas clave (versiones de categorías, tablas) es esencial para la trazabilidad.

Por ejemplo, crear sesiones separadas según fase:

  • Sesión 1: exploración inicial

  • Sesión 2: elaboración de categorías

  • Sesión 3: codificación

  • Sesión 4: síntesis e informe

Reglas para evitar pérdida de contexto:

  • Repetir el prompt maestro al inicio de cada sesión.

  • Indicar la versión del sistema categorial. Cargar únicamente los datos necesarios para cada tarea.

Instrucción para el LLM

Vamos a trabajar con el sistema de categorías versión 2.0 [adjuntar].

Guardar manualmente los outputs importantes:

  • lista de categorías,

  • tablas de codificación,

  • síntesis previas.

Mantener orden de carpetas y nombres:

  • Categorias_v1.docx

  • Categorias_v2.docx

  • Codificación_BloqueA.xlsx

Consejo de investigadora a investigadora: tu bitácora de investigación.

Para cumplir con el principio de trazabilidad (P3), no confíes solo en la memoria del chat. Te sugiero que abras un documento sencillo donde anotes:

Tabla 5. Bitácora de la investigación
Campo de registro Explicación para la investigadora Ejemplo de uso
Fecha y Modelo Registra el día exacto de la sesión y la versión específica del LLM. Esto es crucial porque las capacidades de los modelos evolucionan con gran rapidez. 14 de marzo, ChatGPT-5.
Descripción de la sesión Indica el contexto del "hilo" de conversación. Es importante saber si el modelo tiene memoria de pasos previos o si has empezado "de cero" para evitar sesgos acumulados.

Continúo analizando desde el punto donde lo dejé

Vuelvo a empezar el análisis del documento ID23

Instrucciones clave Documenta cualquier cambio o matiz que hayas introducido en tu prompt maestro. Si pegas aquí la instrucción exacta, podrás replicar el resultado meses después. Modifiqué la instrucción añadiendo “identifica ideas duplicadas”.
Observaciones Anota impresiones cualitativas sobre el desempeño del modelo o bloqueos conceptuales. Esto te ayudará a interpretar los datos sin desesperarte intentando recordar qué sucedió en esa sesión.

Hoy el modelo está especialmente creativo

Parece que se ha bloqueado con la categoría DOCENCIA

Fuentes de error y cómo mitigarlas

Entre los errores típicos se encuentran la sobreinterpretación, la creación de categorías excesivamente generales, la pérdida de instrucciones y la inconsistencia entre respuestas. Para mitigarlos se formulan restricciones claras, se recuerdan las reglas periódicamente y se pide al modelo que revise su propia coherencia.

Principales problemas y sugerencias para mitigarlos.

A. Sobreinterpretación o “alucinación”. Los modelos pueden generar inferencias no justificadas.

Instrucción para el LLM

No realices inferencias que no estén basadas en datos. Si no puedes determinar algo, indícalo.

B. Categorías demasiado generales. Instrucciones: pedir criterios de inclusión/exclusión y ejemplos textuales.

C. Pérdida de instrucciones. Pedir repetir prompt maestro periódicamente.

D. Inconsistencia entre respuestas. Instrucciones: pedir al modelo que revise su propia coherencia.

Instrucción para el LLM

Revisa si hay categorías aplicadas de forma inconsistente.

Identifica contradicciones y propón ajustes.

E. Ambigüedad en las unidades de análisis. Instrucciones: indicar explícitamente qué unidad utilizar.

F. Mezcla de idiomas. Instrucciones: dar indicaciones claras sobre traducción o no traducción.

Aquí tienes una tabla resumen.

Tabla 6. Fuentes de error en el uso de LLM y estrategias de mitigación
Fuente de error Descripción Riesgos Estrategia de mitigación
Instrucciones ambiguas Prompts poco claros o incompletos Codificaciones inconsistentes Redactar instrucciones explícitas y reutilizables
Sobreinterpretación Inferencias no presentes en los datos Pérdida de validez Prohibir interpretaciones externas
Alucinaciones Introducción de contenido inexistente Resultados inválidos Exigir citas textuales exactas
Categorías difusas Definiciones poco claras Solapamientos Refinar definiciones y criterios
Falta de control humano Aceptar resultados sin revisión Errores sistemáticos Revisar muestras y versiones
Variabilidad del modelo Cambios entre ejecuciones Baja reproducibilidad Documentar prompts y versiones

Uso de proyectos o espacios persistentes (ChatGPT Projects, NotebookLM, etc.)

Existen entornos de trabajo específicos dentro de los propios LLM, como ChatGPT Projects o NotebookLM, que te permiten organizar documentos, notas y conversaciones en un mismo lugar de forma permanente.

En el contexto del análisis de contenido asistido por LLM, estos espacios pueden funcionar casi como un cuaderno de investigación digital, donde puedes agrupar:

  • el corpus (respuestas abiertas, entrevistas, documentos);

  • los documentos metodológicos (diseño, protocolo de análisis, criterios de inclusión/exclusión, etc.);

  • las distintas versiones del sistema categorial;

  • notas de decisiones analíticas, registros de cambios y reflexiones;

  • tablas de codificación exportadas o resúmenes intermedios.

Su uso puede resultarte muy útil cuando el análisis es complejo, largo en el tiempo o implica diferentes tipos de documentos. Sin embargo, también introduce riesgos y limitaciones que es importante conocer y explicitar en la propia investigación. Tu decisión de usarlo o no debe basarse en el análisis de estas ventajas e inconveniente sobre tu proyecto concreto.

Ventajas

a) Centralización de la información del estudio

Un proyecto permite reunir en un único entorno:

  • el corpus (por ejemplo, todas las respuestas abiertas del cuestionario),

  • documentos de referencia (artículos clave, marco teórico, criterios de análisis),

  • la guía metodológica que se está siguiendo,

  • revisiones y versiones anteriores del sistema de categorías.

Esto reduce la dispersión típica de tener muchos archivos sueltos (Word, PDF, hojas de cálculo) y facilita que el modelo pueda “ver” el conjunto de documentos relevantes cuando interactúa con el investigador.

b) Mantenimiento de contexto entre sesiones

En una conversación “normal” con el modelo, el contexto se pierde o se fragmenta cuando se cierra la sesión o se supera el límite de mensajes. En cambio, los proyectos o notebooks mantienen:

  • la historia de interacciones,

  • los documentos adjuntos,

  • y, a menudo, un resumen persistente del contenido clave.

Esto hace posible retomar el análisis días o semanas después sin tener que volver a explicar todo desde cero, lo que resulta muy práctico para las personas que tenéis que combinar vuestra investigación con docencia u otras tareas.

c) Reducción de la repetición de instrucciones

Cuando se trabaja sin proyectos, hay que repetir en cada sesión:

  • el contexto del estudio,

  • las preguntas de investigación,

  • el tipo de análisis (inductivo, deductivo, mixto),

  • el rol del modelo (asistente en análisis de contenido),

  • las advertencias de “no inventar”, etc.

En un proyecto, gran parte de esta información se puede fijar al inicio y el modelo la tiene disponible como referencia recurrente. Esto ahorra tiempo y reduce el riesgo de olvidar alguna indicación importante.

d) Función de “cuaderno de investigación” digital

Un proyecto puede utilizarse como un espacio de registro metodológico, donde se van guardando:

  • decisiones sobre fusiones y divisiones de categorías;

  • versiones (v1.0, v2.0, v3.0) del sistema categorial;

  • justificaciones de cambios;

  • exploraciones descartadas, pero documentadas.

Aunque esto no sustituye al registro formal en un documento propio (por ejemplo, un diario de investigación o el apartado de método en tu informe de investigación), sí puede complementarlo y servir como borrador o repositorio de trabajo.

e) Búsqueda semántica dentro de los documentos

Algunos entornos permiten buscar fragmentos relevantes dentro de los documentos cargados, no solo por palabras clave, sino por significado. Esto puede ayudar a:

  • localizar rápidamente citas textuales que ejemplifiquen una categoría;

  • comprobar si un tema realmente aparece en el corpus o solo en la síntesis;

  • revisar cómo se utiliza un concepto concreto en diferentes partes del material.

En términos de análisis de contenido, esta función puede agilizar la recogida de evidencias para justificar hallazgos.

f) Soporte para análisis iterativos y complejos

En estudios extensos (por ejemplo, varias olas de recogida de datos, o varios grupos de participantes), el proyecto puede contener subcarpetas lógicas (por bloque, por fase, por grupo), lo que facilita mantener una visión global del análisis y permitir a el LLM moverse entre materiales relacionados sin que el investigador tenga que cargarlos uno por uno en cada mensaje.

Inconvenientes y riesgos

a) Riesgos de privacidad y protección de datos

Subir corpus educativos reales (respuestas de estudiantes, docentes, centros…) a una plataforma externa conlleva riesgos importantes:

  • posible tratamiento de los datos por parte del proveedor (OpenAI, Google, …);

  • almacenamiento en servidores externos;

  • potencial incumplimiento de la normativa de protección de datos, si no se toman medidas adecuadas.

Esto exige:

  • anonimizar rigurosamente los datos antes de subirlos;

  • revisar las políticas de privacidad y términos de uso de la plataforma;

  • seguir las normas éticas y legales de la institución y del proyecto de investigación.

Si el nivel de sensibilidad es alto (por ejemplo, datos de menores, salud, situaciones de vulnerabilidad), puede ser más prudente no usar este tipo de entornos o limitarse a materiales ya anonimizados y muy agregados.

b) Falsa sensación de “seguimiento inteligente”

El hecho de tener un “Proyecto” con muchos documentos puede crear la impresión de que el modelo tiene una especie de memoria profunda y estable del análisis, cuando en realidad:

  • sigue funcionando por generación de texto predictivo (siempre te dará una respuesta),

  • puede olvidar detalles relevantes,

  • y puede no respetar siempre la secuencia lógica de decisiones analíticas.

Podrías acabar confiando en exceso en que “el proyecto ya lo sabe todo” y dejar de verificar la coherencia metodológica. Es importante recordar que el proyecto es una ayuda organizativa, no un sustituto de tu razonamiento.

c) Dependencia tecnológica y problemas de acceso

Si todo el análisis (decisiones, versiones, evidencias) está concentrado en un único proyecto online, cualquiera de estas cosas puede afectar seriamente la continuidad del trabajo:

  • una incidencia técnica,

  • un cambio de condiciones del servicio,

  • la pérdida de acceso a la cuenta.

Por ello, es crucial exportar periódicamente información clave (sistemas categoriales, tablas, síntesis) a documentos locales bajo control del investigador. En general, es conveniente, necesario e, insisto, imprescindible hacer copias de seguridad diarias de todo lo relacionado con tu investigación (o con tu trabajo o con tus cosas personales). Supongo que no hará falta insistir en esto, pero pregunta a alguien que esté haciendo estas copias por haberlo aprendido por las malas (yo mismo). Apréndelo por las buenas.

d) Limitaciones de reproducibilidad

En términos académicos, la reproducibilidad se ve afectada porque:

  • otros investigadores no podrán replicar exactamente el mismo entorno de proyecto;

  • los modelos pueden cambiar de versión;

  • los resultados de un LLM pueden variar con el tiempo.

Esto no invalida su uso, pero obliga a ser más cuidadoso al documentar el procedimiento, las instrucciones, las versiones de los modelos y el contenido central del proyecto.

e) Riesgo de “caja negra” metodológica

Si gran parte del razonamiento y refinamiento se produce dentro del entorno de proyecto y no se registra de forma explícita en otros documentos, parte del proceso analítico puede volverse opaco (o depender totalmente de capturas de pantalla, históricos internos, etc.).

Esto va en contra de los principios de transparencia y verificabilidad de la investigación, por lo que hay que evitar que el proyecto sustituya al diario de investigación o a la sección formal del método en tu informe.

Recomendación

Los proyectos o espacios persistentes pueden ser muy útiles como herramienta de apoyo organizativo cuando el análisis requiere centralizar el corpus, guardar versiones del sistema categorial, mantener la coherencia entre sesiones y disponer de búsquedas rápidas dentro de los materiales cargados. Su uso es especialmente recomendable cuando el trabajo se desarrolla durante largos periodos, implica múltiples documentos o requiere recuperar fácilmente decisiones previas.

No obstante, estos entornos no debes emplearlos como repositorio principal del análisis ni como sustituto del registro metodológico formal. Debes mantener las recomendaciones dadas, como exportar periódicamente los productos analíticos clave (categorías, tablas, síntesis) y registrar por escrito, fuera del entorno del proyecto, las decisiones metodológicas más importantes. Los espacios persistentes pueden complementar el trabajo del investigador, pero no reemplazar los registros documentales exigidos por un análisis de contenido.

Y, muy importante, recuerda que antes de usar un espacio persistente conviene hacerse tres preguntas:

  • ¿el corpus está completamente anonimizado?,

  • ¿la investigación se desarrollará durante un periodo largo con múltiples documentos?,

  • ¿la institución autoriza el uso de estas plataformas?

Si alguna respuesta es negativa, es preferible limitar su uso o trabajar con otras opciones.

Con los datos preparados y el modelo configurado, estás en condiciones de empezar el análisis propiamente dicho. A partir de aquí el trabajo se vuelve más iterativo: explorarás, propondrás categorías, las refinarás y volverás a empezar cuantas veces haga falta. Es normal. Así funciona un buen análisis de contenido, con o sin LLM. La Parte III te acompaña en cada uno de esos ciclos.

Parte III

Análisis

Exploración, construcción del sistema de categorías, codificación y validación.
Capítulo 5

Análisis exploratorio inicial

  • Configura el LLM con el prompt maestro y asígnale el rol analítico. → Cap. 4
  • Prepara los datos divididos en bloques para enviarlos progresivamente. → Cap. 3.4
  • Nota: en esta fase no necesitas un sistema de categorías todavía. Solo vas a explorar.

El análisis exploratorio es la primera toma de contacto sistemática con tus datos, el corpus. Su objetivo no es construir categorías finales, sino comprender el terreno, identificar posibles patrones y orientar la fase de categorización. Esta fase se beneficia de forma especial de la rapidez y la síntesis que aportan los LLM.

Cómo presentar los datos al LLM

La forma en que se introducen los datos influye en la calidad del análisis. Los bloques de datos deben delimitarse con claridad, usando numeración estable y marcadores de inicio/fin. Es útil indicar brevemente de qué trata el bloque y qué se espera del modelo (por ejemplo, quiero un análisis exploratorio y sin categorías definitivas).

Algunas recomendaciones:

  • Usar bloques claros y limpios

R1: [respuesta]

R2: [respuesta]

R3: [respuesta]

  • Incluir un encabezado estable y consistente

Instrucción para el LLM

A continuación, tienes un conjunto de respuestas sobre [tema].
Analiza únicamente este bloque.

  • Delimitar el texto. Utilizar triple tilde o triple comilla facilita que el modelo identifique el corpus:

<<< R1[respuesta] / R2[respuesta]>>>

  • Evitar instrucciones múltiples o ambiguas. Por ejemplo, no pedir a la vez resúmenes, categorías y codificación.

Solicitar resúmenes, patrones y posibles temas

En la fase exploratoria se pide al modelo que sintetice las ideas principales, identifique entre cinco y diez patrones preliminares (dependiendo del tipo de datos) y aporte citas representativas. Esto permite obtener una primera visión del corpus sin comprometer aún un sistema categorial estable.

En esta fase se recomienda comenzar por tareas descriptivas simples:

Instrucción para el LLM

Aquí tienes un conjunto de respuestas sobre [tema]. Para un análisis exploratorio preliminar quiero un resumen general de las ideas principales (5–7 líneas).

[Esperar respuesta]

Instrucción para el LLM

Ahora, quiero entre 5 y 10 temas o patrones preliminares con ejemplos textuales breves que representen cada patrón. No generes categorías definitivas, solo patrones.

Caso AiRISES
Siguiendo el caso AiRISES, ¿cuándo y qué información buscan realmente los estudiantes? Al pedirle al LLM que identificara patrones temporales, descubrimos que agosto es un mes crítico de actividad en foros. ¿Por qué? Porque las instituciones están cerradas y los estudiantes se sienten “huérfanos” de orientación oficial. Además, el análisis exploratorio nos reveló un patrón inesperado: la FP no siempre se ve como una "pasarela" a la universidad. De hecho, más del 50% de los mensajes sobre universidad no mencionan la prueba de acceso, sugiriendo que muchos estudiantes de FP ven su título como una vía con identidad propia y no solo un trámite. Como investigadora, estas ideas exploratorias son las que guiarán tus preguntas definitivas.

Identificación rápida de principios interpretativos

Además del resumen y los patrones, es útil pedir al modelo que identifique:

  • preocupaciones recurrentes,

  • actitudes positivas/negativas,

  • factores facilitadores y barreras,

  • elementos inesperados, preguntas que los datos plantean.

Instrucción para el LLM

Identifica:
- facilitadores,
- barreras,
- emociones dominantes,
- necesidades expresadas,
- ideas minoritarias pero relevantes.

Esto permite orientar el análisis hacia dimensiones interpretativas sin fijar todavía categorías.

Posibles errores en esta fase

Los LLM pueden cometer errores en esta etapa si no reciben una orientación adecuada.

En primer lugar, es habitual que el modelo confunda los patrones emergentes con categorías definitivas. Esto sucede porque los LLM tienden a organizar la información de manera estructurada, incluso cuando esa estructura aún no ha sido validada. Para evitarlo, es importante especificar de forma explícita que se buscan observaciones preliminares y no categorías consolidadas.

Un segundo problema es la tendencia a sobregeneralizar. Los modelos, al trabajar con grandes corpus de entrenamiento, suelen proponer afirmaciones amplias o abstractas. La manera más eficaz de controlar este riesgo es exigir siempre que cualquier afirmación venga acompañada de citas textuales exactas del corpus, de modo que el análisis se mantenga anclado en los datos reales.

En tercer lugar, pueden aparecer interpretaciones externas no justificadas en los datos. Los LLM, por su naturaleza generativa, pueden incorporar inferencias basadas en asociaciones comunes o en patrones lingüísticos habituales, pero que no están presentes en el corpus analizado. Este problema se puede mitigar indicando de manera explícita que el modelo no debe interpretar más allá de lo que está claramente expresado en las respuestas.

En cuarto lugar, se pueden mezclar temas o dimensiones analíticas de distinta escala. Por ejemplo, el modelo puede combinar emociones individuales con barreras institucionales, generando patrones que carecen de coherencia conceptual. Para prevenir este tipo de confusiones, es recomendable pedir que los patrones se organicen con un nivel analítico claramente definido (por ejemplo: personal, institucional, pedagógico, etc.).

Por último, los LLM tienden a sugerir relaciones causales incluso cuando no están respaldadas por los datos. Estas inferencias suelen surgir porque los modelos están entrenados para completar narrativas plausibles, pero que no necesariamente reflejan el contenido del corpus. Para evitar este problema, debe indicarse expresamente que quedan prohibidas las inferencias causales no justificadas y que solo deben describirse elementos que aparezcan de manera explícita en los textos analizados.

Antes de cerrar el ordenador cada día (y descansar), para que mañana puedas retomar el trabajo sin sobresaltos:

  • Copia de seguridad. ¿Has exportado la última tabla a un Excel o Word local?

  • Enlace del chat. Guarda el enlace o el PDF de la conversación actual.

  • Revisa tu cuaderno de investigación. ¿Has anotado todas tus decisiones?

  • Ya puedes terminar tu sesión de trabajo con tranquilidad

El error: tratar los patrones preliminares como categorías definitivas.

Por qué pasa: los LLM tienden a estructurar la información incluso cuando se les pide solo explorar.

Cómo evitarlo: indica explícitamente en el prompt que no quieres categorías definitivas todavía. Trata las propuestas como hipótesis provisionales.

Capítulo 6

Construcción del sistema de categorías

  • Completa el análisis exploratorio y prepara una lista de patrones o temas preliminares. → Cap. 5
  • Confirma el enfoque del análisis (inductivo, deductivo o mixto). → Cap. 2.2
  • Si tu análisis es deductivo: ten preparado el marco teórico o el sistema previo de categorías para proporcionárselo al LLM.

El sistema de categorías es el corazón del análisis de contenido. En esta etapa se pasa de patrones preliminares a una estructura analítica organizada y útil para la codificación y la interpretación. Los LLM pueden acelerar este proceso, pero el investigador debe ejercer un control riguroso para garantizar claridad, pertinencia y coherencia.

Criterios académicos para un buen sistema de categorías

Con LLM o sin LLM, un sistema de categorías debe cumplir una serie de criterios que garantizan su validez, su utilidad analítica y su coherencia interna y externa.

  • Adecuación al objetivo de investigación.

El sistema debe estar directamente vinculado a las preguntas y propósitos del estudio. Las categorías no deben ser genéricas, sino relevantes para lo que se pretende comprender o explicar.

  • Exhaustividad.

El conjunto de categorías debe permitir clasificar todos los temas significativos presentes en los datos. Un sistema exhaustivo evita lagunas y asegura que el análisis capture la diversidad del corpus.

  • Exclusividad.

Las categorías deben ser conceptualmente distintas y mutuamente excluyentes entre sí, de modo que cada una represente un significado claramente diferenciado. Esto no implica que una respuesta completa solo pueda vincularse a una única categoría cuando la codificación se realiza por segmentos: una misma respuesta puede contener varios segmentos y cada segmento puede corresponder a una categoría diferente.

Del mismo modo, cuando las categorías se utilizan como atributos o variables a nivel de documento o caso (por ejemplo, presencia o ausencia de un tema, tipo de respuesta, perfil analítico del respondiente), la exclusividad se aplica a la definición de las categorías, no al número de atributos que pueda presentar un mismo documento. Un mismo caso puede presentar varios atributos, siempre que estos estén claramente definidos y no se solapen conceptualmente.

En ambos usos, lo fundamental es que las categorías no compitan entre sí por el mismo tipo de contenido. Un sistema categorial bien construido evita redundancias, reduce la dispersión y facilita interpretaciones consistentes y comparables.

  • Claridad conceptual.

Cada categoría debe tener un nombre preciso, una definición clara y criterios que orienten su aplicación. Los elementos incluidos en cada categoría deben compartir esa definición y deben funcionar como un concepto cohesionado, no como un conjunto heterogéneo de ideas. Esta claridad facilita la reproducibilidad y reduce ambigüedades en la interpretación.

  • Anclaje en ejemplos textuales.

El uso de fragmentos representativos del corpus, como ejemplos de pertenencia, ayuda a delimitar qué entra y qué no en cada categoría. Los ejemplos fortalecen la comprensión, la transparencia y la validez del sistema.

Inductivo: generación de categorías desde los datos

Desde un enfoque inductivo, el LLM puede proponer categorías emergentes a partir del corpus. El investigador revisa esas propuestas, depura términos ambiguos, unifica duplicados y adapta el sistema a la realidad teórica y contextual del estudio.

Los LLM pueden ayudar a generar listas preliminares de categorías, agrupaciones, resúmenes de significados o descriptores operativos.

Instrucción para el LLM

A partir del siguiente bloque de datos, genera un sistema de categorías inicial.
Para cada categoría incluye:
- nombre breve,
- descripción clara,
- criterios de inclusión,
- criterios de exclusión,
- 2 o 3 citas textuales representativas.
No generes temas superiores todavía.

Deductivo: aplicar categorías preexistentes

Cuando se trabaja con marcos conceptuales previos, el modelo se utiliza para aplicar categorías ya definidas. Se le proporciona la lista de categorías y se le pide que clasifique cada respuesta, siempre con justificación explícita basada en el texto. En el análisis deductivo, las categorías proceden de literatura previa, modelos teóricos, rúbricas, cuestionarios, etc.

Instrucción para el LLM

Estas son las categorías predefinidas.
Revísalas brevemente y confirma que las comprendes.
[CATEGORÍAS AQUÍ]
Después clasifica cada respuesta dentro de una o varias categorías, siempre con justificación textual.

El LLM debe aprender el sistema, no crearlo.

Un caso especial de codificación deductiva: uso de diccionarios léxicos (lexicón controlado)

Figura 5
Comparación entre lexicón controlado y codificación semántica
Figura 5. Comparación entre lexicón controlado y codificación semántica

Dentro del enfoque deductivo, puede darse una situación particular en la que la asignación de categorías no requiera una interpretación semántica compleja, sino que pueda apoyarse en la presencia explícita de determinados términos o expresiones. Se trata de aquellos casos en los que ciertos elementos léxicos actúan como indicadores inequívocos de una categoría previamente definida, lo que permite implementar una codificación deductiva basada en diccionarios o lexicones construidos ad hoc.

Este procedimiento constituye un caso especial del enfoque deductivo, ya que parte de un sistema de categorías cerrado, validado teóricamente y definido con criterios operativos claros. A diferencia de la codificación inductiva, no busca identificar temas emergentes, ni ampliar el sistema categorial, sino operacionalizar categorías existentes mediante reglas explícitas de decisión.

En el marco del análisis de contenido asistido por LLM, el uso de diccionarios léxicos no debe entenderse como un análisis puramente léxico ni como un sustituto de la interpretación semántica, sino como un mecanismo complementario, especialmente adecuado para determinadas dimensiones estructurales del contenido. En el proyecto AiRISES, este enfoque se aplicó, por ejemplo, a dimensiones como las etapas o niveles educativos, donde la mención explícita de términos como “universidad”, “bachillerato”, “Educación Secundaria” o “Formación Profesional de Grado Superior” permite una asignación directa y robusta de la categoría correspondiente, con un margen mínimo de ambigüedad interpretativa. Piénsalo como un "atajo seguro": si en el texto aparece "Bachillerato", la categoría es "Bachillerato", sin más vueltas.

La construcción del lexicón se realiza a partir del sistema de categorías ya definido, asociando a cada categoría un conjunto finito de términos, variantes y expresiones equivalentes. Este recurso actúa como una regla deductiva formalizada, de modo que la aparición de uno de los términos del diccionario activa la codificación de la categoría correspondiente. La selección de términos se apoya en el conocimiento experto del dominio, en la revisión del corpus y, cuando procede, en iteraciones previas de análisis asistido por LLM.

Desde el punto de vista metodológico, esta estrategia cumple una doble función. Por un lado, permite incrementar la precisión de la codificación en categorías donde los indicadores son explícitos y normativos, reduciendo el riesgo de falsos negativos. Por otro, proporciona un criterio de contraste para evaluar la codificación realizada mediante LLM o por codificadores humanos, facilitando la detección de inconsistencias, omisiones sistemáticas o problemas en las definiciones operativas.

Conviene subrayar que este caso especial de codificación deductiva no debe aplicarse de forma indiscriminada. Su uso es apropiado únicamente cuando existe una correspondencia clara y estable entre términos y categorías. En dimensiones más interpretativas —como actitudes, emociones, valoraciones o intenciones— la codificación semántica asistida por LLM resulta más adecuada. En consecuencia, el enfoque propuesto en esta guía apuesta por un modelo híbrido, en el que la codificación deductiva basada en lexicón y la interpretación semántica asistida por IA se combinan de forma estratégica, en función de la naturaleza de cada dimensión analítica.

La siguiente tabla presenta un ejemplo simplificado de lexicón utilizado para la codificación deductiva de la dimensión etapa o nivel educativo. En este caso, cada categoría se asocia a un conjunto reducido de términos y expresiones cuya presencia en el texto se considera indicador inequívoco de la categoría correspondiente. El lexicón se construye a partir del sistema de categorías previamente definido (niveles educativos) y actúa como regla formal de decisión, de modo que la aparición de cualquiera de los términos listados activa automáticamente la codificación de la categoría, sin necesidad de interpretación semántica adicional.

Tabla 7. Ejemplo de lexicón
Categoría / dimensión Definición operativa Términos y expresiones del lexicón (no exhaustivo)
Educación Secundaria Referencias explícitas a la etapa de Educación Secundaria Obligatoria o equivalente, con independencia del contexto narrativo del mensaje. secundaria, ESO, instituto, 4º ESO, 3º ESO
Bachillerato Menciones directas a la etapa de Bachillerato o a cursos que la integran. bachillerato, bachiller, 1º bach, 2º bach, selectividad (cuando se refiere al contexto de bachillerato)
Formación Profesional Referencias explícitas a la Formación Profesional reglada, sin especificación de nivel. FP, formación profesional, ciclo formativo
FP Grado Medio Menciones directas a ciclos formativos de grado medio. grado medio, FP medio, CFGM
FP Grado Superior Menciones directas a ciclos formativos de grado superior. grado superior, FP superior, CFGS
Universidad Referencias explícitas a la educación universitaria, independientemente del tipo de titulación. universidad, uni, estudios universitarios, campus
Grado universitario Menciones directas a estudios de grado. grado, carrera, licenciatura, diplomatura
Posgrado Referencias explícitas a estudios de posgrado. máster, postgrado, doctorado, doctorado

Recuerdo que la presencia de cualquiera de los términos incluidos en el lexicón activa automáticamente la codificación de la categoría correspondiente. Este procedimiento se aplica únicamente a dimensiones en las que los términos funcionan como indicadores inequívocos y no excluye la posibilidad de que un mismo mensaje sea codificado en múltiples categorías.

Si quieres que el LLM aplique este diccionario de forma automática y rígida, puedes usar esta instrucción que te ahorrará mucho tiempo de revisión manual:

Instrucción para el LLM

Actúa como asistente técnico. Te proporciono un lexicón (diccionario de términos) vinculado a un sistema de categorías deductivo.
Tu regla de decisión es simple: si en el texto aparece alguno de los términos del lexicón, asigna automáticamente la categoría correspondiente. No realices interpretaciones semánticas profundas; cíñete a la presencia explícita de las palabras.
[INSERTAR TABLA DEL LEXICÓN AQUÍ, como la del ejemplo de la Tabla 7]
Devuelve los resultados en una tabla de codificación donde aparezca: ID de la respuesta, términos detectados y categoría asignada.

Un consejo: antes de lanzar el lexicón a todo el corpus, haz una prueba con 10 o 20 respuestas. Si ves que el modelo se confunde (por ejemplo, alguien dice "mi hermano está en la universidad" pero ella habla de su experiencia en FP), ajusta el prompt para que distinga el contexto del sujeto.

La aplicación de estas categorías podría dar lugar a una tabla como la siguiente en donde el 1 indica la presencia de la categoría en la unidad de análisis (por ejemplo, en un mensaje).

Tabla 8. Ejemplo de tabla de codificación de documentos
IDEd.SecundariaBachilleratoFPFP Grado MedioFP Grado SuperiorUniversidadGradoPosgrado
DOC110101111
DOC211101111
DOC300101111
DOC400100111
DOC510111111
DOC610110111
DOC711111111
DOC811110111
DOC911101111
Caso AiRISES
Siguiendo el caso AiRISES, para analizar la FP, no podíamos dejar que el LLM decidiera libremente. Creamos un lexicón controlado basado en las 26 familias profesionales del catálogo nacional. Esto nos permitió clasificar automáticamente el 67% de los mensajes en categorías precisas como "Informática y Comunicaciones" (la más preguntada, con un 41%) o "Sanidad" (12%). Sin embargo, para entender las habilidades blandas (soft skills) o la crítica al sistema educativo, tuvimos que abandonar el diccionario y pasar a una codificación inductiva, permitiendo que el modelo detectara la tensión que sienten los graduados entre la formación teórica y la demanda real de las empresas. Recuerda que este es un modelo híbrido. El lexicón es fantástico para lo estructural (quién habla, desde qué nivel), pero para analizar actitudes, emociones o valoraciones, debes volver a la codificación semántica asistida que explicamos en el Capítulo 8, porque ahí es donde tu mirada interpretativa y la capacidad del LLM para entender el contexto son insustituibles.

Mixto: plantilla + categorías emergentes

En muchos estudios se combinan categorías preexistentes con otras nuevas que surgen de los datos. El modelo puede añadir categorías cuando detecta contenidos que no encajan en la plantilla, explicando por qué y proponiendo definiciones. El enfoque mixto combina lo mejor de ambas estrategias.

Instrucción para el LLM

Utiliza este sistema de categorías como plantilla base.
[CATEGORÍAS AQUÍ]
Añade nuevas categorías si aparecen ideas que no encajan.
Para cada categoría añadida:
- explica por qué no encaja en las categorías previas,
- aporta su definición,
- incluye un ejemplo textual.

Este enfoque es habitual en estudios complejos o con múltiples fuentes de datos. En todo caso, es recomendable utilizar la estrategia inductiva, con el fin de asegurarse de que el sistema propuesto es exhaustivo o de que el corpus utilizado propone modificaciones a los marcos existentes. Ambas situaciones son metodológicamente relevantes.

Cómo pedir al LLM descripciones claras, inclusiones, exclusiones y ejemplos

Para evitar categorías vagas, se le debe pedir al LLM que proporcione para cada categoría una descripción precisa, criterios de inclusión y exclusión y ejemplos textuales. También se controla el número total de categorías para mantenerlas manejables. Los modelos suelen generar categorías demasiado generales si no se les guía.

Instrucción para el LLM

Reformula cada categoría para que cumpla:1) Nombre claro y no ambiguo.
2) Descripción precisa con una sola idea central.
3) Criterios de inclusión.
4) Criterios de exclusión.
5) Ejemplos textuales reales del corpus.
Si alguna categoría no es consistente, propón ajustes.

Trucos útiles:

  • Pedir que evite sinónimos vagos: “motivación”, “actitud”, “recursos”, … sin especificar.

  • Solicitar exclusiones explícitas: Incluye X pero no Y.

  • Restringir el número de categorías (p. ej., entre 6 y 12).

Comparación entre sistemas generados manualmente y por un LLM

Los sistemas generados por IA suelen ser más generales; los construidos por investigadores tienden a una mayor especificidad. La combinación de ambos enfoques permite aprovechar la capacidad de procesamiento y síntesis de un LLM sin renunciar a la profundidad conceptual.

El LLM tiende a:

  • generar categorías más generales,

  • agrupar bajo conceptos amplios,

  • proponer nombres más neutros.

El investigador tiende a:

  • generar categorías más específicas,

  • matizar diferencias conceptuales,

  • ajustar el sistema al marco teórico.

Sugerencia de proceso:

  1. El LLM genera una primera versión (v1.0).

Produce un borrador de categorías a partir del corpus inicial.

  1. La investigadora revisa y ajusta.

Refina el sistema: elimina redundancias, fusiona categorías, aclara definiciones y añade criterios.

  1. El LLM genera la versión revisada (v2.0).

Integra las modificaciones y reorganiza el sistema según las indicaciones.

  1. La investigadora valida el funcionamiento.

Comprueba que las categorías son claras, distintas y aplicables al corpus.

  1. Un segundo LLM realiza una revisión crítica (recomendable).

Ofrece ventajas, problemas y mejoras del sistema categorial, actuando como revisor independiente.

El error: aceptar categorías demasiado generales sin criterios de exclusión.

Por qué pasa: los LLM proponen términos amplios sin especificar qué queda fuera.

Cómo evitarlo: exige criterios de inclusión y de exclusión, además de ejemplos textuales reales del corpus.

Capítulo 7

Refinamiento y validación del sistema de categorías

  • Genera un sistema de categorías versión 1.0 (con LLM, manualmente o combinando ambos). → Cap. 6
  • Comprueba que cada categoría tiene, al menos, nombre y descripción provisional.
  • ⚠ Aviso: no codifiques el corpus completo hasta terminar este capítulo. La validación del sistema es previa a la codificación masiva.

Una vez construida la versión inicial del sistema de categorías, es imprescindible revisarla y mejorarla antes de utilizarla para codificar todo el corpus. Esta fase, a menudo subestimada, es donde se garantiza la calidad, coherencia y utilidad analítica del sistema. No te la saltes. Tenemos que buscar la coherencia externa (es decir, que una categoría no se parezca tanto a otra que termines lanzando una moneda al aire para decidir cuál de las dos usar). Los LLM pueden ayudar a detectar incoherencias y proponer mejoras, pero la validación final debe ser siempre tuya.

Fusiones, divisiones y nivel de abstracción

En el refinamiento se detectan categorías demasiado amplias, redundantes o ambiguas. Se decide si deben dividirse, fusionarse o renombrarse. El objetivo es lograr un sistema categorial consistente y útil.

Este es el sistema de categorías versión 1.0.

Instrucción para el LLM

Analiza la coherencia interna y externa e identifica:
1. Categorías demasiado amplias.
2. Categorías redundantes o solapadas.
3. Nombres ambiguos.
4. Diferencias de nivel conceptual.
5. Categorías innecesarias o irrelevantes.
Proporciona propuestas concretas de mejora.

Coherencia interna y externa

El sistema categorial debe funcionar como un mapa conceptual lógico.

Coherencia interna - Cada categoría debe tener una idea central clara, criterios bien definidos, límites precisos y ejemplos textuales consistentes.

Coherencia externa - Las categorías deben diferenciarse claramente entre sí, no solaparse, no contradecirse y tener un nivel de generalidad comparable.

Instrucción para el LLM

Revisa el sistema categorial y responde:
- ¿Qué categorías están mal delimitadas?
- ¿Qué categorías son demasiado similares?
- ¿Qué categorías deberían agruparse bajo un tema superior?
- ¿Qué categorías carecen de ejemplos claros?
- Sugiere mejoras justificadas.

Ayudas del LLM para detectar ambigüedades

Se puede pedir al LLM que actúe como crítico metodológico, identificando debilidades conceptuales y proponiendo alternativas de agrupación. También es posible realizar pruebas de estrés aplicando el sistema a fragmentos especialmente complejos. Los modelos pueden detectar problemas que al investigador se le escapan debido a la cercanía y cantidad de datos.

Solicitar análisis crítico.

Instrucción para el LLM

Actúa como crítico metodológico.
¿Qué debilidades conceptuales encuentras en este sistema de categorías?
Proporciona observaciones específicas basadas en definiciones, criterios y ejemplos.

Solicitar alternativas conceptuales.

Instrucción para el LLM

Propón 2 o 3 formas alternativas de agrupar estas categorías.

Solicitar pruebas de estrés.

Instrucción para el LLM

Evalúa este sistema aplicándolo a los siguientes 5 segmentos.
Detecta dónde fallan las definiciones y justifica por qué.

Estas pruebas sirven para comprobar si las categorías funcionan realmente.

Ejemplo de evolución en versión 1.0 → 2.0 → 3.0

Figura 6
Ciclo de construcción y refinamiento del sistema de categorías (v1.0 → v3.0)
Figura 6. Ciclo de construcción y refinamiento del sistema de categorías (v1.0 → v3.0)

Versión 1.0 (IA inductiva inicial)

  1. Falta de formación

  2. Escasez de recursos

  3. Motivación por aprender

  4. Uso de tecnología

  5. Apoyo institucional

Problemas detectados:

  • Categoría 4 demasiado amplia.

  • Categoría 1 y 3 muy próximas pero diferentes.

  • Falta de precisión en descriptores.

Versión 2.0 (tras revisión humana + LLM)

  1. Carencias formativas personales

  2. Recursos tecnológicos insuficientes

  3. Disposición individual al aprendizaje digital

  4. Limitaciones del centro para integrar tecnología

  5. Estrategias de autoformación y apoyo entre pares

Mejoras en v2.0:

  • Categorías más específicas.

  • Diferenciación clara entre nivel personal e institucional.

Versión 3.0 (sistema final depurado)

Nivel personal

  1. Carencias formativas personales

  2. Disposición individual al aprendizaje

  3. Estrategias de autoformación

Nivel institucional

  1. Recursos tecnológicos insuficientes

  2. Limitaciones organizativas para integrar tecnología

Ventajas de v3.0:

  • Nivel conceptual consistente.

  • Claridad en los límites entre categorías.

  • Mayor utilidad para la codificación y la interpretación.

Documentación de decisiones metodológicas

Es recomendable generar un registro de decisiones que recoja cómo ha evolucionado el sistema, qué cambios se han hecho y por qué. El LLM puede ayudar a redactar este registro a partir de las distintas versiones. La trazabilidad es esencial para garantizar la credibilidad del análisis.

Se recomienda registrar:

  • versión inicial del sistema (v1.0),

  • críticas del LLM,

  • revisión humana,

  • versión mejorada (v2.0),

  • motivos para fusiones o divisiones,

  • criterios finales,

  • versión final utilizada (v3.0).

Se puede pedir al LLM:

Instrucción para el LLM

Genera un registro de decisiones basado en estas revisiones.

Incluye versiones, cambios y justificaciones metodológicas.

Este registro será útil para:

  • el método de la investigación,

  • anexos,

  • revisiones por pares,

  • triangulación con otros analistas.


El error: saltarse el refinamiento y codificar directamente con la versión 1.0.

Por qué pasa: el sistema inicial casi siempre tiene solapamientos y definiciones imprecisas.

Cómo evitarlo: aplica el sistema a 5–10 segmentos reales antes de usarlo en masa.

Capítulo 8

Codificación asistida

  • Valida y refina el sistema de categorías hasta la versión 2.0 o superior. → Cap. 7
  • Verifica que cada categoría tiene nombre, definición, criterios de inclusión, criterios de exclusión y ejemplos textuales.
  • Organiza los datos en bloques numerados y anonimizados. → Cap. 3.4
  • Prepara el prompt maestro para la sesión de codificación. → Cap. 4.2

Llegamos a la parte que suele darnos más dolor de cabeza: la codificación. Pero no te preocupes, aquí es donde el LLM realmente nos va a ahorrar esas horas de mirar y mirar una tabla hasta que las palabras pierden el sentido. La codificación es el proceso mediante el cual se asignan categorías a unidades de análisis. Normalmente esto implica codificar segmentos de texto dentro de cada documento, pero en algunos estudios también se codifica el documento completo cuando ciertas categorías operan como atributos/variables del caso (por ejemplo, presencia/ausencia de un tema, tipo de documento, o características analíticas del respondiente).

Con la ayuda de un LLM, este proceso puede organizarse de forma mucho más rápida y ordenada, siempre que el sistema categorial esté bien definido y que las instrucciones sean muy precisas. En el Capítulo PARTE II. se explica cómo preparar los datos, algo que debes revisar ahora. Hay que recordar que, antes de codificar, se organizan los textos en bloques numerados y se recuerda al modelo qué versión del sistema categorial debe utilizar. Además, los bloques no deben ser excesivamente grandes para evitar saturar el contexto del LLM.

Ahora se explica cómo solicitar codificación en tabla, cómo validar la calidad de la codificación y cómo evitar errores frecuentes.

Cómo pedir tablas de codificación claras y justificadas

Figura 7
Flujo completo de la codificación asistida y su control de calidad
Figura 7. Flujo completo de la codificación asistida y su control de calidad

Las tablas con los resultados suelen incluir columnas de texto, categoría(s) y justificación. El investigador especifica el formato deseado y si se permite asignar varias categorías a un mismo fragmento. Se insiste en que la justificación se base en citas exactas.

Instrucción para el LLM

Codifica cada respuesta según el sistema de categorías versión 2.0.
Devuelve la salida en forma de tabla con columnas:
1. Texto (resumen breve de la respuesta o la respuesta completa)
2. Categoría(s) asignada(s)
3. Justificación textual basada en segmentos del corpus
No inventes citas. Si una respuesta no encaja en ninguna categoría, indícalo.
[Opcional: exigir una sola categoría]
Asigna solo la categoría más relevante a cada respuesta.
[Opcional: permitir múltiples categorías]
Una respuesta puede incluir varias categorías si está justificado.

Si, en lugar de codificar segmentos, lo que necesito es codificar atributos/variables a nivel de documento, devuelve una tabla (o matriz) por casos donde cada fila sea una respuesta/documento y las columnas sean atributos (por ejemplo: presencia de X = 1/0), indicando brevemente el criterio para marcar 1.

Cómo gestionar grandes volúmenes de datos

Hay que recordar que, en estudios con muchos casos, se trabaja por bloques (ver apartado PARTE II. 3.4. ) y se guardan las tablas parciales. Debe guardarse cada bloque como un archivo independiente.

Es importante mantener un contexto metodológico estable recordando instrucciones clave y evitando cambiar los criterios a mitad del proceso. Para ello, debe establecerse un contexto permanente. Se sugiere que se repita siempre:

  • Prompt maestro

  • Sistema categorial (versión actual)

  • Unidad de análisis

  • Formato de salida

Insistir periódicamente en:

  • No generes categorías nuevas.

  • No infieras significados no presentes en los datos.

Recuerda que es necesario tener guardadas todas las instrucciones que se den en un documento externo (y aprovecho para insistir en que hagas copias de seguridad).

El error: no especificar la unidad de análisis en la instrucción al LLM.

Por qué pasa: sin instrucción explícita, el LLM decide libremente cómo segmentar.

Cómo evitarlo: incluye siempre la unidad de análisis en el prompt y verifica en la revisión manual.

Capítulo 9

Validación y control de calidad

  • Codifica al menos un bloque del corpus con el LLM. → Cap. 8
  • Exporta las tablas de codificación a archivos locales antes de continuar.
  • ⚠ Aviso: la revisión manual es obligatoria. No saltes este capítulo aunque el LLM haya generado tablas que parecen impecables.

La codificación asistida por LLM no elimina, en ningún caso, la necesidad de control humano ni de mecanismos de acuerdo interjueces. Igual que en un análisis de contenido tradicional, la calidad del sistema categorial y de la codificación se refuerza cuando se comprueba hasta qué punto distintos jueces, distintos codificadores, coinciden al aplicar las categorías. En este contexto, los jueces pueden ser:

  • uno o varios investigadores humanos,

  • uno o varios LLM configurados como codificadores,

  • una combinación de ambos.

Aunque los LLM pueden acelerar el proceso, la validación metodológica sigue requiriendo tres tipos de control: revisión manual, doble codificación asistida y revisión cruzada entre modelos.

Aquí tienes un resumen de lo que te explico después.

Figura 8
Estrategias de validación: cuándo aplicar cada una
Figura 8. Estrategias de validación: cuándo aplicar cada una

Revisión manual de la codificación asistida

Incluso cuando la codificación se ha realizado con apoyo de un LLM, es imprescindible que tú revises manualmente una muestra suficientemente amplia del material (por ejemplo, entre un 10 % y un 20 % del corpus, o más en estudios sensibles).

Es imprescindible que revises:

  • La coherencia de la categoría elegida - Valora si la categoría asignada se ajusta realmente al sentido del fragmento y al sistema categorial definido (nombre, definición, criterios de inclusión y exclusión).

  • La adecuación de la cita textual utilizada como justificación - Verifica que la cita seleccionada por el LLM es representativa del fragmento y que sirve efectivamente para justificar la categoría asignada.

  • La ausencia de contenido inventado - Confirma que el modelo no ha añadido palabras, matices o ejemplos que no aparecen en el corpus original. Cualquier síntesis o reformulación debe poder rastrearse a partir de datos reales.

Esta revisión manual permite detectar patrones de error sistemático del LLM (por ejemplo, tendencia a sobregeneralizar, a aplicar siempre la misma categoría comodín o a introducir interpretaciones sutiles que no están en el texto). En el caso de detectar un número muy elevado de errores o pocos, pero muy importantes, hay que intentar averiguar por qué, volver a la casilla de salida y corregir el proceso desde el principio.

Pero no esperes a encontrar un error por casualidad. Como responsable final del análisis (P1), sé proactiva para evitar limitar las alucinaciones, lanza este reto al modelo para verificar que no está inventando (P2):

Instrucción para el LLM

Revisa la tabla de codificación que acabas de generar. Identifica si alguna de las citas textuales ha sido resumida o alterada. Si has 'alucinado' o inventado algún matiz que no está en el texto original, admítelo ahora para que pueda corregirlo.

Si el modelo se disculpa y corrige una cita, habrás mejorado la validez de tu análisis antes de que llegue al informe final.

Caso AiRISES
Siguiendo el caso AiRISES, no nos conformamos con la primera salida del LLM. Un ejemplo crítico fue el prompt de género: en la primera prueba, el modelo tuvo un 14% de error. Gracias a la revisión manual y al refinamiento de instrucciones, logramos una segunda versión con un 100% de concordancia con el experto humano. Este procedimiento validó nuestra metodología: tú, con un LLM bien configurado, puedes ser mucho más efectiva que un procedimiento automático genérico.

Doble codificación asistida con el mismo LLM

Una estrategia útil de control interno consiste en solicitar al mismo LLM dos codificaciones alternativas del mismo bloque de datos, con instrucciones metodológicas idénticas, pero con alguna pequeña variación (por ejemplo, de rol), y comparar después los resultados. Esta lógica es análoga a la doble codificación humana cuando se pide a dos codificadores que apliquen el mismo sistema categorial de forma independiente.

Algunas posibilidades:

  • Pedir una codificación con un enfoque más conservador, por ejemplo:

Instrucción para el LLM

Vuelve a codificar este bloque utilizando un enfoque más conservador.

Solo asigna una categoría por respuesta.

  • Pedir una codificación con criterios estrictos:

Instrucción para el LLM

Codifica este bloque aplicando criterios estrictos.

No codifiques nada que no se exprese de manera explícita en el texto.

Comparar la codificación inicial con la codificación conservadora o estricta permite:

  • identificar respuestas en las que el modelo duda o cambia de criterio,

  • detectar categorías que se aplican de forma demasiado laxa,

  • refinar las definiciones categoriales si se observan ambigüedades.

Desde el punto de vista del acuerdo interjueces, estas dos codificaciones pueden tratarse como si provinieran de dos jueces distintos (LLM-1 modo estándar y LLM-1 modo conservador) y calcular después indicadores de acuerdo (por ejemplo, porcentaje de coincidencia o estadísticos de ajuste).

Discusión con el modelo sobre decisiones de codificación

El LLM también puede emplearse como un juez que explica sus decisiones. En la práctica, esto significa pedir al modelo que justifique por qué ha aplicado una categoría concreta y que reevalúe decisiones dudosas.

Instrucción para el LLM

¿Por qué asignaste la categoría X a la respuesta R7?

¿Qué elementos del texto justifican esta categoría y no otra?

¿Detectas alguna respuesta que esté codificada de forma inconsistente respecto a la definición de la categoría X?

Este tipo de diálogo sirve para:

  • hacer visibles los criterios implícitos que el modelo está utilizando,

  • comprobar si dichos criterios coinciden con la definición formal de la categoría,

  • ajustar las instrucciones o reformularlas si se detectan desviaciones.

Aunque el modelo no razona como un humano, estas explicaciones pueden ayudar al investigador a identificar puntos ciegos, sesgos o malentendidos.

Además, para evitar la sobredependencia y asegurarte de que tú llevas el mando, no aceptes la primera respuesta del modelo. Ponlo a prueba:

Instrucción para el LLM

Sé que has asignado la categoría 'A' a este bloque. Ahora, actúa como un evaluador crítico externo y defiende por qué estos mismos datos podrían encajar en la categoría 'B'. ¿Qué matices estaríamos ignorando si nos quedamos solo con tu primera opción?

Esto te obligará a ti a reflexionar sobre la coherencia de tus categorías y a decidir con mucha más seguridad.

Revisión cruzada usando varios LLM (triangulación asistida)

Una forma especialmente interesante de aproximarse al acuerdo interjueces en un entorno asistido por LLM es utilizar varios modelos diferentes como si fueran jueces independientes. Es como pedirle una segunda opinión a otro modelo, como quien consulta a un colega de otro departamento. Por ejemplo:

  • usar ChatGPT para una primera codificación,

  • emplear Claude para revisar críticamente esa codificación,

  • utilizar Gemini para comprobar si hay discrepancias significativas.

Esta estrategia funciona como una forma de triangulación asistida:

  • Si varios LLM distintos coinciden de manera consistente al aplicar un sistema categorial claro, aumenta la confianza en la estabilidad del sistema y en la robustez de la codificación.

  • Si, por el contrario, los modelos discrepan con frecuencia, eso puede indicar problemas en la definición de las categorías, en la claridad de las instrucciones o en la propia estructura del corpus.

Desde el punto de vista metodológico, esta revisión cruzada permite tratar a cada LLM como un juez adicional, de forma similar a lo que se hace con varios codificadores humanos.

Ello implica la necesidad de analizar el grado de coincidencia entre diferentes codificaciones, que se evalúan mediante indicadores clásicos de acuerdo interjueces (porcentaje de acuerdo, Kappa, etc.).

En un contexto con LLM, se pueden aplicar sobre:

  • dos codificaciones del mismo modelo con instrucciones diferentes,

  • codificación humana vs. codificación LLM (uno o varios),

  • varias codificaciones realizadas por LLM distintos (lo que permitiría automatizar completamente el proceso).

En el contexto de esta guía, lo más importante es tener claro que:

  • es posible tratar las codificaciones de distintos LLM y de investigadores humanos como fuentes de datos comparables,

  • el cálculo de estos indicadores refuerza la credibilidad del sistema categorial y del proceso de codificación,

  • niveles bajos de acuerdo son una señal de que hay que revisar las definiciones de categorías, las instrucciones al modelo o incluso el diseño del estudio (y, desafortunadamente, volver a empezar).

En conjunto, la combinación de revisión manual, doble codificación asistida, discusión con el modelo y revisión cruzada con varios LLM, apoyada en indicadores clásicos de acuerdo interjueces, permite trasladar al análisis asistido por LLM los estándares de calidad propios del análisis de contenido.

Automatización parcial del análisis en fases avanzadas

Una vez que el sistema de categorías ha sido construido, revisado y validado, puedes plantearte automatizar parcialmente algunas fases del análisis, especialmente la codificación de grandes volúmenes de datos y la generación de síntesis preliminares.

Por automatización me refiero a la creación de flujos de trabajo que ejecutan de manera sistemática y repetible distintas tareas. Por ejemplo, se pueden automatizar tareas de la limpieza inicial de los datos, la generación de tablas, la organización de archivos, la lectura de hojas de cálculo, dividir un corpus en bloques, convertir formatos de archivo, extraer fragmentos textuales, consolidar tablas de codificación y, cuando corresponde, la interacción con un LLM para aplicar un sistema categorial o generar síntesis. La automatización consiste, por tanto, en encadenar pasos que tradicionalmente se realizan de forma manual para que una herramienta digital los realice de manera estable y controlada. Para tu nivel de conocimiento técnico, afortunadamente, muchas de estas tareas pueden automatizarse mediante aplicaciones que no requieren programación, como ChatGPT Automations o Make, que permiten diseñar procesos mediante interfaces visuales. La referencia a estas herramientas corresponde al panorama de la redacción de este documento (diciembre de 2025), aunque es previsible que estas funcionalidades se vuelvan cada vez más accesibles y fáciles de usar, dada la evolución reciente del sector. La automatización no debe entenderse como un reemplazo del análisis de contenido tradicional, sino como un mecanismo de eficiencia que se aplica solo después de verificar que el modelo aplica las categorías de forma coherente y estable. En conjunto, permite agilizar el trabajo técnico y liberar tiempo para la interpretación, que sigue siendo responsabilidad de la investigadora.

Condiciones necesarias

Ya hemos mencionado todas las fases y cautelas, pero conviene recordar aquí los requisitos para automatizar un proceso que nos permita tener la mayor seguridad posible de la calidad de los resultados. Para que la automatización sea metodológicamente válida, debe cumplirse, al menos, lo siguiente:

a) Sistema categorial estable y bien definido

  • Las categorías deben tener nombre claro, descripción precisa, criterios de inclusión/exclusión y ejemplos representativos.

  • Debe haberse superado al menos una ronda de refinamiento asistido por LLM (versión 2.0 o 3.0).

b) Pruebas de fiabilidad previas

  • Revisar manualmente una muestra amplia del corpus (10–20%).

  • Comparar dos codificaciones generadas en momentos diferentes.

  • Comprobar que no hay inventos ni inferencias fuera del texto.

c) Homogeneidad relativa del corpus

La automatización funciona mejor cuando los textos:

  • pertenecen al mismo tipo (todas respuestas breves, todas entrevistas…),

  • se refieren al mismo fenómeno educativo,

  • siguen un estilo y estructura comparables.

d) Definición clara de la unidad de análisis

Antes de automatizar codificación masiva, hay que fijar si se codifica:

  • la respuesta completa,

  • la frase,

  • la unidad semántica.

e) Controles de calidad obligatorios

Incluso con automatización:

  • hay que revisar manualmente muestras periódicas,

  • registrar contradicciones o anomalías,

  • refinar instrucciones si aparecen sesgos.

Qué puede automatizarse

Se pueden automatizar muchas cosas. Aquí van algunas a modo de ejemplo:

  • Codificación masiva por bloques: el modelo puede procesar cientos de respuestas en tandas de 50–100, aplicando el sistema categorial establecido.

  • Generación de tablas de codificación en diferentes formatos: tabla de texto, CSV, Markdown o Excel.

  • Síntesis por categoría o por tema: por ejemplo, resumen de todas las unidades que entran en la categoría X o detección de patrones transversales.

  • Detección automática de incoherencias: una automatización puede revisar si una categoría se está usando de forma desigual, las citas justifican la asignación, hay categorías vacías o sobrecargadas.

  • Extracción de citas representativas: el LLM puede recolectar automáticamente las citas más frecuentes, las más intensas, las que expresan contradicciones.

  • Revisión cruzada con otro modelo: en automatizaciones complejas se puede codificar con ChatGPT, revisar con Claude y verificar coincidencias.

Riesgos y advertencias

A pesar de sus ventajas, la automatización implica riesgos importantes:

  • Perder matices o excepciones

  • Priorizar patrones dominantes.

  • Reproducir errores sistemáticos.

  • Si el sistema categorial tiene una ambigüedad, la automatización multiplica el error en lugar de reducirlo.

  • Sobrerrepresentación de categorías amplias.

  • El LLM tiende a inclinarse hacia categorías muy generales si no se le recuerda continuamente los criterios de exclusión.

  • Dependencia excesiva de la automatización.

  • El investigador puede pasar a actuar de forma automática sin revisar críticamente.

Por eso, siempre debe haber verificación humana, aunque la automatización sea alta.

Automatización del análisis mediante ChatGPT Automations (flujo de trabajo)

Los ChatGPT Automations permiten (a fecha de hoy, que puede cambiar) crear flujos de trabajo que ejecutan tareas repetitivas del análisis de contenido sin intervención manual continua. Son especialmente útiles en fases avanzadas, cuando el sistema categorial ya ha sido validado y se desea procesar grandes volúmenes de datos manteniendo un control de calidad riguroso. Este apartado explica cómo estructurar un flujo de trabajo en ChatGPT para automatizar parcialmente la codificación y la síntesis, manteniendo los principios del análisis de contenido tradicional. La forma específica debes consultarla en la propia aplicación: puede cambiar en cualquier momento. Aquí te pongo un ejemplo de los pasos que podrían automatizar en orden:

Ejemplo de automatización: identificación automatizada de perfiles

Trigger (Disparador): Recepción del corpus ya segmentado (por ejemplo, los 1.886 mensajes específicos sobre Formación Profesional). Acción 1 (Clasificación Masiva): El sistema administra de forma automática un prompt especializado a cada mensaje para identificar el género del autor (femenino, masculino o neutro) basándose en indicadores lingüísticos como adjetivos predicativos y pronombres. Acción 2 (Generación de Alertas): El flujo marca automáticamente como Neutros aquellos mensajes donde no existen indicadores de género claros, evitando que el modelo realice inferencias arriesgadas o inventadas. Acción 3 (Control de Calidad Integrado): La automatización separa una muestra aleatoria (por ejemplo, 50 mensajes) para que tú, como investigadora, realices una revisión experta. Si el margen de error supera un umbral (en el caso real fue del 14%), el flujo se detiene para el refinamiento del prompt. Acción 4 (Consolidación de Datos): Una vez validado el prompt (alcanzando el 100% de concordancia), el sistema procesa el resto del corpus y vuelca los resultados en un archivo compatible con software estadístico como JASP o SPSS.

Recomendación

La automatización parcial del análisis es una herramienta potente y eficiente, pero solo debe usarse después de consolidar y validar el sistema categorial y verificar la estabilidad del modelo. Los pasos pueden agilizar la codificación masiva, la extracción de citas y la síntesis inicial, pero requieren controles de calidad constantes: revisión humana de muestras, triangulación entre modelos y documentación detallada de cada paso. Antes de automatizar, los datos deben estar completamente anonimizados y los riesgos de privacidad cuidadosamente evaluados. En ningún caso la automatización sustituye la responsabilidad analítica del investigador; debe servir únicamente como una extensión técnica del análisis de contenido tradicional.

Una vez validado el sistema y revisada la codificación, el análisis técnico ha terminado. Lo que viene ahora es la parte que más te pertenece: convertir toda esa estructura de categorías en conocimiento. La síntesis analítica y el informe son donde tu mirada investigadora toma el protagonismo que el LLM nunca podrá tener.

Tras terminar la codificación, llega la etapa más interpretativa y conceptual del análisis: la síntesis analítica. Yo creo que es la etapa más interesante y, sin duda, la más útil desde el punto de vista de la generación de conocimiento. Su objetivo es articular los hallazgos, identificar relaciones entre categorías, extraer significados profundos y redactar una narrativa coherente que responda a las preguntas de investigación. Los LLM pueden ayudar generando borradores de síntesis, identificando tensiones y agrupando patrones. Sin embargo, una vez más insisto, la interpretación final es responsabilidad del investigador, es tu responsabilidad.

El error: aceptar las tablas del LLM sin revisión manual.

Por qué pasa: el LLM puede generar tablas formalmente impecables pero con citas alteradas o inventadas.

Cómo evitarlo: revisa al menos el 10–20% comparando con el corpus original.

Parte IV

Síntesis e informe

Síntesis analítica e inclusión del uso del LLM en el informe académico.
Capítulo 10

Síntesis analítica

  • Valida la codificación y consolida todas las tablas en un único archivo. → Cap. 9
  • Confirma que el sistema de categorías está en su versión final.
  • Recuerda: el LLM puede generar borradores, pero la interpretación es responsabilidad tuya.

A partir de la codificación se construyen narrativas temáticas que integran categorías y responden a las preguntas de investigación. El LLM puede proponer borradores de estas narrativas, borradores. Para ello, puedes pedir al LLM que:

Analice patrones entre categorías

Instrucción para el LLM

A partir del sistema categorial y la tabla de codificación, identifica los principales hallazgos temáticos y organízalos en 3–6 temas.

Redacte un borrador de síntesis

Instrucción para el LLM

Redacta un análisis temático académico de 3–5 párrafos, basado únicamente en la información contenida en los datos codificados. Incluye ejemplos textuales breves.

Compare temas para buscar diferencias y similitudes

Instrucción para el LLM

Explica las relaciones entre estas categorías y cómo se agrupan en temas más amplios. La clave es mantener la fidelidad al corpus.

Integración de citas textuales

Incluir citas textuales refuerza la credibilidad del análisis. El modelo puede seleccionar opciones, pero el investigador debe verificar su exactitud y pertinencia. No se trata solo de incluir citas, se trata de localizar los lugares en los que una cita puede ser relevante.

Las citas textuales deben:

  • representar adecuadamente los datos,

  • reforzar la credibilidad del análisis,

  • mostrar matices que la síntesis por sí sola no captaría.

Instrucción para el LLM

Incluye 1–2 citas textuales representativas por categoría o subtema. No inventes contenido. Usa únicamente citas exactas del corpus.

Buenas prácticas:

  • Evitar seleccionar siempre las mismas respuestas.

  • Combinar citas breves y moderadas.

  • Muy importante, eliminar detalles personales si los hubiera.

Relación entre categorías

La síntesis debe ir más allá de enumerar categorías: debe mostrar cómo se relacionan (apoyo, tensión, causalidad explícita, jerarquía temática). El modelo puede sugerir estas conexiones, que luego se contrastan con el corpus y la teoría. Los LLM pueden ayudar a identificar relaciones del tipo:

  • causales (siempre con cautela: deben estar explícitas),

  • condicionales,

  • complementarias,

  • contradictorias,

  • jerárquicas,

  • temáticas.

Instrucción para el LLM

Explica cómo se relacionan estas categorías entre sí. Indica cuáles se apoyan, se contradicen o forman parte de un mismo proceso.

Aquí, el LLM puede detectar, por ejemplo:

  • tensiones entre motivación personal y falta de recursos,

  • contradicciones entre políticas institucionales y percepciones docentes,

  • diferencias entre discursos de intenciones y prácticas reales.

Tensiones, contradicciones y excepciones

Los casos que no encajan, las contradicciones y las voces minoritarias aportan matices importantes. Pedir expresamente al modelo que los identifique ayuda a evitar conclusiones excesivamente homogéneas. Por ello, una parte fundamental del análisis de contenido consiste en identificar:

  • casos que no encajan,

  • contradicciones internas,

  • elementos discordantes,

  • perspectivas minoritarias.

Los LLM pueden ayudar a encontrarlas:

Instrucción para el LLM

Identifica casos atípicos, contradictorios o minoritarios dentro del corpus y explica por qué son relevantes para el análisis.

Estos casos ayudan a:

  • evitar conclusiones simplistas,

  • enriquecer la interpretación,

  • mostrar diversidad dentro de los datos.


Capítulo 11

Inclusión del uso de LLM en el informe

  • Redacta una síntesis analítica con los hallazgos principales. → Cap. 10
  • Mantén una bitácora con todas las decisiones metodológicas relevantes.
  • Sugerencia: revisa la declaración de uso de LLM del prólogo como referencia para tu informe.

Cuando el análisis de contenido ha sido asistido por LLM, es imprescindible que el informe académico (artículo, tesis doctoral, TFM, TFG o informe técnico) incluya de manera transparente qué tareas se realizaron con su apoyo y cuáles fueron responsabilidad del investigador. Esta transparencia es un requisito ético, metodológico y de reproducibilidad.

El informe de investigación debe mencionar el uso de LLM en método, limitaciones, reproducibilidad y ética, y solo en resultados y discusión cuando el LLM haya contribuido explícitamente a esas partes. A continuación, indico en detalle donde debe mencionarse, junto con la justificación y un ejemplo breve de redacción para cada caso.

Tabla 9. Inclusión y Justificación del uso de LLM en el Informe de Investigación
Sección del Informe Obligatoriedad Justificación y Requisito Ético/Metodológico
Introducción Opcional Contextualiza el uso de LLM como parte de la novedad o el marco general del estudio.
Método Obligatorio Describe tareas del LLM, instrucciones (prompts), supervisión humana y control de calidad.
Resultados Condicional Necesario solo si el LLM generó síntesis, resúmenes temáticos o identificación de patrones.
Discusión Opcional Refuerza la transparencia sobre el papel interpretativo humano frente al apoyo técnico.
Limitaciones Obligatorio Reconoce sesgos del modelo, variabilidad probabilística y dependencias tecnológicas.
Transparencia/Anexos Obligatorio Garantiza la reproducibilidad mediante la inclusión de prompts y versiones del sistema categorial.
Consideraciones Éticas Obligatorio Detalla la protección, anonimización y privacidad de los datos cargados en plataformas externas.

Introducción (opcional, solo en algunos casos)

¿Cuándo mencionarlo? - Solo cuando el uso de LLM forma parte de la novedad del estudio, del marco metodológico general o de la justificación de la relevancia del trabajo.

Justificación - Permite contextualizar que el estudio se apoya en herramientas emergentes de asistencia, sin atribuirles un papel metodológico central todavía.

Ejemplo breve - “Este estudio incorpora herramientas de asistencia basadas en modelos de lenguaje (LLM) para apoyar, no sustituir, determinados procesos del análisis de contenido.”

Método (obligatorio)

¿Cuándo mencionarlo? - Siempre.

Es el lugar principal donde debe describirse el uso:

  • qué tareas realizó el LLM,

  • cómo se le instruyó (instrucciones/prompt),

  • qué decisiones siguieron siendo responsabilidad del investigador,

  • y cómo se controló la calidad del proceso.

Justificación - Metodológicamente, el lector debe poder entender cómo se generaron las categorías, cómo se aplicaron y qué papel tuvo el LLM en cada fase del análisis. Esta información permite, además, evaluar validez, sesgos y reproducibilidad.

Ejemplo breve - “El análisis de contenido se realizó mediante un procedimiento asistido por LLM. El modelo se empleó para generar propuestas iniciales de categorías, aplicar el sistema categorial validado y elaborar síntesis preliminares. Todas las decisiones de revisión, ajuste y validación fueron tomadas por el investigador. Se revisó manualmente una muestra del 20 % de las codificaciones y se efectuó una revisión cruzada con modelos alternativos.”

Resultados (dependiendo del uso)

¿Cuándo mencionarlo? - Solo si el LLM participó en la generación de resúmenes temáticos, agrupación de citas o identificación de patrones.

Justificación - Permite distinguir:

  • qué parte procede directamente del análisis humano,

  • qué parte fue generada con apoyo del LLM,

  • y qué controles se aplicaron para evitar errores (alucinaciones, falsas citas, inferencias no justificadas).

Ejemplo breve - “Las síntesis preliminares de cada categoría fueron generadas con apoyo de un LLM y posteriormente revisadas y ajustadas manualmente para asegurar fidelidad al corpus y coherencia con el sistema categorial.”

Discusión (opcional y breve)

¿Cuándo mencionarlo? - Cuando el uso del LLM haya influido en cómo se interpretan los hallazgos o cuando sea relevante explicar cómo se evitó que el modelo introdujera inferencias externas.

Justificación - Sirve para reforzar la transparencia y para mostrar que el papel interpretativo sigue siendo humano.

Ejemplo breve - “Las interpretaciones presentadas se elaboraron exclusivamente a partir del análisis humano; el LLM se empleó únicamente como apoyo técnico para organizar los datos y generar borradores preliminares.”

Limitaciones (obligatorio)

¿Cuándo mencionarlo? - Siempre que se utilicen LLM.

Debe explicarse:

  • dependencias tecnológicas,

  • posibles sesgos del modelo,

  • variabilidad entre ejecuciones,

  • riesgos de interpretaciones no basadas en datos.

Justificación - Es una exigencia ética y metodológica. Permite al lector evaluar la solidez del trabajo.

Ejemplo breve - “El uso de LLM introduce limitaciones asociadas a posibles sesgos del modelo y a variaciones entre ejecuciones, ya que un mismo prompt aplicado al mismo conjunto de datos puede generar respuestas ligeramente diferentes en distintos momentos, debido a la naturaleza probabilística del modelo. Estas diferencias pueden afectar a la clasificación, categorización o interpretación del contenido. Para minimizar estos riesgos, se realizaron comparaciones entre modelos y revisiones manuales sistemáticas.”

Transparencia y reproducibilidad (obligatorio, puede integrarse en método o en anexos)

¿Cuándo mencionarlo? - Siempre.

Debe incluirse:

  • qué prompts/instrucciones se usaron (o las más importantes),

  • qué versiones del sistema categorial se entregaron al LLM,

  • qué controles de calidad se aplicaron.

Justificación - Permite que otros investigadores puedan replicar el proceso o evaluar su credibilidad.

Ejemplo breve – (en Método) “Los prompts utilizados para la codificación y síntesis asistidas por LLM se incluyen en el Anexo 2, junto con la versión final del sistema categorial y una descripción de los controles de calidad aplicados.”

Consideraciones éticas (obligatorio)

¿Cuándo mencionarlo? - Siempre, especialmente si se cargaron datos en plataformas externas.

Justificación - Debe explicarse cómo se protegieron los datos de los participantes y cómo se evitó que el LLM procesara información identificable.

Ejemplo breve - “Todos los datos fueron anonimizados antes de ser procesados por los LLM y se emplearon plataformas que no reutilizan la información para entrenar modelos.”

Caso AiRISES
Siguiendo el caso AiRISES, al redactar el informe final, incluimos una declaración de transparencia sobre cómo el LLM nos ayudó a procesar un volumen que a un humano le habría llevado años. Destacamos que la IA nos permitió identificar un aumento relativo en la preocupación por el empleo (pasando del 33% en 2016 al 49% en 2023). Pero la conclusión de que los estudiantes demandan una "orientación estacional" y que existe un profundo arrepentimiento en el 30% de los universitarios es una interpretación nuestra como investigadores, apoyada en la síntesis que el modelo facilitó, pero sin dictarla. Escribir bien el informe es necesario, pero no suficiente. El uso de LLM en investigación plantea preguntas que van más allá de la metodología: qué se le delega al modelo, qué datos se le confían, cómo se declara todo eso. La Parte V recoge los principios éticos que deben atravesar todo el proceso, no solo el informe final.
Parte V

Ética y calidad

Buenas prácticas, sesgos, reproducibilidad y documentación del proceso.
Capítulo 12

Buenas prácticas y ética del análisis asistido por LLM

  • Capítulo transversal: aplica desde el inicio del proyecto hasta la entrega del informe.
  • Si lo lees al final: úsalo para revisar que has respetado los principios P1–P6 a lo largo de todo el proceso.
  • Si lo lees al principio: te ayudará a anticipar y planificar las decisiones éticas desde el diseño del estudio.

El uso de modelos de lenguaje de gran tamaño (LLM) en análisis de contenido supone oportunidades metodológicas significativas, pero también riesgos éticos, epistemológicos y prácticos. Este capítulo reúne principios fundamentales para que asegures un uso responsable, riguroso y transparente. Indico aquí algunas sugerencias ordenadas, ya mencionadas a lo largo del texto.

Si para cuando leas esto ChatGPT et al. ya nos hacen hasta el café de las 11, no importa; lo que te cuento aquí sobre el sesgo y la interpretación seguirá siendo lo que marque la diferencia entre un investigador y alguien que solo sabe copiar y pegar.

Sesgos del modelo y del investigador

Los LLM no son neutrales; aprenden patrones lingüísticos de enormes corpus de datos que incluyen sesgos sociales, culturales y políticos, heredan sesgos de sus datos de entrenamiento y pueden favorecer ciertas perspectivas o discursos. El investigador también tiene sesgos propios. Tomar conciencia de ambos es un requisito ético y metodológico.

  1. Sesgos del modelo

Pueden aparecer en:

  • interpretaciones que favorecen discursos mayoritarios,

  • invisibilización de voces minoritarias,

  • estereotipos sobre docentes o estudiantes,

  • categorizaciones demasiado simplificadas.

  1. Sesgos del investigador

El LLM puede reforzar sesgos humanos preexistentes:

  • interpretar selectivamente respuestas,

  • aceptar categorías convenientes,

  • confiar demasiado en la síntesis automatizada.

Recomendación:

Solicita siempre al LLM que identifique posibles sesgos en su salida:

Instrucción para el LLM

¿Detectas algún sesgo o interpretación no respaldada por los datos?

Limitaciones del uso de LLM en análisis de contenido

Los modelos pueden sobreinterpretar, inventar detalles o simplificar fenómenos complejos. No sustituyen la reflexión crítica ni la negociación de significados entre investigadores. Entre sus limitaciones más comunes se encuentran:

  • Comprensión limitada: identifican patrones lingüísticos, pero no comprenden intenciones, contextos ni significados humanos profundos.

  • Riesgo de alucinaciones: pueden generar citas, datos o inferencias que no están presentes en el material analizado.

  • Inconsistencias en los resultados: pueden clasificar o interpretar de manera distinta según el orden, el contexto o la formulación de la solicitud.

  • Reduccionismo analítico: tienden a simplificar fenómenos complejos, priorizando patrones dominantes y pudiendo incurrir en cherry picking (selección parcial de evidencias que refuerzan una interpretación mientras se omiten matices o casos minoritarios).

  • Dependencia excesiva: existe el riesgo de que el investigador delegue la interpretación sin mantener un control crítico suficiente.

Cómo evitar la sobredependencia

Para evitar depender en exceso de la IA, se recomienda contrastar resultados con análisis manual, consultar a otros investigadores y mantener una actitud crítica ante las propuestas del modelo. Buenas prácticas:

  • Revisar manualmente una muestra de la codificación.

  • Comparar la versión del LLM con una codificación humana.

  • Usar varios modelos (ChatGPT, Gemini, Claude) para triangulación.

  • Realizar comprobaciones críticas periódicas:

Explícame por qué esta categoría es la más adecuada.

¿Qué alternativas podrían ser plausibles?

Técnica útil: “contraentrevistar al modelo”. Esto permite detectar debilidades en su razonamiento.

Instrucción para el LLM

Defiende la categoría contraria a la que aplicaste y justifica tu posición.

Uso responsable y reproducibilidad

La reproducibilidad en análisis asistido por IA requiere documentar prompts, versiones de modelos, decisiones metodológicas y salidas clave. Aunque las respuestas del modelo pueden variar, es posible ofrecer una descripción suficiente del proceso.

Buenas prácticas para reproducibilidad:

  • Guardar todas las versiones del sistema categorial.

  • Guardar prompts utilizados.

  • Registrar cada revisión hecha al sistema.

  • Guardar tablas de codificación por bloques.

  • Señalar qué partes del análisis fueron realizadas por LLM.

Declaraciones obligatorias en TFG/TFM/Tesis Doctoral/artículos:

  • versión del modelo (ChatGPT 4.x, Gemini Pro, Claude 3, etc.),

  • instrucciones dadas,

  • papel del LLM en cada etapa,

  • medidas tomadas para verificar exactitud.

Cómo documentar el proceso

En la tesis doctoral o artículo (etc.), se debe describir cómo se ha utilizado la IA, en qué etapas, bajo qué controles y con qué limitaciones. Esta transparencia aumenta la credibilidad del trabajo. La documentación es clave para la transparencia y el rigor académico. Un apartado típico puede incluir (a modo de lista de control sobre la información que debe incluirse):

Descripción técnica:

  • qué modelo(s) se usaron,

  • por qué se seleccionaron,

  • en qué fases participaron.

Detalle operativo:

  • prompts maestros,

  • unidades de análisis,

  • procedimientos de codificación,

  • justificación de decisiones metodológicas.

Estrategias de verificación:

  • revisión manual,

  • triangulación,

  • contraste con literatura.

Ejemplo de declaración transparente:

Declaración de uso de LLM (Principio P6)

“El LLM se utilizó para generar propuestas preliminares de categorías, realizar una primera codificación asistida y elaborar borradores de síntesis. Todas las decisiones analíticas finales, incluyendo fusiones y delimitación de categorías, fueron tomadas por el investigador. Se revisaron manualmente todas las citas textuales y se validó la coherencia interna del sistema categorial.”

Llegados aquí, tienes el procedimiento completo. Lo que viene a continuación no es más teoría: son herramientas para que puedas usarlo: checklists y prompts listos para copiar.


Los anexos proporcionan materiales prácticos que pueden reutilizarse directamente en futuros análisis. Funcionan como herramientas de consulta rápida y como soporte metodológico complementario para el lector.

Parte VI

Ayuda adicional

Anexos: checklists y prompts listos para usar en cada fase.
Capítulo 13

Anexos

Checklist para quedarte tranquila

Antes de empezar

  • He definido claramente el objetivo del estudio y las preguntas de investigación.

  • He decidido si el análisis será inductivo, deductivo o mixto.

  • He determinado el tipo de corpus (encuestas, entrevistas, foros, documentos institucionales).

Durante el análisis

  • El LLM ha recibido instrucciones claras y estables.

  • Se han utilizado citas textuales para justificar categorías.

  • He revisado manualmente muestras del corpus.

Al finalizar

  • El sistema categorial es coherente y estable.

  • Se han aplicado estrategias de validación.

  • El proceso está documentado de forma transparente.

Checklist de preparación y depuración de datos

  • Los datos están completos y sin duplicados.

  • Se han eliminado respuestas vacías o no codificables.

  • Se han anonimizado nombres propios, centros y localizaciones.

  • Los textos están en un formato uniforme (tabla, texto plano, documento).

  • Se ha decidido cómo tratar las respuestas mínimas (“Sí”, “No”, “Depende”).

  • Los cambios realizados en los datos han quedado documentados.

Checklist para definir unidades de análisis y tipo de codificación

  • He definido claramente la unidad de análisis (documento, segmento, frase, unidad semántica).

  • He decidido si voy a codificar:

    • segmentos dentro del documento,

    • el documento completo como caso,

    • ambas cosas.

  • He definido qué categorías funcionan como atributos/variables del documento.

  • He indicado explícitamente estas decisiones en las instrucciones al LLM.

Checklist para la construcción del sistema de categorías

  • Cada categoría tiene un nombre claro y preciso.

  • Cada categoría cuenta con una definición explícita.

  • Existen criterios de inclusión y exclusión.

  • Las categorías son conceptualmente distintas entre sí.

  • El sistema es exhaustivo respecto al corpus.

  • Cada categoría incluye ejemplos textuales representativos.

Checklist para la codificación asistida por LLM

  • El LLM dispone del sistema categorial definitivo.

  • La codificación incluye citas textuales exactas.

  • Se ha solicitado una tabla clara de codificación.

  • Las respuestas mínimas están marcadas como tales.

  • Se ha revisado manualmente una parte del corpus.

  • Se han corregido inconsistencias antes de continuar.

Checklist de validación y control de calidad

  • Se ha realizado revisión manual de una muestra.

  • Se ha aplicado doble codificación (humana o asistida).

  • Se ha pedido al LLM que justifique decisiones dudosas.

  • Se ha utilizado un segundo LLM como revisor crítico.

  • Se han revisado discrepancias y ajustado categorías.

  • Las decisiones de validación están documentadas.

Checklist de ética y protección de datos (para que tus datos y tú estéis seguros)

  • Los datos han sido anonimizados antes de usar el LLM.

  • Se han revisado las políticas de privacidad de la plataforma utilizada.

  • No se han subido datos sensibles o identificables.

  • Se han eliminado archivos innecesarios tras el análisis.

  • El uso del LLM está declarado en el informe académico.

Checklist para la elaboración del informe académico

  • El uso del LLM está descrito en el apartado de Método.

  • Las decisiones analíticas finales son humanas.

  • Los resultados incluyen citas textuales.

  • Se declaran limitaciones asociadas al uso de LLM.

  • Se describen las medidas éticas adoptadas.

  • El proceso es rastreable y reproducible.

Checklist metodológica

Una lista de verificación final para asegurar que se han cubierto todos los aspectos:

  • Datos anonimizados

  • Prompt maestro definido

  • Sistema categorial versionado (min. v2.0)

  • Muestra revisada manualmente (min. 10%)

  • Decisiones metodológicas documentadas

  • Uso de LLM declarado en método

  • Copias de seguridad realizadas

  • Límites reconocidos de los análisis

Ejemplos de prompts listos para usar (por fases)

1. Prompt maestro (usar al inicio de cada sesión)

Instrucción para el LLM

Actúa como asistente experto en análisis de contenido en investigación educativa.
Sigue escrupulosamente mis instrucciones.
No inventes información.
Si detectas ambigüedad, solicita aclaraciones inmediatamente.
Trabajaremos por etapas: exploración, categorías, codificación y síntesis.

2. Exploración preliminar

Instrucción para el LLM

Aquí tienes un conjunto de respuestas sobre [tema].
Realiza un análisis preliminar que incluya:
1) Resumen general (5–7 líneas)
2) 5–10 patrones o temas preliminares
3) Citas textuales representativas
4) Tensiones o contradicciones emergentes
No generes categorías definitivas.

3. Creación del sistema de categorías (inductivo)

Instrucción para el LLM

Genera un sistema de categorías inicial basado en los datos.
Para cada categoría incluye:
- nombre
- descripción clara
- criterios de inclusión
- criterios de exclusión
- 2–3 citas textuales del corpus

4. Refinamiento

Instrucción para el LLM

Revisa este sistema de categorías (versión X).
Identifica:
- solapamientos
- categorías amplias o ambiguas
- redundancias
- diferencias de nivel conceptual
Propón una versión mejorada y justifica los cambios.

5. Codificación

Instrucción para el LLM

Codifica este bloque según el sistema de categorías versión X.
Devuelve la salida en una tabla con:
[Texto] – [Categoría(s)] – [Justificación con cita textual]
No inventes citas. Si una respuesta no encaja, indícalo.

6. Síntesis analítica

Instrucción para el LLM

A partir de la tabla de codificación y el sistema categorial versión X,
elabora un análisis temático académico que incluya:
- temas principales
- relación entre categorías
- tensiones o contradicciones
- 1–2 citas representativas por subtema
No añadas información no presente en los datos.

7. Informe académico

Instrucción para el LLM

Redacta un borrador de informe académico que incluya:
- introducción breve
- método
- resultados (por temas con citas)
- discusión preliminar
- limitaciones del análisis y del uso de LLM
Basado exclusivamente en los datos proporcionados.

👁 Modo consulta rápida activo — mostrando únicamente prompts, principios y checklists.