Análisis de contenido
asistido por LLM
Procedimiento sistemático para integrar modelos de lenguaje de gran tamaño en el análisis de contenido, manteniendo el rigor metodológico y la responsabilidad interpretativa del investigador.
Análisis de contenido asistido por LLM
Prólogo
Después de pensarlo mucho y vista la mezcla de entusiasmo y agotamiento que produce la investigación académica, decidí escribir esta guía con el objetivo de reducir el agotamiento sin modificar el entusiasmo. Pensé que quizá te ayudaría tener un documento que te acompañara paso a paso en el análisis de contenido asistido por LLM (lo del ChatGPT). Lo he hecho de forma directa, en un formato más de uso que académico. Si necesitas referencias académicas sobre el análisis de contenido, hay cientos de ellas, tanto manuales, como artículos de investigación en los que se utiliza. Además, verás que este método de análisis se aplica en numerosos campos científicos. Echa un vistazo a algunos más próximos a tu tema de investigación.
Aunque llevo haciendo análisis de contenido desde mi tesis doctoral (1995), esta guía es fruto de mi experiencia durante los últimos tres años en el proyecto AiRISES y de todo lo que he ido aprendiendo, a veces delante del ordenador, a veces detrás de un café con compañeros. Entre pruebas, errores, reuniones y momentos de inspiración (escasos, pero gloriosos), fuimos encontrando un modo de trabajar con LLM que combina el rigor del análisis con las posibilidades de estas nuevas herramientas. Esto no ha hecho más que empezar. Creo que le pondré fecha a este documento. Nunca se sabe cuándo saldrá una nueva versión de un LLM que eliminará todos los fallos, reducirá las tareas actuales y ofrecerá numerosas opciones nuevas que cambiarán lo que digo aquí. A ver si soy capaz de mantener este documento actualizado (no lo creo).
Mi intención es que esta guía te sirva paso a paso en el proceso de análisis de contenido, que te recuerde que el proceso tiene una lógica necesaria, aunque a veces no lo parezca, y que te permita avanzar con seguridad mientras mantienes tu criterio y tu mirada investigadora. El proceso descrito debes adaptarlo al tipo de estudio, el tamaño del corpus y las preguntas de investigación, y requiere siempre tu decisión para ajustar, revisar y reinterpretar cada fase. En ese sentido, la guía te propone un marco de trabajo flexible, que te acompañará en el análisis, sin sustituir tu reflexión metodológica ni tu responsabilidad interpretativa ni, mucho menos, el análisis de las implicaciones y las acciones de mejora, imprescindibles en nuestra investigación en educación.
Ojalá encuentres aquí no solo los pasos a seguir, sino también la sensación de que se puede hacer y que, además, tú puedes hacerlo muy bien.
Si te sirve, házmelo saber. Y, por supuesto, dame todas las sugerencias de modificaciones que sirvan para mejorar el documento para otras personas que puedan necesitarlo. Ya he incorporado algunas.
En PARTE V. 12.4. digo que hay que hacer una cosa. Sometiéndome a mis propias recomendaciones y como ejemplo de buena práctica, incluyo esta declaración.
En la elaboración de esta guía he utilizado apoyo de varios LLM, concretamente ChatGPT, NotebookLM, Gemini y Claude (en sus versiones más actualizadas a marzo de 2026). Han sido usados como herramienta de asistencia en distintas fases del proceso. Su uso se ha limitado a tareas de redacción, reformulación textual, búsqueda de expresiones alternativas, generación de ejemplos, apoyo en la estructuración del contenido y en el formato de presentación. Todas las decisiones conceptuales, metodológicas y editoriales han sido tomadas por mí y he revisado críticamente cada una de las propuestas generadas. El modelo no ha intervenido en lo esencial de los contenidos y, en ningún caso, ha sustituido mi juicio como investigador. Su función ha sido instrumental, similar a la de una herramienta de edición avanzada, siempre bajo mi supervisión y responsabilidad.
Antes de terminar, una nota sobre el lenguaje. En esta guía combino deliberadamente tres registros según el contexto. En definiciones, principios y formulaciones académicas uso el masculino genérico (el investigador) como forma convencional e inclusiva. Cuando me dirijo a ti directamente con instrucciones o advertencias, uso el tuteo, que no tiene marca de género. Y, en los pasajes narrativos más cercanos, uso el femenino, porque es la voz que mejor refleja a la persona en formación a quien va dirigida esta guía. Es mi decisión editorial.
Ánimo (y suerte).
Javier Vidal
Fundamentos
Introducción
Un poco de contexto. El análisis de contenido asistido por modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) se ha convertido en una herramienta de creciente interés en la investigación educativa. La disponibilidad de sistemas como ChatGPT, Gemini o Claude, capaces de procesar grandes volúmenes de texto y generar resúmenes, categorías y explicaciones, permite optimizar procesos que tradicionalmente son laboriosos y exigen un tiempo considerable de lectura, codificación y comprensión. Pero es importante que desde el principio quede claro que el empleo de LLM es un apoyo metodológico que no sustituye la responsabilidad del investigador. Esta guía se plantea desde un enfoque combinado: (a) realizar un análisis de contenido tradicional, fundamentado en el rigor metodológico, la transparencia y el análisis crítico de los resultados, (b) incorporando el LLM como apoyo técnico para agilizar tareas y organizar la información, insisto, sin sustituir el criterio ni la interpretación del investigador.
El procedimiento de análisis que te presento en este documento es el resultado directo del trabajo desarrollado en el proyecto Aplicación de la Inteligencia Artificial en el análisis de redes informales sociales para la orientación en Educación Superior (AiRISES), financiado por el Ministerio de Ciencia e Innovación (PID2021-125405NB-I00), del que hemos sido investigadores principales María José Vieira y yo mismo. Su elaboración se sustenta en más de tres años de investigación continuada, en los que hemos combinado técnicas de análisis automatizado y revisión experta para abordar de forma rigurosa un corpus amplio y complejo de mensajes provenientes de foros informales. Este procedimiento es la síntesis final del conocimiento acumulado por todo el equipo implicado en el proyecto, tanto del equipo de investigación, Camino Ferreira, Agustín Rodríguez-Esteban, Diego González-Rodríguez y Alba González-Moreira, como del equipo de trabajo, integrado por Estela Mayor-Alonso, Yaiza Viñuela, María Álvarez-Godos, Ainhoa Martínez-Rodríguez y Héctor González-Mayorga. La versión final que aquí presento no habría sido posible sin sus aportaciones, que han enriquecido de manera constante el enfoque, la comprensión del objeto de estudio y la solidez del método.
Propósito de la guía
El propósito principal de esta guía es ofrecerte un procedimiento detallado, paso a paso, para realizar análisis de contenido asistido por LLM en investigación educativa. Combina fundamentos conceptuales, indicaciones prácticas, ejemplos e instrucciones listas para usar, de modo que puedas adaptar el proceso a tu propio estudio, ya se trate de corpus grandes con cientos de documentos o de encuestas breves con pocas respuestas.
El objetivo final es que puedas llevar a cabo un análisis de contenido riguroso, reproducible y éticamente informado, integrando el LLM como un asistente experto, que agilizará el trabajo técnico, pero sin sustituir en ningún caso tu propio criterio ni tu responsabilidad interpretativa (me pondré un poco pesado insistiendo en esto).
A quién va dirigida
La guía está pensada para personas como tú, investigadoras en formación, docentes que realizan estudios de investigación o innovación y equipos que quieran integrar LLM en sus flujos de trabajo y no presupone conocimientos de programación ni experiencia previa con LLM. Sí presupone, en cambio, que debes estar familiarizada con los conceptos fundamentales del análisis de contenido. Quizás sea útil que eches un vistazo a algún manual o documento antes de seguir.
Alcance y límites de los LLM en análisis de contenido
Los LLM pueden ser aliados potentes para apoyar el análisis de contenido, pero su utilidad depende de un uso controlado y acompañado por el criterio del investigador. Son especialmente buenos para resumir, organizar, agrupar, reescribir y proponer, pero no sustituyen la comprensión contextual, teórica y ética de quien analiza. Pueden introducir sesgos heredados de sus datos de entrenamiento, sobreinterpretar información o inventar detalles. Por ello, requieren instrucciones precisas y supervisión constante.
Es importante entender bien sus capacidades y limitaciones.
| Dimensión | Elementos clave |
|---|---|
| Lo que un LLM sí hace bien | Resumir grandes volúmenes de texto; identificar patrones preliminares o temas tentativos; sugerir estructuras categoriales iniciales; codificar textos en matrices organizadas; elaborar borradores de síntesis e informes. |
| Lo que no debe delegarse al LLM | Interpretación final de los hallazgos; atribución de significado profundo o contextual; construcción autónoma de categorías sin supervisión humana; juicio teórico y relevancia conceptual; responsabilidad ética en el tratamiento de los datos. |
| Aspectos críticos para vigilar | Razonamientos circulares o tautológicos; sobreinterpretaciones o inferencias no justificadas; generalizaciones excesivas; inconsistencias en la codificación entre fragmentos similares; falta de documentación que comprometa la transparencia del proceso. |
En resumen, el análisis asistido por LLM es siempre un proceso interactivo: el modelo acelera tareas repetitivas y estructurales; la investigadora interpreta, valida y decide.
Justificación del uso de LLM en investigación educativa
En investigación educativa, la información que se recoge suele ser abundante, diversa y rica en matices: cuestionarios abiertos, entrevistas, diarios de aula, reflexiones del alumnado, informes de tutores, portafolios, transcripciones de grupos de discusión, planes docentes, o incluso mensajes de foros virtuales. Analizar todo esto manualmente consume tiempo y, en ocasiones, ralentiza las fases exploratorias.
Aquí es donde los LLM aportan un valor claro: permiten agilizar procesos sin renunciar al rigor, siempre que el control interpretativo permanezca en manos de la investigadora.
Aun así, es imprescindible recordar que los modelos pueden cometer errores, sintetizar en exceso o introducir inferencias que no están presentes en los datos. Los LLM no comprenden el contexto educativo, institucional o social más allá de lo que se les proporcione y por tanto su aporte siempre requiere verificación crítica.
Recuerda que, aunque el LLM te entregue una tabla impecable, la que firma el artículo eres tú. Si el modelo se inventa algo y no lo pillas, tú te llevarás un disgusto cuando te pregunten los revisores y la máquina ni se inmutará. Peor aún, te dirá: Lo siento, tienes razón. Me equivoqué. El LLM acelera el proceso de análisis; la investigadora interpreta. Ese es el principio central. Aquí van unos ejemplos.
Ejemplo 1. Respuesta abierta de alumnado (cuestionario)
Dato original (alumna de 2.º ESO):
“Me gusta cuando trabajamos en grupos pequeños porque así puedo preguntar sin vergüenza. En clase grande me pierdo enseguida.”
Qué puede hacer el LLM aquí:
identificar patrones preliminares (comodidad, participación, clima emocional),
proponer categorías tentativas: participación, apoyo entre iguales, barreras en gran grupo,
extraer citas textuales relevantes sin reescrituras.
Qué no debe hacer:
interpretar que la alumna “tiene baja autoestima”,
sugerir causas no mencionadas,
inferir características personales.
Ejemplo 2. Comentarios en un foro institucional (universidad)
Mensaje de una estudiante en Moodle:
“A veces no entiendo bien qué pide cada práctica porque las instrucciones están en sitios distintos. Me ayudaría tener todo unificado.”
Qué puede hacer el LLM:
identificar necesidades de claridad, gestión de materiales, experiencia del estudiante,
proponer una categoría como: demandas de organización de la docencia,
sugerir citas representativas.
Qué no debe hacer:
deducir que el profesor “no planifica bien”,
afirmar que esto impacta en el rendimiento académico.
Aspectos formales de la guía
En primer lugar, en esta guía utilizo de forma preferente el término LLM (Large Language Model) en lugar de la denominación más amplia IA (Inteligencia Artificial). La razón es que el análisis de contenido asistido que se describe aquí se basa específicamente en modelos de lenguaje generativos —como ChatGPT, Claude o Gemini— capaces de procesar texto, generar respuestas y aplicar criterios analíticos complejos. Estos modelos forman parte del campo más amplio de la inteligencia artificial, pero el término IA es excesivamente genérico y abarca tecnologías muy distintas (visión por computador, sistemas expertos, robótica, analítica predictiva). En cambio, el LLM identifica con precisión la herramienta concreta que interviene en el análisis de contenido, facilita describir de forma técnica el proceso y evita confusiones conceptuales. Por ello, y con el fin de mantener rigor terminológico y claridad metodológica, esta guía emplea el término LLM para referirse al agente asistente en todas las fases del análisis.
En segundo lugar, esta guía se ha elaborado tomando como referencia las capacidades de los modelos de lenguaje disponibles en diciembre de 2025. Aunque el funcionamiento de los LLM evoluciona con rapidez, el procedimiento descrito aquí pretende ser útil y duradero, porque se fundamenta en los principios clásicos del análisis de contenido y en una interacción estructurada con el modelo. Es previsible que las futuras mejoras en los LLM (mayor estabilidad en la aplicación de criterios analíticos, reducción de errores y capacidades más sólidas de razonamiento) incrementen la validez y fiabilidad de los resultados, disminuyendo paulatinamente la necesidad de supervisión humana directa en cada paso del proceso. Aun así, el juicio interpretativo del investigador seguirá siendo indispensable y esta guía ofrece una base metodológica tanto para las capacidades actuales como para las que se desarrollen en el futuro.
En tercer lugar, en esta guía se incluyen una serie de instrucciones pensadas para guiar el uso del LLM durante el análisis de contenido. Para diferenciarlas del texto explicativo, estas indicaciones aparecen destacadas en cajas de línea simple, fáciles de reconocer y de copiar directamente cuando sea necesario. Cada caja contiene una acción concreta que puedes pedir al modelo, o una regla que el modelo debe respetar. Yo prefiero llamarlas instrucciones, aunque todos se refieren a ellas como prompts. Un prompt puede ser “buenos días”, es decir, algo que provoca que el LLM responda. Aquí me centro solo en las instrucciones que queremos que siga. Por eso, usaré los dos términos, aunque con el mismo significado. Tendrán el formato de este ejemplo:
Si detectas inconsistencias, sesgos o tareas imposibles, señala el problema antes de continuar.
Aprovecho para aclarar que estos son ejemplos, son propuestas. Los más expertos en este tema dicen que el prompting es tanto un arte como una ciencia. Así que, hacer pruebas para ver lo que funciona mejor es casi una necesidad.
Teniendo en cuenta que lo que aquí explico, puede usarse en su totalidad o parcialmente dependiendo del enfoque de la investigación y las decisiones metodológicas que tomes. Lo he hecho así para que puedan leerse cada capítulo de forma independiente, sin omitir las advertencias que creo que son imprescindibles (lo que te llevará a ver algunas de estas repetidas).
Principios operativos transversales (obligatorios en todo el proceso)
Estos principios se aplican en todas las fases (construcción, refinamiento, codificación, síntesis e informe). No los olvides. Esto lo pongo aquí para que ajustes tus expectativas sobre qué puede hacer un LLM para ayudarte y qué no. Pero, como he comentado en el párrafo anterior, insistiré en ellos en cada apartado.
Fundamentos del análisis de contenido
En este capítulo te presento los principios conceptuales que sostienen el procedimiento de análisis de contenido asistido por LLM. Aunque espero que ya tengas una idea clara de qué es el análisis de contenido, hago una síntesis para situarte en el marco metodológico que utilizaré al aplicarlo en los siguientes capítulos.
Definiciones y conceptos clave
Análisis de contenido
El análisis de contenido es un método de análisis sistemático para identificar, organizar e interpretar significados presentes en datos textuales. En investigación educativa se utiliza para analizar:
respuestas abiertas de cuestionarios,
entrevistas,
foros, correos o chats educativos,
portafolios o diarios,
evidencias de aprendizaje,
otros tipos de documentos que contengan textos abiertos.
El objetivo es transformar datos textuales en información organizada y, de ahí, en interpretación fundamentada. Los datos (corpus) solo adquieren ese estatud cuando son interpretados en un marco coherente y estable.
Unidades de análisis
Lo primero que hay que decidir es cuál es la unidad de análisis, es decir, el conjunto textual que analizará: respuestas completas a una pregunta en una encuesta, frases sueltas, párrafos, o unidades semánticas definidas por la investigadora (ej., ideas completas). Ejemplo, un mensaje en un foro (reproducción literal, ortografía sin corregir):
ID03216 - Hola quisiera saber donde es en terminos relativos , ingenieria tecnica industrial, menos dura, numero de egresados donde puede verse de cada universidad o alguna informacion en relacion al tema
Categorías
En cada unidad de análisis puede haber una o varias categorías: etiquetas o conceptos que representan patrones, ideas o temas identificados en el texto. Ejemplos: rendimiento académico, Familia profesional, Acceso a la universidad, Empleo, …
Codificación
Para identificar las categorías en las unidades de análisis, utilizamos un proceso que denominamos codificación. Hay dos niveles de aplicación en los textos abiertos: (a) codificación interna por segmentos (frases, unidades semánticas, párrafos) y (b) codificación a nivel de documento cuando una categoría funciona como un atributo o variable del caso (por ejemplo, clasificar el documento por nivel educativo del que responde (Educación Superior/FP/…), perfil (hombre/mujer/…) u otras variables analíticas. Ejemplos:
Codificar un segmento de un mensaje: identificar en el texto la frase 'no sé si hacer el grado superior' y asignarle el código FP Grado Superior. Codificar un documento: analizar un mensaje completo para determinar, mediante indicadores lingüísticos, si el autor es hombre, mujer o neutro (género del usuario).
Tema (o dimensiones)
Las categorías pueden tener elementos en común. En ese caso, realizamos agrupaciones que integran varias categorías y expresa una idea central o un patrón significativo. Las categorías deben ser el último nivel de una estructura jerarquizada, que puede tener más de dos niveles de agrupación, que podemos llamar temas o dimensiones. Ejemplos:
Dimensión temporal: el tema "Etapas", que agrupa categorías jerárquicamente inferiores como: Preuniversitaria, EBAU, Universidad y Empleo.
Dimensión de contenido: el tema "Aspectos Actitudinales", que integra las categorías de Emociones (miedo, esperanza), Intenciones y Dificultad percibida.
Tipos de análisis: inductivo, deductivo y mixto
Inductivo
En el proceso de codificación podemos utilizar una estrategia inductiva, con la que creamos las categorías a partir de lo que encontramos en el texto.
Esta estrategia es útil cuando se exploran fenómenos poco estudiados, no existe un marco teórico previo, se explora un fenómeno nuevo o se desea capturar el contenido del texto sin forzar interpretaciones previas.
Un LLM es útil aquí para sugerir patrones iniciales.
Deductivo
También podemos utilizar una estrategia deductiva. En ella utilizamos categorías previas que se derivan de teorías, investigación existente, marcos conceptuales, rúbricas o cuestionarios previos.
Esta estrategia es útil cuando el objetivo es comprobar, contrastar o aplicar teorías previas.
Un LLM actúa como asistente para aplicar el sistema categorial predefinido a las unidades de análisis.
Mixto
El enfoque mixto combina ambos, aplicando categorías previas y permitiendo que surjan nuevas. Combina categorías predefinidas y emergentes.
Es el más habitual en estudios complejos y un LLM permite ajustar y enriquecer el sistema.
Riesgos
En el enfoque inductivo, el principal riesgo al usar LLM es sobredimensionar las propuestas iniciales y aceptar categorías poco fundamentadas; en el deductivo, el peligro es forzar los datos para que encajen en marcos teóricos preestablecidos; en enfoques mixtos, ambos riesgos coexisten y exigen una vigilancia especialmente cuidadosa.
Aquí tienes una tabla con el resumen.
| Criterio | Inductivo | Deductivo | Mixto |
|---|---|---|---|
| Punto de partida | Los datos | Marco teórico previo | Teoría y datos |
| Sistema de categorías | Emergen progresivamente del corpus | Definidas antes del análisis | Categorías iniciales que se revisan y ajustan |
| Relación con la teoría | La teoría se construye a partir de los datos | La teoría guía el análisis | La teoría orienta, pero se revisa a la luz de los datos |
| Grado de apertura | Muy alto | Bajo | Medio–alto |
| Ventajas principales | Descubre temas no previstos; alta sensibilidad al contexto | Mayor control conceptual; facilita la comparabilidad | Equilibrio entre rigor y apertura; alta adaptabilidad |
| Riesgos o límites | Dispersión inicial; categorías inestables | Forzar los datos; perder información relevante | Requiere mayor control metodológico |
| Uso típico en investigación educativa | Estudios exploratorios, análisis de experiencias del alumnado | Evaluación de programas, aplicación de modelos teóricos | Investigación educativa aplicada (muy frecuente) |
| Papel del LLM | Apoya la identificación de patrones preliminares, la exploración temática y la propuesta inicial de categorías, siempre bajo revisión humana | Aplica de forma sistemática un sistema categorial previamente definido y facilita la codificación consistente del corpus | Apoya tanto la exploración inicial como el refinamiento y ajuste de categorías, facilitando iteraciones rápidas entre teoría y datos |
Unidades de análisis y segmentación del texto.
La calidad del análisis depende en gran medida de la definición precisa de la unidad de análisis.
| Tipo | Descripción | ¿Cuándo usarlo? |
|---|---|---|
| Respuesta completa | Se codifica cada respuesta como un todo | Cuestionarios cortos o muy directos |
| Frase | Segmento delimitado por signo de puntuación | Respuestas largas pero estructuradas |
| Unidad semántica | Idea completa independientemente de la longitud | Entrevistas, narrativa compleja |
| Párrafo | Bloques textuales extensos | Documentos institucionales o reflexiones largas |
| Turno de habla | Intervención de un participante | Grupos de discusión |
| Entrada de diario | Texto de un día o entrada en un diario | Diarios |
Los LLM trabajan bien con cualquiera de estos niveles, pero requiere instrucciones explícitas para cada caso. Además, conviene distinguir si vas a:
codificar dentro de cada documento (segmentos/unidades de significado),
codificar el documento completo cuando la categoría se usa como atributo/variable del caso (p. ej., presencia de tema, tipo de documento, perfil del respondiente, etc.).
Ejemplos de instrucciones:
Utiliza la frase como unidad de análisis y no dividas en unidades más pequeñas.
Identifica unidades de significado dentro de cada respuesta.
Trata cada respuesta completa como un caso y asigna variables/atributos a nivel de documento.
El papel del investigador en la interpretación.
Aunque los LLM pueden sugerir categorías, resumir, codificar y sintetizar, no comprenden el contexto educativo en el sentido profundo que requiere un análisis riguroso. El investigador aporta:
sensibilidad hacia el contexto institucional y sociocultural,
conocimiento teórico,
criterio para valorar pertinencia,
capacidad reflexiva para interpretar,
revisión crítica del trabajo del modelo.
El principio que se debe seguir siempre es el P1: el LLM propone y tú decides.
Diferencias entre análisis manual y asistido por LLM
El análisis manual y el asistido comparten principios metodológicos, pero difieren en ritmo y recursos. Frente al análisis manual, el asistido por LLM presenta las siguientes:
Ventajas
Reducción del tiempo de lectura inicial.
Identificación rápida de patrones preliminares.
Generación automática de propuestas de categorías.
Codificación ordenada en tablas.
Ayuda en la redacción de síntesis y borradores sobre los resultados.
Consistencia en el tratamiento de grandes volúmenes de texto.
Limitaciones
Riesgo de sobreinterpretación.
Categorías demasiado generales si no se ajustan.
Codificación mecánica sin matices.
Falta de sensibilidad hacia detalles de contexto.
Requiere supervisión constante y revisión transversal.
Recomendación: El análisis asistido por un LLM no reemplaza al análisis manual, sino que lo optimiza, lo hace más eficiente. La mejor práctica consiste en usar el LLM para acelerar tareas, proporcionar alternativas y generar estructura, mientras tú mantienes el control interpretativo.
Aquí tienes una tabla resumen.
| Dimensión | Análisis manual | Análisis asistido por LLM |
|---|---|---|
| Velocidad | Lenta en corpus grandes | Alta incluso con grandes volúmenes |
| Escalabilidad | Limitada por tiempo humano | Alta |
| Consistencia | Puede variar entre sesiones | Alta si las instrucciones son estables |
| Riesgo de sesgos | Humanos explícitos | Humanos + sesgos del modelo |
| Transparencia | Alta si se documenta bien | Requiere documentación explícita |
| Rol del investigador | Codifica e interpreta | Interpreta, valida y decide |
| Tipo de tareas | Interpretativas y técnicas | Técnicas aceleradas + supervisión humana |
Ya tienes el mapa conceptual. Sabes qué es el análisis de contenido, cómo funciona un LLM en ese proceso y qué tipo de análisis vas a hacer. Ahora toca bajar al terreno: antes de pedirle nada al modelo, tienes que preparar tus datos. Si esta fase se hace bien, todo lo demás fluye. Si se hace mal, tarde o temprano tendrás que volver aquí. Vamos a la Parte II.
Preparación
Preparación de los datos
- Define las preguntas de investigación y los objetivos del estudio. → Cap. 1.1
- Decide el enfoque del análisis: inductivo, deductivo o mixto. → Cap. 2.2
- Identifica el tipo de corpus que vas a analizar y la unidad de análisis adecuada. → Cap. 2.3
La calidad del análisis asistido por un LLM depende inicialmente de la calidad de los datos que recibe el modelo. En este capítulo, te explico cómo recolectar, procesar y organizar los textos antes de pedirle a un LLM que los analice. Una preparación adecuada reduce errores, mejora la consistencia y permite aprovechar mejor sus capacidades.
Hay que evitar detectar errores en los datos durante el proceso de análisis. Si surgen, entonces, lo más habitual es que tengas que retroceder, corregirlos y rehacer parte del trabajo. Esto te hará perder tiempo y, muy probablemente, la serenidad. Así que dedica tiempo a depurar bien tus textos iniciales.
Recolección de datos: fuentes habituales en investigación educativa
En investigación educativa es habitual trabajar con diferentes tipos de texto. Antes de iniciar el análisis, conviene revisar su relevancia, su relación con las preguntas de investigación y valorar la conveniencia de incorporar información de contexto.
Los LLM pueden trabajar con cualquier tipo de texto, pero recuerda que en investigación educativa los materiales más comunes son:
Respuestas abiertas de cuestionarios (frecuentes en estudios de percepciones, competencias, satisfacción…).
Entrevistas semiestructuradas o grupos focales (transcritos).
Diarios de aprendizaje y reflexiones del alumnado.
Informes y documentos institucionales (p. ej., planes de centro, memorias de innovación).
Mensajes en plataformas educativas (foros, Moodle, Teams, chats…).
Producciones escritas del alumnado (ensayos, portafolios, comentarios).
Cada tipo de dato requiere decisiones específicas:
¿Cuál será la unidad de análisis?
¿Se segmentará en frases, párrafos, unidades semánticas?
¿Se necesitan datos contextuales adicionales?
¿Debe anonimizarse?
Limpieza y anonimización
Antes de usar un LLM es imprescindible:
A. Eliminar información personal o sensible.
nombres de estudiantes o docentes,
centros educativos,
teléfonos, direcciones,
identificadores directos,
datos de salud y
otra información de especial protección.
Si la presencia de ciertos datos es analíticamente relevante (por ejemplo, el rol de una persona), conviene sustituir ese dato por etiquetas, por ejemplo, Docente A, Alumno 3 o Centro X.
B. Corregir errores que dificulten la lectura del modelo
No es necesario corregir todo, pero sí lo que pueda impedir comprensión, como textos duplicados, líneas incompletas, saltos de página o formatos irrelevantes.
C. Unificar el formato
Aunque en esto no hay una norma única, estas son algunas recomendaciones de formato: texto plano o tabla simple, sin colores ni sangría y con caracteres estándar.
Tu Semáforo de Seguridad Ética.
Antes de subir cualquier dato a la plataforma, detente un segundo y comprueba en qué color estás. Recuerda que la privacidad es un principio obligatorio (P5):
Formatos recomendados
Los modelos trabajan bien con listas numeradas, bloques de texto delimitados (comas, tabuladores, …), tablas sencillas y párrafos claros. Es preferible evitar formatos complejos y priorizar el texto plano bien estructurado. La numeración de respuestas (R1, R2, R3…) facilita la trazabilidad durante la codificación.
Ejemplo para un bloque de datos:
| ID | RESPUESTA |
|---|---|
| R1 | Creo que la competencia digital es importante para motivar a los estudiantes. |
| R2 | Uso TIC, pero siento que me falta formación. |
| R3 | La escuela no dispone de suficientes recursos tecnológicos. |
Gestión por bloques de análisis
La mayoría de los modelos funcionan mejor cuando se evitan cargas excesivas. En lugar de enviar todo el corpus de una vez, puedes trabajar por bloques (por ejemplo, 50–200 respuestas breves o una entrevista completa). Usa nombres claros para cada bloque. Por ejemplo:
Bloque A: percepción sobre recursos digitales
Bloque B: formación docente
Si cargas muchos datos de una vez el modelo puede saturarse, perder contexto, generar categorías demasiado generales u olvidar instrucciones anteriores. Al hacerlo por partes, el LLM mantienen mejor el contexto, reduce problemas de longitud y permite ir refinando el sistema categorial de forma incremental.
Casos especiales: respuestas cortas, ruido y multilenguaje
Las respuestas muy cortas, el ruido, el multilenguaje y la ortografía deficiente pueden requerir decisiones específicas: marcarlas como no codificables, pedir al modelo que traduzca o que corrija solo ortografía sin alterar el contenido. Estas decisiones deben documentarse, pues afectan a la interpretación.
A. Respuestas muy cortas
Ejemplo: “Sí”, “No”, “Depende”, pueden ser respuestas insuficientes o no relevantes para la investigación. En ese caso una posible solución es:
Detecta respuestas no codificables o insuficientes (como “Sí”, “No”, “Depende”) y agrúpalas en una categoría general llamada “Respuestas mínimas”, sin asignarles interpretación temática.
B. Ruido o textos irrelevantes
Pueden aparecer frases sueltas, respuestas en blanco, duplicados, … En estos casos, hay que eliminarlos antes del análisis o pedir al modelo que los marque como no analizables.
C. Datos en varios idiomas
Si se da este caso (no muy habitual), hay que tener en cuenta que el LLM puede procesarlos, pero conviene indicarlo explícitamente dando instrucciones como:
Este conjunto contiene respuestas en español, inglés y catalán.
No traduzcas nada y analiza cada respuesta en su idioma original.
Traduce primero todo el corpus al español de forma literal y sin interpretar. No cambies el contenido.
D. Ortografía deficiente
Los modelos suelen manejarla bien, pero si afecta la comprensión debes dar instrucciones como:
Reescribe estas respuestas corrigiendo solo ortografía y puntuación.
Configurar el LLM para el análisis de contenido
- Recoge, limpia y anonimiza los datos. → Cap. 3
- Aplica el semáforo de seguridad ética antes de cargar datos en plataformas externas. → Cap. 3.2
- Organiza el corpus en bloques numerados y en formato legible para el LLM. → Cap. 3.3
Configurar correctamente un modelo de lenguaje es uno de los pasos más críticos del proceso. La calidad del análisis final depende en gran medida de cómo se prepara el modelo, qué instrucciones recibe y qué restricciones conceptuales se establecen desde el inicio.
Este capítulo contiene un conjunto de principios e instrucciones para configurar ChatGPT, Gemini, Claude u otros LLM de forma orientada a investigación educativa.
El “rol analítico” del LLM
Los LLM no poseen intencionalidad ni comprensión profunda; funcionan por predicción estadística (aunque no lo parezca). Por ello, para que el modelo actúe como aliado metodológico hay que asignarle un rol. En este caso, de asistente experto en análisis de contenido en investigación educativa, cuidadoso con la interpretación, respetuoso con los datos y atento a solicitar aclaraciones ante la ambigüedad.
El rol debe incluir:
competencia en análisis de contenido,
atención a instrucciones metodológicas,
énfasis en no inventar,
obligación de pedir aclaración ante ambigüedad,
respeto al idioma del corpus, criterios de transparencia y trazabilidad.
El rol se puede repetir al inicio de cada sesión o recordarlo periódicamente para mayor consistencia.
Prompt maestro: qué debe incluir
Es conveniente dar unas instrucciones de contexto y de actuación. El prompt maestro define el marco de trabajo: enfoque (inductivo, deductivo o mixto), estilo de respuesta, restricciones (no inventar, no generalizar más allá del corpus) y protocolos para señalar inconsistencias. Esta instrucción se debe utilizar al inicio de cada sesión o fase del análisis.
El prompt maestro es la configuración inicial que orienta toda la conversación. Es utilizable para, por ejemplo, ChatGPT, Gemini y Claude sin cambios significativos.
Dile al modelo:
A. El rol (como se vio en 4.1. )
Actúa como asistente experto en análisis de contenido en investigación educativa. Tu función es ayudarme a explorar, categorizar y sintetizar datos textuales, siguiendo criterios de rigor académico. No inventes información. Solicita aclaraciones cuando sea necesario.
B. El marco metodológico
Trabajaremos mediante un análisis de contenido inductivo/deductivo/mixto.
Sigue los pasos de exploración, categorización y síntesis que te indicaré.
C. El estilo de respuesta
El estilo de la respuesta debe ser claro/estructurado/académico, pero no excesivamente técnico/técnico/con ejemplos/con citas textuales/ …
D. Restricciones
No realices inferencias que no estén basadas en datos.
Si algo no puede determinarse, indícalo.
No generalices más allá del corpus proporcionado.
E. Control de errores
Si detectas inconsistencias, sesgos o tareas imposibles, señala el problema antes de continuar.
Gestión de versiones y memoria conversacional.
Los LLM funcionan mediante hilos o sesiones. Es recomendable separar sesiones por etapas (exploración, categorías, codificación, síntesis), repetir el prompt maestro cuando se abre un nuevo hilo y recordar siempre qué versión del sistema categorial se está utilizando. Guardar las salidas clave (versiones de categorías, tablas) es esencial para la trazabilidad.
Por ejemplo, crear sesiones separadas según fase:
Sesión 1: exploración inicial
Sesión 2: elaboración de categorías
Sesión 3: codificación
Sesión 4: síntesis e informe
Reglas para evitar pérdida de contexto:
Repetir el prompt maestro al inicio de cada sesión.
Indicar la versión del sistema categorial. Cargar únicamente los datos necesarios para cada tarea.
Vamos a trabajar con el sistema de categorías versión 2.0 [adjuntar].
Guardar manualmente los outputs importantes:
lista de categorías,
tablas de codificación,
síntesis previas.
Mantener orden de carpetas y nombres:
Categorias_v1.docx
Categorias_v2.docx
Codificación_BloqueA.xlsx
Consejo de investigadora a investigadora: tu bitácora de investigación.
Para cumplir con el principio de trazabilidad (P3), no confíes solo en la memoria del chat. Te sugiero que abras un documento sencillo donde anotes:
| Campo de registro | Explicación para la investigadora | Ejemplo de uso |
|---|---|---|
| Fecha y Modelo | Registra el día exacto de la sesión y la versión específica del LLM. Esto es crucial porque las capacidades de los modelos evolucionan con gran rapidez. | 14 de marzo, ChatGPT-5. |
| Descripción de la sesión | Indica el contexto del "hilo" de conversación. Es importante saber si el modelo tiene memoria de pasos previos o si has empezado "de cero" para evitar sesgos acumulados. | Continúo analizando desde el punto donde lo dejé Vuelvo a empezar el análisis del documento ID23 |
| Instrucciones clave | Documenta cualquier cambio o matiz que hayas introducido en tu prompt maestro. Si pegas aquí la instrucción exacta, podrás replicar el resultado meses después. | Modifiqué la instrucción añadiendo “identifica ideas duplicadas”. |
| Observaciones | Anota impresiones cualitativas sobre el desempeño del modelo o bloqueos conceptuales. Esto te ayudará a interpretar los datos sin desesperarte intentando recordar qué sucedió en esa sesión. | Hoy el modelo está especialmente creativo Parece que se ha bloqueado con la categoría DOCENCIA |
Fuentes de error y cómo mitigarlas
Entre los errores típicos se encuentran la sobreinterpretación, la creación de categorías excesivamente generales, la pérdida de instrucciones y la inconsistencia entre respuestas. Para mitigarlos se formulan restricciones claras, se recuerdan las reglas periódicamente y se pide al modelo que revise su propia coherencia.
Principales problemas y sugerencias para mitigarlos.
A. Sobreinterpretación o “alucinación”. Los modelos pueden generar inferencias no justificadas.
No realices inferencias que no estén basadas en datos. Si no puedes determinar algo, indícalo.
B. Categorías demasiado generales. Instrucciones: pedir criterios de inclusión/exclusión y ejemplos textuales.
C. Pérdida de instrucciones. Pedir repetir prompt maestro periódicamente.
D. Inconsistencia entre respuestas. Instrucciones: pedir al modelo que revise su propia coherencia.
Revisa si hay categorías aplicadas de forma inconsistente.
Identifica contradicciones y propón ajustes.
E. Ambigüedad en las unidades de análisis. Instrucciones: indicar explícitamente qué unidad utilizar.
F. Mezcla de idiomas. Instrucciones: dar indicaciones claras sobre traducción o no traducción.
Aquí tienes una tabla resumen.
| Fuente de error | Descripción | Riesgos | Estrategia de mitigación |
|---|---|---|---|
| Instrucciones ambiguas | Prompts poco claros o incompletos | Codificaciones inconsistentes | Redactar instrucciones explícitas y reutilizables |
| Sobreinterpretación | Inferencias no presentes en los datos | Pérdida de validez | Prohibir interpretaciones externas |
| Alucinaciones | Introducción de contenido inexistente | Resultados inválidos | Exigir citas textuales exactas |
| Categorías difusas | Definiciones poco claras | Solapamientos | Refinar definiciones y criterios |
| Falta de control humano | Aceptar resultados sin revisión | Errores sistemáticos | Revisar muestras y versiones |
| Variabilidad del modelo | Cambios entre ejecuciones | Baja reproducibilidad | Documentar prompts y versiones |
Uso de proyectos o espacios persistentes (ChatGPT Projects, NotebookLM, etc.)
Existen entornos de trabajo específicos dentro de los propios LLM, como ChatGPT Projects o NotebookLM, que te permiten organizar documentos, notas y conversaciones en un mismo lugar de forma permanente.
En el contexto del análisis de contenido asistido por LLM, estos espacios pueden funcionar casi como un cuaderno de investigación digital, donde puedes agrupar:
el corpus (respuestas abiertas, entrevistas, documentos);
los documentos metodológicos (diseño, protocolo de análisis, criterios de inclusión/exclusión, etc.);
las distintas versiones del sistema categorial;
notas de decisiones analíticas, registros de cambios y reflexiones;
tablas de codificación exportadas o resúmenes intermedios.
Su uso puede resultarte muy útil cuando el análisis es complejo, largo en el tiempo o implica diferentes tipos de documentos. Sin embargo, también introduce riesgos y limitaciones que es importante conocer y explicitar en la propia investigación. Tu decisión de usarlo o no debe basarse en el análisis de estas ventajas e inconveniente sobre tu proyecto concreto.
Ventajas
a) Centralización de la información del estudio
Un proyecto permite reunir en un único entorno:
el corpus (por ejemplo, todas las respuestas abiertas del cuestionario),
documentos de referencia (artículos clave, marco teórico, criterios de análisis),
la guía metodológica que se está siguiendo,
revisiones y versiones anteriores del sistema de categorías.
Esto reduce la dispersión típica de tener muchos archivos sueltos (Word, PDF, hojas de cálculo) y facilita que el modelo pueda “ver” el conjunto de documentos relevantes cuando interactúa con el investigador.
b) Mantenimiento de contexto entre sesiones
En una conversación “normal” con el modelo, el contexto se pierde o se fragmenta cuando se cierra la sesión o se supera el límite de mensajes. En cambio, los proyectos o notebooks mantienen:
la historia de interacciones,
los documentos adjuntos,
y, a menudo, un resumen persistente del contenido clave.
Esto hace posible retomar el análisis días o semanas después sin tener que volver a explicar todo desde cero, lo que resulta muy práctico para las personas que tenéis que combinar vuestra investigación con docencia u otras tareas.
c) Reducción de la repetición de instrucciones
Cuando se trabaja sin proyectos, hay que repetir en cada sesión:
el contexto del estudio,
las preguntas de investigación,
el tipo de análisis (inductivo, deductivo, mixto),
el rol del modelo (asistente en análisis de contenido),
las advertencias de “no inventar”, etc.
En un proyecto, gran parte de esta información se puede fijar al inicio y el modelo la tiene disponible como referencia recurrente. Esto ahorra tiempo y reduce el riesgo de olvidar alguna indicación importante.
d) Función de “cuaderno de investigación” digital
Un proyecto puede utilizarse como un espacio de registro metodológico, donde se van guardando:
decisiones sobre fusiones y divisiones de categorías;
versiones (v1.0, v2.0, v3.0) del sistema categorial;
justificaciones de cambios;
exploraciones descartadas, pero documentadas.
Aunque esto no sustituye al registro formal en un documento propio (por ejemplo, un diario de investigación o el apartado de método en tu informe de investigación), sí puede complementarlo y servir como borrador o repositorio de trabajo.
e) Búsqueda semántica dentro de los documentos
Algunos entornos permiten buscar fragmentos relevantes dentro de los documentos cargados, no solo por palabras clave, sino por significado. Esto puede ayudar a:
localizar rápidamente citas textuales que ejemplifiquen una categoría;
comprobar si un tema realmente aparece en el corpus o solo en la síntesis;
revisar cómo se utiliza un concepto concreto en diferentes partes del material.
En términos de análisis de contenido, esta función puede agilizar la recogida de evidencias para justificar hallazgos.
f) Soporte para análisis iterativos y complejos
En estudios extensos (por ejemplo, varias olas de recogida de datos, o varios grupos de participantes), el proyecto puede contener subcarpetas lógicas (por bloque, por fase, por grupo), lo que facilita mantener una visión global del análisis y permitir a el LLM moverse entre materiales relacionados sin que el investigador tenga que cargarlos uno por uno en cada mensaje.
Inconvenientes y riesgos
a) Riesgos de privacidad y protección de datos
Subir corpus educativos reales (respuestas de estudiantes, docentes, centros…) a una plataforma externa conlleva riesgos importantes:
posible tratamiento de los datos por parte del proveedor (OpenAI, Google, …);
almacenamiento en servidores externos;
potencial incumplimiento de la normativa de protección de datos, si no se toman medidas adecuadas.
Esto exige:
anonimizar rigurosamente los datos antes de subirlos;
revisar las políticas de privacidad y términos de uso de la plataforma;
seguir las normas éticas y legales de la institución y del proyecto de investigación.
Si el nivel de sensibilidad es alto (por ejemplo, datos de menores, salud, situaciones de vulnerabilidad), puede ser más prudente no usar este tipo de entornos o limitarse a materiales ya anonimizados y muy agregados.
b) Falsa sensación de “seguimiento inteligente”
El hecho de tener un “Proyecto” con muchos documentos puede crear la impresión de que el modelo tiene una especie de memoria profunda y estable del análisis, cuando en realidad:
sigue funcionando por generación de texto predictivo (siempre te dará una respuesta),
puede olvidar detalles relevantes,
y puede no respetar siempre la secuencia lógica de decisiones analíticas.
Podrías acabar confiando en exceso en que “el proyecto ya lo sabe todo” y dejar de verificar la coherencia metodológica. Es importante recordar que el proyecto es una ayuda organizativa, no un sustituto de tu razonamiento.
c) Dependencia tecnológica y problemas de acceso
Si todo el análisis (decisiones, versiones, evidencias) está concentrado en un único proyecto online, cualquiera de estas cosas puede afectar seriamente la continuidad del trabajo:
una incidencia técnica,
un cambio de condiciones del servicio,
la pérdida de acceso a la cuenta.
Por ello, es crucial exportar periódicamente información clave (sistemas categoriales, tablas, síntesis) a documentos locales bajo control del investigador. En general, es conveniente, necesario e, insisto, imprescindible hacer copias de seguridad diarias de todo lo relacionado con tu investigación (o con tu trabajo o con tus cosas personales). Supongo que no hará falta insistir en esto, pero pregunta a alguien que esté haciendo estas copias por haberlo aprendido por las malas (yo mismo). Apréndelo por las buenas.
d) Limitaciones de reproducibilidad
En términos académicos, la reproducibilidad se ve afectada porque:
otros investigadores no podrán replicar exactamente el mismo entorno de proyecto;
los modelos pueden cambiar de versión;
los resultados de un LLM pueden variar con el tiempo.
Esto no invalida su uso, pero obliga a ser más cuidadoso al documentar el procedimiento, las instrucciones, las versiones de los modelos y el contenido central del proyecto.
e) Riesgo de “caja negra” metodológica
Si gran parte del razonamiento y refinamiento se produce dentro del entorno de proyecto y no se registra de forma explícita en otros documentos, parte del proceso analítico puede volverse opaco (o depender totalmente de capturas de pantalla, históricos internos, etc.).
Esto va en contra de los principios de transparencia y verificabilidad de la investigación, por lo que hay que evitar que el proyecto sustituya al diario de investigación o a la sección formal del método en tu informe.
Recomendación
Los proyectos o espacios persistentes pueden ser muy útiles como herramienta de apoyo organizativo cuando el análisis requiere centralizar el corpus, guardar versiones del sistema categorial, mantener la coherencia entre sesiones y disponer de búsquedas rápidas dentro de los materiales cargados. Su uso es especialmente recomendable cuando el trabajo se desarrolla durante largos periodos, implica múltiples documentos o requiere recuperar fácilmente decisiones previas.
No obstante, estos entornos no debes emplearlos como repositorio principal del análisis ni como sustituto del registro metodológico formal. Debes mantener las recomendaciones dadas, como exportar periódicamente los productos analíticos clave (categorías, tablas, síntesis) y registrar por escrito, fuera del entorno del proyecto, las decisiones metodológicas más importantes. Los espacios persistentes pueden complementar el trabajo del investigador, pero no reemplazar los registros documentales exigidos por un análisis de contenido.
Y, muy importante, recuerda que antes de usar un espacio persistente conviene hacerse tres preguntas:
¿el corpus está completamente anonimizado?,
¿la investigación se desarrollará durante un periodo largo con múltiples documentos?,
¿la institución autoriza el uso de estas plataformas?
Si alguna respuesta es negativa, es preferible limitar su uso o trabajar con otras opciones.
Con los datos preparados y el modelo configurado, estás en condiciones de empezar el análisis propiamente dicho. A partir de aquí el trabajo se vuelve más iterativo: explorarás, propondrás categorías, las refinarás y volverás a empezar cuantas veces haga falta. Es normal. Así funciona un buen análisis de contenido, con o sin LLM. La Parte III te acompaña en cada uno de esos ciclos.
Análisis
Análisis exploratorio inicial
- Configura el LLM con el prompt maestro y asígnale el rol analítico. → Cap. 4
- Prepara los datos divididos en bloques para enviarlos progresivamente. → Cap. 3.4
- Nota: en esta fase no necesitas un sistema de categorías todavía. Solo vas a explorar.
El análisis exploratorio es la primera toma de contacto sistemática con tus datos, el corpus. Su objetivo no es construir categorías finales, sino comprender el terreno, identificar posibles patrones y orientar la fase de categorización. Esta fase se beneficia de forma especial de la rapidez y la síntesis que aportan los LLM.
Cómo presentar los datos al LLM
La forma en que se introducen los datos influye en la calidad del análisis. Los bloques de datos deben delimitarse con claridad, usando numeración estable y marcadores de inicio/fin. Es útil indicar brevemente de qué trata el bloque y qué se espera del modelo (por ejemplo, quiero un análisis exploratorio y sin categorías definitivas).
Algunas recomendaciones:
Usar bloques claros y limpios
R1: [respuesta]
R2: [respuesta]
R3: [respuesta]
Incluir un encabezado estable y consistente
A continuación, tienes un conjunto de respuestas sobre [tema].
Analiza únicamente este bloque.
Delimitar el texto. Utilizar triple tilde o triple comilla facilita que el modelo identifique el corpus:
<<< R1[respuesta] / R2[respuesta]>>>
Evitar instrucciones múltiples o ambiguas. Por ejemplo, no pedir a la vez resúmenes, categorías y codificación.
Solicitar resúmenes, patrones y posibles temas
En la fase exploratoria se pide al modelo que sintetice las ideas principales, identifique entre cinco y diez patrones preliminares (dependiendo del tipo de datos) y aporte citas representativas. Esto permite obtener una primera visión del corpus sin comprometer aún un sistema categorial estable.
En esta fase se recomienda comenzar por tareas descriptivas simples:
Aquí tienes un conjunto de respuestas sobre [tema]. Para un análisis exploratorio preliminar quiero un resumen general de las ideas principales (5–7 líneas).
[Esperar respuesta]
Ahora, quiero entre 5 y 10 temas o patrones preliminares con ejemplos textuales breves que representen cada patrón. No generes categorías definitivas, solo patrones.
Identificación rápida de principios interpretativos
Además del resumen y los patrones, es útil pedir al modelo que identifique:
preocupaciones recurrentes,
actitudes positivas/negativas,
factores facilitadores y barreras,
elementos inesperados, preguntas que los datos plantean.
Identifica:
- facilitadores,
- barreras,
- emociones dominantes,
- necesidades expresadas,
- ideas minoritarias pero relevantes.
Esto permite orientar el análisis hacia dimensiones interpretativas sin fijar todavía categorías.
Posibles errores en esta fase
Los LLM pueden cometer errores en esta etapa si no reciben una orientación adecuada.
En primer lugar, es habitual que el modelo confunda los patrones emergentes con categorías definitivas. Esto sucede porque los LLM tienden a organizar la información de manera estructurada, incluso cuando esa estructura aún no ha sido validada. Para evitarlo, es importante especificar de forma explícita que se buscan observaciones preliminares y no categorías consolidadas.
Un segundo problema es la tendencia a sobregeneralizar. Los modelos, al trabajar con grandes corpus de entrenamiento, suelen proponer afirmaciones amplias o abstractas. La manera más eficaz de controlar este riesgo es exigir siempre que cualquier afirmación venga acompañada de citas textuales exactas del corpus, de modo que el análisis se mantenga anclado en los datos reales.
En tercer lugar, pueden aparecer interpretaciones externas no justificadas en los datos. Los LLM, por su naturaleza generativa, pueden incorporar inferencias basadas en asociaciones comunes o en patrones lingüísticos habituales, pero que no están presentes en el corpus analizado. Este problema se puede mitigar indicando de manera explícita que el modelo no debe interpretar más allá de lo que está claramente expresado en las respuestas.
En cuarto lugar, se pueden mezclar temas o dimensiones analíticas de distinta escala. Por ejemplo, el modelo puede combinar emociones individuales con barreras institucionales, generando patrones que carecen de coherencia conceptual. Para prevenir este tipo de confusiones, es recomendable pedir que los patrones se organicen con un nivel analítico claramente definido (por ejemplo: personal, institucional, pedagógico, etc.).
Por último, los LLM tienden a sugerir relaciones causales incluso cuando no están respaldadas por los datos. Estas inferencias suelen surgir porque los modelos están entrenados para completar narrativas plausibles, pero que no necesariamente reflejan el contenido del corpus. Para evitar este problema, debe indicarse expresamente que quedan prohibidas las inferencias causales no justificadas y que solo deben describirse elementos que aparezcan de manera explícita en los textos analizados.
Antes de cerrar el ordenador cada día (y descansar), para que mañana puedas retomar el trabajo sin sobresaltos:
Copia de seguridad. ¿Has exportado la última tabla a un Excel o Word local?
Enlace del chat. Guarda el enlace o el PDF de la conversación actual.
Revisa tu cuaderno de investigación. ¿Has anotado todas tus decisiones?
Ya puedes terminar tu sesión de trabajo con tranquilidad
El error: tratar los patrones preliminares como categorías definitivas.
Por qué pasa: los LLM tienden a estructurar la información incluso cuando se les pide solo explorar.
Cómo evitarlo: indica explícitamente en el prompt que no quieres categorías definitivas todavía. Trata las propuestas como hipótesis provisionales.
Construcción del sistema de categorías
- Completa el análisis exploratorio y prepara una lista de patrones o temas preliminares. → Cap. 5
- Confirma el enfoque del análisis (inductivo, deductivo o mixto). → Cap. 2.2
- Si tu análisis es deductivo: ten preparado el marco teórico o el sistema previo de categorías para proporcionárselo al LLM.
El sistema de categorías es el corazón del análisis de contenido. En esta etapa se pasa de patrones preliminares a una estructura analítica organizada y útil para la codificación y la interpretación. Los LLM pueden acelerar este proceso, pero el investigador debe ejercer un control riguroso para garantizar claridad, pertinencia y coherencia.
Criterios académicos para un buen sistema de categorías
Con LLM o sin LLM, un sistema de categorías debe cumplir una serie de criterios que garantizan su validez, su utilidad analítica y su coherencia interna y externa.
Adecuación al objetivo de investigación.
El sistema debe estar directamente vinculado a las preguntas y propósitos del estudio. Las categorías no deben ser genéricas, sino relevantes para lo que se pretende comprender o explicar.
Exhaustividad.
El conjunto de categorías debe permitir clasificar todos los temas significativos presentes en los datos. Un sistema exhaustivo evita lagunas y asegura que el análisis capture la diversidad del corpus.
Exclusividad.
Las categorías deben ser conceptualmente distintas y mutuamente excluyentes entre sí, de modo que cada una represente un significado claramente diferenciado. Esto no implica que una respuesta completa solo pueda vincularse a una única categoría cuando la codificación se realiza por segmentos: una misma respuesta puede contener varios segmentos y cada segmento puede corresponder a una categoría diferente.
Del mismo modo, cuando las categorías se utilizan como atributos o variables a nivel de documento o caso (por ejemplo, presencia o ausencia de un tema, tipo de respuesta, perfil analítico del respondiente), la exclusividad se aplica a la definición de las categorías, no al número de atributos que pueda presentar un mismo documento. Un mismo caso puede presentar varios atributos, siempre que estos estén claramente definidos y no se solapen conceptualmente.
En ambos usos, lo fundamental es que las categorías no compitan entre sí por el mismo tipo de contenido. Un sistema categorial bien construido evita redundancias, reduce la dispersión y facilita interpretaciones consistentes y comparables.
Claridad conceptual.
Cada categoría debe tener un nombre preciso, una definición clara y criterios que orienten su aplicación. Los elementos incluidos en cada categoría deben compartir esa definición y deben funcionar como un concepto cohesionado, no como un conjunto heterogéneo de ideas. Esta claridad facilita la reproducibilidad y reduce ambigüedades en la interpretación.
Anclaje en ejemplos textuales.
El uso de fragmentos representativos del corpus, como ejemplos de pertenencia, ayuda a delimitar qué entra y qué no en cada categoría. Los ejemplos fortalecen la comprensión, la transparencia y la validez del sistema.
Inductivo: generación de categorías desde los datos
Desde un enfoque inductivo, el LLM puede proponer categorías emergentes a partir del corpus. El investigador revisa esas propuestas, depura términos ambiguos, unifica duplicados y adapta el sistema a la realidad teórica y contextual del estudio.
Los LLM pueden ayudar a generar listas preliminares de categorías, agrupaciones, resúmenes de significados o descriptores operativos.
A partir del siguiente bloque de datos, genera un sistema de categorías inicial.
Para cada categoría incluye:
- nombre breve,
- descripción clara,
- criterios de inclusión,
- criterios de exclusión,
- 2 o 3 citas textuales representativas.
No generes temas superiores todavía.
Deductivo: aplicar categorías preexistentes
Cuando se trabaja con marcos conceptuales previos, el modelo se utiliza para aplicar categorías ya definidas. Se le proporciona la lista de categorías y se le pide que clasifique cada respuesta, siempre con justificación explícita basada en el texto. En el análisis deductivo, las categorías proceden de literatura previa, modelos teóricos, rúbricas, cuestionarios, etc.
Estas son las categorías predefinidas.
Revísalas brevemente y confirma que las comprendes.
[CATEGORÍAS AQUÍ]
Después clasifica cada respuesta dentro de una o varias categorías, siempre con justificación textual.
El LLM debe aprender el sistema, no crearlo.
Un caso especial de codificación deductiva: uso de diccionarios léxicos (lexicón controlado)
Dentro del enfoque deductivo, puede darse una situación particular en la que la asignación de categorías no requiera una interpretación semántica compleja, sino que pueda apoyarse en la presencia explícita de determinados términos o expresiones. Se trata de aquellos casos en los que ciertos elementos léxicos actúan como indicadores inequívocos de una categoría previamente definida, lo que permite implementar una codificación deductiva basada en diccionarios o lexicones construidos ad hoc.
Este procedimiento constituye un caso especial del enfoque deductivo, ya que parte de un sistema de categorías cerrado, validado teóricamente y definido con criterios operativos claros. A diferencia de la codificación inductiva, no busca identificar temas emergentes, ni ampliar el sistema categorial, sino operacionalizar categorías existentes mediante reglas explícitas de decisión.
En el marco del análisis de contenido asistido por LLM, el uso de diccionarios léxicos no debe entenderse como un análisis puramente léxico ni como un sustituto de la interpretación semántica, sino como un mecanismo complementario, especialmente adecuado para determinadas dimensiones estructurales del contenido. En el proyecto AiRISES, este enfoque se aplicó, por ejemplo, a dimensiones como las etapas o niveles educativos, donde la mención explícita de términos como “universidad”, “bachillerato”, “Educación Secundaria” o “Formación Profesional de Grado Superior” permite una asignación directa y robusta de la categoría correspondiente, con un margen mínimo de ambigüedad interpretativa. Piénsalo como un "atajo seguro": si en el texto aparece "Bachillerato", la categoría es "Bachillerato", sin más vueltas.
La construcción del lexicón se realiza a partir del sistema de categorías ya definido, asociando a cada categoría un conjunto finito de términos, variantes y expresiones equivalentes. Este recurso actúa como una regla deductiva formalizada, de modo que la aparición de uno de los términos del diccionario activa la codificación de la categoría correspondiente. La selección de términos se apoya en el conocimiento experto del dominio, en la revisión del corpus y, cuando procede, en iteraciones previas de análisis asistido por LLM.
Desde el punto de vista metodológico, esta estrategia cumple una doble función. Por un lado, permite incrementar la precisión de la codificación en categorías donde los indicadores son explícitos y normativos, reduciendo el riesgo de falsos negativos. Por otro, proporciona un criterio de contraste para evaluar la codificación realizada mediante LLM o por codificadores humanos, facilitando la detección de inconsistencias, omisiones sistemáticas o problemas en las definiciones operativas.
Conviene subrayar que este caso especial de codificación deductiva no debe aplicarse de forma indiscriminada. Su uso es apropiado únicamente cuando existe una correspondencia clara y estable entre términos y categorías. En dimensiones más interpretativas —como actitudes, emociones, valoraciones o intenciones— la codificación semántica asistida por LLM resulta más adecuada. En consecuencia, el enfoque propuesto en esta guía apuesta por un modelo híbrido, en el que la codificación deductiva basada en lexicón y la interpretación semántica asistida por IA se combinan de forma estratégica, en función de la naturaleza de cada dimensión analítica.
La siguiente tabla presenta un ejemplo simplificado de lexicón utilizado para la codificación deductiva de la dimensión etapa o nivel educativo. En este caso, cada categoría se asocia a un conjunto reducido de términos y expresiones cuya presencia en el texto se considera indicador inequívoco de la categoría correspondiente. El lexicón se construye a partir del sistema de categorías previamente definido (niveles educativos) y actúa como regla formal de decisión, de modo que la aparición de cualquiera de los términos listados activa automáticamente la codificación de la categoría, sin necesidad de interpretación semántica adicional.
| Categoría / dimensión | Definición operativa | Términos y expresiones del lexicón (no exhaustivo) |
|---|---|---|
| Educación Secundaria | Referencias explícitas a la etapa de Educación Secundaria Obligatoria o equivalente, con independencia del contexto narrativo del mensaje. | secundaria, ESO, instituto, 4º ESO, 3º ESO |
| Bachillerato | Menciones directas a la etapa de Bachillerato o a cursos que la integran. | bachillerato, bachiller, 1º bach, 2º bach, selectividad (cuando se refiere al contexto de bachillerato) |
| Formación Profesional | Referencias explícitas a la Formación Profesional reglada, sin especificación de nivel. | FP, formación profesional, ciclo formativo |
| FP Grado Medio | Menciones directas a ciclos formativos de grado medio. | grado medio, FP medio, CFGM |
| FP Grado Superior | Menciones directas a ciclos formativos de grado superior. | grado superior, FP superior, CFGS |
| Universidad | Referencias explícitas a la educación universitaria, independientemente del tipo de titulación. | universidad, uni, estudios universitarios, campus |
| Grado universitario | Menciones directas a estudios de grado. | grado, carrera, licenciatura, diplomatura |
| Posgrado | Referencias explícitas a estudios de posgrado. | máster, postgrado, doctorado, doctorado |
Recuerdo que la presencia de cualquiera de los términos incluidos en el lexicón activa automáticamente la codificación de la categoría correspondiente. Este procedimiento se aplica únicamente a dimensiones en las que los términos funcionan como indicadores inequívocos y no excluye la posibilidad de que un mismo mensaje sea codificado en múltiples categorías.
Si quieres que el LLM aplique este diccionario de forma automática y rígida, puedes usar esta instrucción que te ahorrará mucho tiempo de revisión manual:
Actúa como asistente técnico. Te proporciono un lexicón (diccionario de términos) vinculado a un sistema de categorías deductivo.
Tu regla de decisión es simple: si en el texto aparece alguno de los términos del lexicón, asigna automáticamente la categoría correspondiente. No realices interpretaciones semánticas profundas; cíñete a la presencia explícita de las palabras.
[INSERTAR TABLA DEL LEXICÓN AQUÍ, como la del ejemplo de la Tabla 7]
Devuelve los resultados en una tabla de codificación donde aparezca: ID de la respuesta, términos detectados y categoría asignada.
Un consejo: antes de lanzar el lexicón a todo el corpus, haz una prueba con 10 o 20 respuestas. Si ves que el modelo se confunde (por ejemplo, alguien dice "mi hermano está en la universidad" pero ella habla de su experiencia en FP), ajusta el prompt para que distinga el contexto del sujeto.
La aplicación de estas categorías podría dar lugar a una tabla como la siguiente en donde el 1 indica la presencia de la categoría en la unidad de análisis (por ejemplo, en un mensaje).
| ID | Ed.Secundaria | Bachillerato | FP | FP Grado Medio | FP Grado Superior | Universidad | Grado | Posgrado |
|---|---|---|---|---|---|---|---|---|
| DOC1 | 1 | 0 | 1 | 0 | 1 | 1 | 1 | 1 |
| DOC2 | 1 | 1 | 1 | 0 | 1 | 1 | 1 | 1 |
| DOC3 | 0 | 0 | 1 | 0 | 1 | 1 | 1 | 1 |
| DOC4 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 |
| DOC5 | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| DOC6 | 1 | 0 | 1 | 1 | 0 | 1 | 1 | 1 |
| DOC7 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
| DOC8 | 1 | 1 | 1 | 1 | 0 | 1 | 1 | 1 |
| DOC9 | 1 | 1 | 1 | 0 | 1 | 1 | 1 | 1 |
Mixto: plantilla + categorías emergentes
En muchos estudios se combinan categorías preexistentes con otras nuevas que surgen de los datos. El modelo puede añadir categorías cuando detecta contenidos que no encajan en la plantilla, explicando por qué y proponiendo definiciones. El enfoque mixto combina lo mejor de ambas estrategias.
Utiliza este sistema de categorías como plantilla base.
[CATEGORÍAS AQUÍ]
Añade nuevas categorías si aparecen ideas que no encajan.
Para cada categoría añadida:
- explica por qué no encaja en las categorías previas,
- aporta su definición,
- incluye un ejemplo textual.
Este enfoque es habitual en estudios complejos o con múltiples fuentes de datos. En todo caso, es recomendable utilizar la estrategia inductiva, con el fin de asegurarse de que el sistema propuesto es exhaustivo o de que el corpus utilizado propone modificaciones a los marcos existentes. Ambas situaciones son metodológicamente relevantes.
Cómo pedir al LLM descripciones claras, inclusiones, exclusiones y ejemplos
Para evitar categorías vagas, se le debe pedir al LLM que proporcione para cada categoría una descripción precisa, criterios de inclusión y exclusión y ejemplos textuales. También se controla el número total de categorías para mantenerlas manejables. Los modelos suelen generar categorías demasiado generales si no se les guía.
Reformula cada categoría para que cumpla:1) Nombre claro y no ambiguo.
2) Descripción precisa con una sola idea central.
3) Criterios de inclusión.
4) Criterios de exclusión.
5) Ejemplos textuales reales del corpus.
Si alguna categoría no es consistente, propón ajustes.
Trucos útiles:
Pedir que evite sinónimos vagos: “motivación”, “actitud”, “recursos”, … sin especificar.
Solicitar exclusiones explícitas: Incluye X pero no Y.
Restringir el número de categorías (p. ej., entre 6 y 12).
Comparación entre sistemas generados manualmente y por un LLM
Los sistemas generados por IA suelen ser más generales; los construidos por investigadores tienden a una mayor especificidad. La combinación de ambos enfoques permite aprovechar la capacidad de procesamiento y síntesis de un LLM sin renunciar a la profundidad conceptual.
El LLM tiende a:
generar categorías más generales,
agrupar bajo conceptos amplios,
proponer nombres más neutros.
El investigador tiende a:
generar categorías más específicas,
matizar diferencias conceptuales,
ajustar el sistema al marco teórico.
Sugerencia de proceso:
El LLM genera una primera versión (v1.0).
Produce un borrador de categorías a partir del corpus inicial.
La investigadora revisa y ajusta.
Refina el sistema: elimina redundancias, fusiona categorías, aclara definiciones y añade criterios.
El LLM genera la versión revisada (v2.0).
Integra las modificaciones y reorganiza el sistema según las indicaciones.
La investigadora valida el funcionamiento.
Comprueba que las categorías son claras, distintas y aplicables al corpus.
Un segundo LLM realiza una revisión crítica (recomendable).
Ofrece ventajas, problemas y mejoras del sistema categorial, actuando como revisor independiente.
El error: aceptar categorías demasiado generales sin criterios de exclusión.
Por qué pasa: los LLM proponen términos amplios sin especificar qué queda fuera.
Cómo evitarlo: exige criterios de inclusión y de exclusión, además de ejemplos textuales reales del corpus.
Refinamiento y validación del sistema de categorías
- Genera un sistema de categorías versión 1.0 (con LLM, manualmente o combinando ambos). → Cap. 6
- Comprueba que cada categoría tiene, al menos, nombre y descripción provisional.
- ⚠ Aviso: no codifiques el corpus completo hasta terminar este capítulo. La validación del sistema es previa a la codificación masiva.
Una vez construida la versión inicial del sistema de categorías, es imprescindible revisarla y mejorarla antes de utilizarla para codificar todo el corpus. Esta fase, a menudo subestimada, es donde se garantiza la calidad, coherencia y utilidad analítica del sistema. No te la saltes. Tenemos que buscar la coherencia externa (es decir, que una categoría no se parezca tanto a otra que termines lanzando una moneda al aire para decidir cuál de las dos usar). Los LLM pueden ayudar a detectar incoherencias y proponer mejoras, pero la validación final debe ser siempre tuya.
Fusiones, divisiones y nivel de abstracción
En el refinamiento se detectan categorías demasiado amplias, redundantes o ambiguas. Se decide si deben dividirse, fusionarse o renombrarse. El objetivo es lograr un sistema categorial consistente y útil.
Este es el sistema de categorías versión 1.0.
Analiza la coherencia interna y externa e identifica:
1. Categorías demasiado amplias.
2. Categorías redundantes o solapadas.
3. Nombres ambiguos.
4. Diferencias de nivel conceptual.
5. Categorías innecesarias o irrelevantes.
Proporciona propuestas concretas de mejora.
Coherencia interna y externa
El sistema categorial debe funcionar como un mapa conceptual lógico.
Coherencia interna - Cada categoría debe tener una idea central clara, criterios bien definidos, límites precisos y ejemplos textuales consistentes.
Coherencia externa - Las categorías deben diferenciarse claramente entre sí, no solaparse, no contradecirse y tener un nivel de generalidad comparable.
Revisa el sistema categorial y responde:
- ¿Qué categorías están mal delimitadas?
- ¿Qué categorías son demasiado similares?
- ¿Qué categorías deberían agruparse bajo un tema superior?
- ¿Qué categorías carecen de ejemplos claros?
- Sugiere mejoras justificadas.
Ayudas del LLM para detectar ambigüedades
Se puede pedir al LLM que actúe como crítico metodológico, identificando debilidades conceptuales y proponiendo alternativas de agrupación. También es posible realizar pruebas de estrés aplicando el sistema a fragmentos especialmente complejos. Los modelos pueden detectar problemas que al investigador se le escapan debido a la cercanía y cantidad de datos.
Solicitar análisis crítico.
Actúa como crítico metodológico.
¿Qué debilidades conceptuales encuentras en este sistema de categorías?
Proporciona observaciones específicas basadas en definiciones, criterios y ejemplos.
Solicitar alternativas conceptuales.
Propón 2 o 3 formas alternativas de agrupar estas categorías.
Solicitar pruebas de estrés.
Evalúa este sistema aplicándolo a los siguientes 5 segmentos.
Detecta dónde fallan las definiciones y justifica por qué.
Estas pruebas sirven para comprobar si las categorías funcionan realmente.
Ejemplo de evolución en versión 1.0 → 2.0 → 3.0
Versión 1.0 (IA inductiva inicial)
Falta de formación
Escasez de recursos
Motivación por aprender
Uso de tecnología
Apoyo institucional
Problemas detectados:
Categoría 4 demasiado amplia.
Categoría 1 y 3 muy próximas pero diferentes.
Falta de precisión en descriptores.
Versión 2.0 (tras revisión humana + LLM)
Carencias formativas personales
Recursos tecnológicos insuficientes
Disposición individual al aprendizaje digital
Limitaciones del centro para integrar tecnología
Estrategias de autoformación y apoyo entre pares
Mejoras en v2.0:
Categorías más específicas.
Diferenciación clara entre nivel personal e institucional.
Versión 3.0 (sistema final depurado)
Nivel personal
Carencias formativas personales
Disposición individual al aprendizaje
Estrategias de autoformación
Nivel institucional
Recursos tecnológicos insuficientes
Limitaciones organizativas para integrar tecnología
Ventajas de v3.0:
Nivel conceptual consistente.
Claridad en los límites entre categorías.
Mayor utilidad para la codificación y la interpretación.
Documentación de decisiones metodológicas
Es recomendable generar un registro de decisiones que recoja cómo ha evolucionado el sistema, qué cambios se han hecho y por qué. El LLM puede ayudar a redactar este registro a partir de las distintas versiones. La trazabilidad es esencial para garantizar la credibilidad del análisis.
Se recomienda registrar:
versión inicial del sistema (v1.0),
críticas del LLM,
revisión humana,
versión mejorada (v2.0),
motivos para fusiones o divisiones,
criterios finales,
versión final utilizada (v3.0).
Se puede pedir al LLM:
Genera un registro de decisiones basado en estas revisiones.
Incluye versiones, cambios y justificaciones metodológicas.
Este registro será útil para:
el método de la investigación,
anexos,
revisiones por pares,
triangulación con otros analistas.
El error: saltarse el refinamiento y codificar directamente con la versión 1.0.
Por qué pasa: el sistema inicial casi siempre tiene solapamientos y definiciones imprecisas.
Cómo evitarlo: aplica el sistema a 5–10 segmentos reales antes de usarlo en masa.
Codificación asistida
- Valida y refina el sistema de categorías hasta la versión 2.0 o superior. → Cap. 7
- Verifica que cada categoría tiene nombre, definición, criterios de inclusión, criterios de exclusión y ejemplos textuales.
- Organiza los datos en bloques numerados y anonimizados. → Cap. 3.4
- Prepara el prompt maestro para la sesión de codificación. → Cap. 4.2
Llegamos a la parte que suele darnos más dolor de cabeza: la codificación. Pero no te preocupes, aquí es donde el LLM realmente nos va a ahorrar esas horas de mirar y mirar una tabla hasta que las palabras pierden el sentido. La codificación es el proceso mediante el cual se asignan categorías a unidades de análisis. Normalmente esto implica codificar segmentos de texto dentro de cada documento, pero en algunos estudios también se codifica el documento completo cuando ciertas categorías operan como atributos/variables del caso (por ejemplo, presencia/ausencia de un tema, tipo de documento, o características analíticas del respondiente).
Con la ayuda de un LLM, este proceso puede organizarse de forma mucho más rápida y ordenada, siempre que el sistema categorial esté bien definido y que las instrucciones sean muy precisas. En el Capítulo PARTE II. se explica cómo preparar los datos, algo que debes revisar ahora. Hay que recordar que, antes de codificar, se organizan los textos en bloques numerados y se recuerda al modelo qué versión del sistema categorial debe utilizar. Además, los bloques no deben ser excesivamente grandes para evitar saturar el contexto del LLM.
Ahora se explica cómo solicitar codificación en tabla, cómo validar la calidad de la codificación y cómo evitar errores frecuentes.
Cómo pedir tablas de codificación claras y justificadas
Las tablas con los resultados suelen incluir columnas de texto, categoría(s) y justificación. El investigador especifica el formato deseado y si se permite asignar varias categorías a un mismo fragmento. Se insiste en que la justificación se base en citas exactas.
Codifica cada respuesta según el sistema de categorías versión 2.0.
Devuelve la salida en forma de tabla con columnas:
1. Texto (resumen breve de la respuesta o la respuesta completa)
2. Categoría(s) asignada(s)
3. Justificación textual basada en segmentos del corpus
No inventes citas. Si una respuesta no encaja en ninguna categoría, indícalo.
[Opcional: exigir una sola categoría]
Asigna solo la categoría más relevante a cada respuesta.
[Opcional: permitir múltiples categorías]
Una respuesta puede incluir varias categorías si está justificado.
Si, en lugar de codificar segmentos, lo que necesito es codificar atributos/variables a nivel de documento, devuelve una tabla (o matriz) por casos donde cada fila sea una respuesta/documento y las columnas sean atributos (por ejemplo: presencia de X = 1/0), indicando brevemente el criterio para marcar 1.
Cómo gestionar grandes volúmenes de datos
Hay que recordar que, en estudios con muchos casos, se trabaja por bloques (ver apartado PARTE II. 3.4. ) y se guardan las tablas parciales. Debe guardarse cada bloque como un archivo independiente.
Es importante mantener un contexto metodológico estable recordando instrucciones clave y evitando cambiar los criterios a mitad del proceso. Para ello, debe establecerse un contexto permanente. Se sugiere que se repita siempre:
Prompt maestro
Sistema categorial (versión actual)
Unidad de análisis
Formato de salida
Insistir periódicamente en:
No generes categorías nuevas.
No infieras significados no presentes en los datos.
Recuerda que es necesario tener guardadas todas las instrucciones que se den en un documento externo (y aprovecho para insistir en que hagas copias de seguridad).
El error: no especificar la unidad de análisis en la instrucción al LLM.
Por qué pasa: sin instrucción explícita, el LLM decide libremente cómo segmentar.
Cómo evitarlo: incluye siempre la unidad de análisis en el prompt y verifica en la revisión manual.
Validación y control de calidad
- Codifica al menos un bloque del corpus con el LLM. → Cap. 8
- Exporta las tablas de codificación a archivos locales antes de continuar.
- ⚠ Aviso: la revisión manual es obligatoria. No saltes este capítulo aunque el LLM haya generado tablas que parecen impecables.
La codificación asistida por LLM no elimina, en ningún caso, la necesidad de control humano ni de mecanismos de acuerdo interjueces. Igual que en un análisis de contenido tradicional, la calidad del sistema categorial y de la codificación se refuerza cuando se comprueba hasta qué punto distintos jueces, distintos codificadores, coinciden al aplicar las categorías. En este contexto, los jueces pueden ser:
uno o varios investigadores humanos,
uno o varios LLM configurados como codificadores,
una combinación de ambos.
Aunque los LLM pueden acelerar el proceso, la validación metodológica sigue requiriendo tres tipos de control: revisión manual, doble codificación asistida y revisión cruzada entre modelos.
Aquí tienes un resumen de lo que te explico después.
Revisión manual de la codificación asistida
Incluso cuando la codificación se ha realizado con apoyo de un LLM, es imprescindible que tú revises manualmente una muestra suficientemente amplia del material (por ejemplo, entre un 10 % y un 20 % del corpus, o más en estudios sensibles).
Es imprescindible que revises:
La coherencia de la categoría elegida - Valora si la categoría asignada se ajusta realmente al sentido del fragmento y al sistema categorial definido (nombre, definición, criterios de inclusión y exclusión).
La adecuación de la cita textual utilizada como justificación - Verifica que la cita seleccionada por el LLM es representativa del fragmento y que sirve efectivamente para justificar la categoría asignada.
La ausencia de contenido inventado - Confirma que el modelo no ha añadido palabras, matices o ejemplos que no aparecen en el corpus original. Cualquier síntesis o reformulación debe poder rastrearse a partir de datos reales.
Esta revisión manual permite detectar patrones de error sistemático del LLM (por ejemplo, tendencia a sobregeneralizar, a aplicar siempre la misma categoría comodín o a introducir interpretaciones sutiles que no están en el texto). En el caso de detectar un número muy elevado de errores o pocos, pero muy importantes, hay que intentar averiguar por qué, volver a la casilla de salida y corregir el proceso desde el principio.
Pero no esperes a encontrar un error por casualidad. Como responsable final del análisis (P1), sé proactiva para evitar limitar las alucinaciones, lanza este reto al modelo para verificar que no está inventando (P2):
Revisa la tabla de codificación que acabas de generar. Identifica si alguna de las citas textuales ha sido resumida o alterada. Si has 'alucinado' o inventado algún matiz que no está en el texto original, admítelo ahora para que pueda corregirlo.
Si el modelo se disculpa y corrige una cita, habrás mejorado la validez de tu análisis antes de que llegue al informe final.
Doble codificación asistida con el mismo LLM
Una estrategia útil de control interno consiste en solicitar al mismo LLM dos codificaciones alternativas del mismo bloque de datos, con instrucciones metodológicas idénticas, pero con alguna pequeña variación (por ejemplo, de rol), y comparar después los resultados. Esta lógica es análoga a la doble codificación humana cuando se pide a dos codificadores que apliquen el mismo sistema categorial de forma independiente.
Algunas posibilidades:
Pedir una codificación con un enfoque más conservador, por ejemplo:
Vuelve a codificar este bloque utilizando un enfoque más conservador.
Solo asigna una categoría por respuesta.
Pedir una codificación con criterios estrictos:
Codifica este bloque aplicando criterios estrictos.
No codifiques nada que no se exprese de manera explícita en el texto.
Comparar la codificación inicial con la codificación conservadora o estricta permite:
identificar respuestas en las que el modelo duda o cambia de criterio,
detectar categorías que se aplican de forma demasiado laxa,
refinar las definiciones categoriales si se observan ambigüedades.
Desde el punto de vista del acuerdo interjueces, estas dos codificaciones pueden tratarse como si provinieran de dos jueces distintos (LLM-1 modo estándar y LLM-1 modo conservador) y calcular después indicadores de acuerdo (por ejemplo, porcentaje de coincidencia o estadísticos de ajuste).
Discusión con el modelo sobre decisiones de codificación
El LLM también puede emplearse como un juez que explica sus decisiones. En la práctica, esto significa pedir al modelo que justifique por qué ha aplicado una categoría concreta y que reevalúe decisiones dudosas.
¿Por qué asignaste la categoría X a la respuesta R7?
¿Qué elementos del texto justifican esta categoría y no otra?
¿Detectas alguna respuesta que esté codificada de forma inconsistente respecto a la definición de la categoría X?
Este tipo de diálogo sirve para:
hacer visibles los criterios implícitos que el modelo está utilizando,
comprobar si dichos criterios coinciden con la definición formal de la categoría,
ajustar las instrucciones o reformularlas si se detectan desviaciones.
Aunque el modelo no razona como un humano, estas explicaciones pueden ayudar al investigador a identificar puntos ciegos, sesgos o malentendidos.
Además, para evitar la sobredependencia y asegurarte de que tú llevas el mando, no aceptes la primera respuesta del modelo. Ponlo a prueba:
Sé que has asignado la categoría 'A' a este bloque. Ahora, actúa como un evaluador crítico externo y defiende por qué estos mismos datos podrían encajar en la categoría 'B'. ¿Qué matices estaríamos ignorando si nos quedamos solo con tu primera opción?
Esto te obligará a ti a reflexionar sobre la coherencia de tus categorías y a decidir con mucha más seguridad.
Revisión cruzada usando varios LLM (triangulación asistida)
Una forma especialmente interesante de aproximarse al acuerdo interjueces en un entorno asistido por LLM es utilizar varios modelos diferentes como si fueran jueces independientes. Es como pedirle una segunda opinión a otro modelo, como quien consulta a un colega de otro departamento. Por ejemplo:
usar ChatGPT para una primera codificación,
emplear Claude para revisar críticamente esa codificación,
utilizar Gemini para comprobar si hay discrepancias significativas.
Esta estrategia funciona como una forma de triangulación asistida:
Si varios LLM distintos coinciden de manera consistente al aplicar un sistema categorial claro, aumenta la confianza en la estabilidad del sistema y en la robustez de la codificación.
Si, por el contrario, los modelos discrepan con frecuencia, eso puede indicar problemas en la definición de las categorías, en la claridad de las instrucciones o en la propia estructura del corpus.
Desde el punto de vista metodológico, esta revisión cruzada permite tratar a cada LLM como un juez adicional, de forma similar a lo que se hace con varios codificadores humanos.
Ello implica la necesidad de analizar el grado de coincidencia entre diferentes codificaciones, que se evalúan mediante indicadores clásicos de acuerdo interjueces (porcentaje de acuerdo, Kappa, etc.).
En un contexto con LLM, se pueden aplicar sobre:
dos codificaciones del mismo modelo con instrucciones diferentes,
codificación humana vs. codificación LLM (uno o varios),
varias codificaciones realizadas por LLM distintos (lo que permitiría automatizar completamente el proceso).
En el contexto de esta guía, lo más importante es tener claro que:
es posible tratar las codificaciones de distintos LLM y de investigadores humanos como fuentes de datos comparables,
el cálculo de estos indicadores refuerza la credibilidad del sistema categorial y del proceso de codificación,
niveles bajos de acuerdo son una señal de que hay que revisar las definiciones de categorías, las instrucciones al modelo o incluso el diseño del estudio (y, desafortunadamente, volver a empezar).
En conjunto, la combinación de revisión manual, doble codificación asistida, discusión con el modelo y revisión cruzada con varios LLM, apoyada en indicadores clásicos de acuerdo interjueces, permite trasladar al análisis asistido por LLM los estándares de calidad propios del análisis de contenido.
Automatización parcial del análisis en fases avanzadas
Una vez que el sistema de categorías ha sido construido, revisado y validado, puedes plantearte automatizar parcialmente algunas fases del análisis, especialmente la codificación de grandes volúmenes de datos y la generación de síntesis preliminares.
Por automatización me refiero a la creación de flujos de trabajo que ejecutan de manera sistemática y repetible distintas tareas. Por ejemplo, se pueden automatizar tareas de la limpieza inicial de los datos, la generación de tablas, la organización de archivos, la lectura de hojas de cálculo, dividir un corpus en bloques, convertir formatos de archivo, extraer fragmentos textuales, consolidar tablas de codificación y, cuando corresponde, la interacción con un LLM para aplicar un sistema categorial o generar síntesis. La automatización consiste, por tanto, en encadenar pasos que tradicionalmente se realizan de forma manual para que una herramienta digital los realice de manera estable y controlada. Para tu nivel de conocimiento técnico, afortunadamente, muchas de estas tareas pueden automatizarse mediante aplicaciones que no requieren programación, como ChatGPT Automations o Make, que permiten diseñar procesos mediante interfaces visuales. La referencia a estas herramientas corresponde al panorama de la redacción de este documento (diciembre de 2025), aunque es previsible que estas funcionalidades se vuelvan cada vez más accesibles y fáciles de usar, dada la evolución reciente del sector. La automatización no debe entenderse como un reemplazo del análisis de contenido tradicional, sino como un mecanismo de eficiencia que se aplica solo después de verificar que el modelo aplica las categorías de forma coherente y estable. En conjunto, permite agilizar el trabajo técnico y liberar tiempo para la interpretación, que sigue siendo responsabilidad de la investigadora.
Condiciones necesarias
Ya hemos mencionado todas las fases y cautelas, pero conviene recordar aquí los requisitos para automatizar un proceso que nos permita tener la mayor seguridad posible de la calidad de los resultados. Para que la automatización sea metodológicamente válida, debe cumplirse, al menos, lo siguiente:
a) Sistema categorial estable y bien definido
Las categorías deben tener nombre claro, descripción precisa, criterios de inclusión/exclusión y ejemplos representativos.
Debe haberse superado al menos una ronda de refinamiento asistido por LLM (versión 2.0 o 3.0).
b) Pruebas de fiabilidad previas
Revisar manualmente una muestra amplia del corpus (10–20%).
Comparar dos codificaciones generadas en momentos diferentes.
Comprobar que no hay inventos ni inferencias fuera del texto.
c) Homogeneidad relativa del corpus
La automatización funciona mejor cuando los textos:
pertenecen al mismo tipo (todas respuestas breves, todas entrevistas…),
se refieren al mismo fenómeno educativo,
siguen un estilo y estructura comparables.
d) Definición clara de la unidad de análisis
Antes de automatizar codificación masiva, hay que fijar si se codifica:
la respuesta completa,
la frase,
la unidad semántica.
e) Controles de calidad obligatorios
Incluso con automatización:
hay que revisar manualmente muestras periódicas,
registrar contradicciones o anomalías,
refinar instrucciones si aparecen sesgos.
Qué puede automatizarse
Se pueden automatizar muchas cosas. Aquí van algunas a modo de ejemplo:
Codificación masiva por bloques: el modelo puede procesar cientos de respuestas en tandas de 50–100, aplicando el sistema categorial establecido.
Generación de tablas de codificación en diferentes formatos: tabla de texto, CSV, Markdown o Excel.
Síntesis por categoría o por tema: por ejemplo, resumen de todas las unidades que entran en la categoría X o detección de patrones transversales.
Detección automática de incoherencias: una automatización puede revisar si una categoría se está usando de forma desigual, las citas justifican la asignación, hay categorías vacías o sobrecargadas.
Extracción de citas representativas: el LLM puede recolectar automáticamente las citas más frecuentes, las más intensas, las que expresan contradicciones.
Revisión cruzada con otro modelo: en automatizaciones complejas se puede codificar con ChatGPT, revisar con Claude y verificar coincidencias.
Riesgos y advertencias
A pesar de sus ventajas, la automatización implica riesgos importantes:
Perder matices o excepciones
Priorizar patrones dominantes.
Reproducir errores sistemáticos.
Si el sistema categorial tiene una ambigüedad, la automatización multiplica el error en lugar de reducirlo.
Sobrerrepresentación de categorías amplias.
El LLM tiende a inclinarse hacia categorías muy generales si no se le recuerda continuamente los criterios de exclusión.
Dependencia excesiva de la automatización.
El investigador puede pasar a actuar de forma automática sin revisar críticamente.
Por eso, siempre debe haber verificación humana, aunque la automatización sea alta.
Automatización del análisis mediante ChatGPT Automations (flujo de trabajo)
Los ChatGPT Automations permiten (a fecha de hoy, que puede cambiar) crear flujos de trabajo que ejecutan tareas repetitivas del análisis de contenido sin intervención manual continua. Son especialmente útiles en fases avanzadas, cuando el sistema categorial ya ha sido validado y se desea procesar grandes volúmenes de datos manteniendo un control de calidad riguroso. Este apartado explica cómo estructurar un flujo de trabajo en ChatGPT para automatizar parcialmente la codificación y la síntesis, manteniendo los principios del análisis de contenido tradicional. La forma específica debes consultarla en la propia aplicación: puede cambiar en cualquier momento. Aquí te pongo un ejemplo de los pasos que podrían automatizar en orden:
Ejemplo de automatización: identificación automatizada de perfiles
Trigger (Disparador): Recepción del corpus ya segmentado (por ejemplo, los 1.886 mensajes específicos sobre Formación Profesional). Acción 1 (Clasificación Masiva): El sistema administra de forma automática un prompt especializado a cada mensaje para identificar el género del autor (femenino, masculino o neutro) basándose en indicadores lingüísticos como adjetivos predicativos y pronombres. Acción 2 (Generación de Alertas): El flujo marca automáticamente como Neutros aquellos mensajes donde no existen indicadores de género claros, evitando que el modelo realice inferencias arriesgadas o inventadas. Acción 3 (Control de Calidad Integrado): La automatización separa una muestra aleatoria (por ejemplo, 50 mensajes) para que tú, como investigadora, realices una revisión experta. Si el margen de error supera un umbral (en el caso real fue del 14%), el flujo se detiene para el refinamiento del prompt. Acción 4 (Consolidación de Datos): Una vez validado el prompt (alcanzando el 100% de concordancia), el sistema procesa el resto del corpus y vuelca los resultados en un archivo compatible con software estadístico como JASP o SPSS.
Recomendación
La automatización parcial del análisis es una herramienta potente y eficiente, pero solo debe usarse después de consolidar y validar el sistema categorial y verificar la estabilidad del modelo. Los pasos pueden agilizar la codificación masiva, la extracción de citas y la síntesis inicial, pero requieren controles de calidad constantes: revisión humana de muestras, triangulación entre modelos y documentación detallada de cada paso. Antes de automatizar, los datos deben estar completamente anonimizados y los riesgos de privacidad cuidadosamente evaluados. En ningún caso la automatización sustituye la responsabilidad analítica del investigador; debe servir únicamente como una extensión técnica del análisis de contenido tradicional.
Una vez validado el sistema y revisada la codificación, el análisis técnico ha terminado. Lo que viene ahora es la parte que más te pertenece: convertir toda esa estructura de categorías en conocimiento. La síntesis analítica y el informe son donde tu mirada investigadora toma el protagonismo que el LLM nunca podrá tener.
Tras terminar la codificación, llega la etapa más interpretativa y conceptual del análisis: la síntesis analítica. Yo creo que es la etapa más interesante y, sin duda, la más útil desde el punto de vista de la generación de conocimiento. Su objetivo es articular los hallazgos, identificar relaciones entre categorías, extraer significados profundos y redactar una narrativa coherente que responda a las preguntas de investigación. Los LLM pueden ayudar generando borradores de síntesis, identificando tensiones y agrupando patrones. Sin embargo, una vez más insisto, la interpretación final es responsabilidad del investigador, es tu responsabilidad.
El error: aceptar las tablas del LLM sin revisión manual.
Por qué pasa: el LLM puede generar tablas formalmente impecables pero con citas alteradas o inventadas.
Cómo evitarlo: revisa al menos el 10–20% comparando con el corpus original.
Síntesis e informe
Síntesis analítica
- Valida la codificación y consolida todas las tablas en un único archivo. → Cap. 9
- Confirma que el sistema de categorías está en su versión final.
- Recuerda: el LLM puede generar borradores, pero la interpretación es responsabilidad tuya.
A partir de la codificación se construyen narrativas temáticas que integran categorías y responden a las preguntas de investigación. El LLM puede proponer borradores de estas narrativas, borradores. Para ello, puedes pedir al LLM que:
Analice patrones entre categorías
A partir del sistema categorial y la tabla de codificación, identifica los principales hallazgos temáticos y organízalos en 3–6 temas.
Redacte un borrador de síntesis
Redacta un análisis temático académico de 3–5 párrafos, basado únicamente en la información contenida en los datos codificados. Incluye ejemplos textuales breves.
Compare temas para buscar diferencias y similitudes
Explica las relaciones entre estas categorías y cómo se agrupan en temas más amplios. La clave es mantener la fidelidad al corpus.
Integración de citas textuales
Incluir citas textuales refuerza la credibilidad del análisis. El modelo puede seleccionar opciones, pero el investigador debe verificar su exactitud y pertinencia. No se trata solo de incluir citas, se trata de localizar los lugares en los que una cita puede ser relevante.
Las citas textuales deben:
representar adecuadamente los datos,
reforzar la credibilidad del análisis,
mostrar matices que la síntesis por sí sola no captaría.
Incluye 1–2 citas textuales representativas por categoría o subtema. No inventes contenido. Usa únicamente citas exactas del corpus.
Buenas prácticas:
Evitar seleccionar siempre las mismas respuestas.
Combinar citas breves y moderadas.
Muy importante, eliminar detalles personales si los hubiera.
Relación entre categorías
La síntesis debe ir más allá de enumerar categorías: debe mostrar cómo se relacionan (apoyo, tensión, causalidad explícita, jerarquía temática). El modelo puede sugerir estas conexiones, que luego se contrastan con el corpus y la teoría. Los LLM pueden ayudar a identificar relaciones del tipo:
causales (siempre con cautela: deben estar explícitas),
condicionales,
complementarias,
contradictorias,
jerárquicas,
temáticas.
Explica cómo se relacionan estas categorías entre sí. Indica cuáles se apoyan, se contradicen o forman parte de un mismo proceso.
Aquí, el LLM puede detectar, por ejemplo:
tensiones entre motivación personal y falta de recursos,
contradicciones entre políticas institucionales y percepciones docentes,
diferencias entre discursos de intenciones y prácticas reales.
Tensiones, contradicciones y excepciones
Los casos que no encajan, las contradicciones y las voces minoritarias aportan matices importantes. Pedir expresamente al modelo que los identifique ayuda a evitar conclusiones excesivamente homogéneas. Por ello, una parte fundamental del análisis de contenido consiste en identificar:
casos que no encajan,
contradicciones internas,
elementos discordantes,
perspectivas minoritarias.
Los LLM pueden ayudar a encontrarlas:
Identifica casos atípicos, contradictorios o minoritarios dentro del corpus y explica por qué son relevantes para el análisis.
Estos casos ayudan a:
evitar conclusiones simplistas,
enriquecer la interpretación,
mostrar diversidad dentro de los datos.
Inclusión del uso de LLM en el informe
- Redacta una síntesis analítica con los hallazgos principales. → Cap. 10
- Mantén una bitácora con todas las decisiones metodológicas relevantes.
- Sugerencia: revisa la declaración de uso de LLM del prólogo como referencia para tu informe.
Cuando el análisis de contenido ha sido asistido por LLM, es imprescindible que el informe académico (artículo, tesis doctoral, TFM, TFG o informe técnico) incluya de manera transparente qué tareas se realizaron con su apoyo y cuáles fueron responsabilidad del investigador. Esta transparencia es un requisito ético, metodológico y de reproducibilidad.
El informe de investigación debe mencionar el uso de LLM en método, limitaciones, reproducibilidad y ética, y solo en resultados y discusión cuando el LLM haya contribuido explícitamente a esas partes. A continuación, indico en detalle donde debe mencionarse, junto con la justificación y un ejemplo breve de redacción para cada caso.
| Sección del Informe | Obligatoriedad | Justificación y Requisito Ético/Metodológico |
|---|---|---|
| Introducción | Opcional | Contextualiza el uso de LLM como parte de la novedad o el marco general del estudio. |
| Método | Obligatorio | Describe tareas del LLM, instrucciones (prompts), supervisión humana y control de calidad. |
| Resultados | Condicional | Necesario solo si el LLM generó síntesis, resúmenes temáticos o identificación de patrones. |
| Discusión | Opcional | Refuerza la transparencia sobre el papel interpretativo humano frente al apoyo técnico. |
| Limitaciones | Obligatorio | Reconoce sesgos del modelo, variabilidad probabilística y dependencias tecnológicas. |
| Transparencia/Anexos | Obligatorio | Garantiza la reproducibilidad mediante la inclusión de prompts y versiones del sistema categorial. |
| Consideraciones Éticas | Obligatorio | Detalla la protección, anonimización y privacidad de los datos cargados en plataformas externas. |
Introducción (opcional, solo en algunos casos)
¿Cuándo mencionarlo? - Solo cuando el uso de LLM forma parte de la novedad del estudio, del marco metodológico general o de la justificación de la relevancia del trabajo.
Justificación - Permite contextualizar que el estudio se apoya en herramientas emergentes de asistencia, sin atribuirles un papel metodológico central todavía.
Ejemplo breve - “Este estudio incorpora herramientas de asistencia basadas en modelos de lenguaje (LLM) para apoyar, no sustituir, determinados procesos del análisis de contenido.”
Método (obligatorio)
¿Cuándo mencionarlo? - Siempre.
Es el lugar principal donde debe describirse el uso:
qué tareas realizó el LLM,
cómo se le instruyó (instrucciones/prompt),
qué decisiones siguieron siendo responsabilidad del investigador,
y cómo se controló la calidad del proceso.
Justificación - Metodológicamente, el lector debe poder entender cómo se generaron las categorías, cómo se aplicaron y qué papel tuvo el LLM en cada fase del análisis. Esta información permite, además, evaluar validez, sesgos y reproducibilidad.
Ejemplo breve - “El análisis de contenido se realizó mediante un procedimiento asistido por LLM. El modelo se empleó para generar propuestas iniciales de categorías, aplicar el sistema categorial validado y elaborar síntesis preliminares. Todas las decisiones de revisión, ajuste y validación fueron tomadas por el investigador. Se revisó manualmente una muestra del 20 % de las codificaciones y se efectuó una revisión cruzada con modelos alternativos.”
Resultados (dependiendo del uso)
¿Cuándo mencionarlo? - Solo si el LLM participó en la generación de resúmenes temáticos, agrupación de citas o identificación de patrones.
Justificación - Permite distinguir:
qué parte procede directamente del análisis humano,
qué parte fue generada con apoyo del LLM,
y qué controles se aplicaron para evitar errores (alucinaciones, falsas citas, inferencias no justificadas).
Ejemplo breve - “Las síntesis preliminares de cada categoría fueron generadas con apoyo de un LLM y posteriormente revisadas y ajustadas manualmente para asegurar fidelidad al corpus y coherencia con el sistema categorial.”
Discusión (opcional y breve)
¿Cuándo mencionarlo? - Cuando el uso del LLM haya influido en cómo se interpretan los hallazgos o cuando sea relevante explicar cómo se evitó que el modelo introdujera inferencias externas.
Justificación - Sirve para reforzar la transparencia y para mostrar que el papel interpretativo sigue siendo humano.
Ejemplo breve - “Las interpretaciones presentadas se elaboraron exclusivamente a partir del análisis humano; el LLM se empleó únicamente como apoyo técnico para organizar los datos y generar borradores preliminares.”
Limitaciones (obligatorio)
¿Cuándo mencionarlo? - Siempre que se utilicen LLM.
Debe explicarse:
dependencias tecnológicas,
posibles sesgos del modelo,
variabilidad entre ejecuciones,
riesgos de interpretaciones no basadas en datos.
Justificación - Es una exigencia ética y metodológica. Permite al lector evaluar la solidez del trabajo.
Ejemplo breve - “El uso de LLM introduce limitaciones asociadas a posibles sesgos del modelo y a variaciones entre ejecuciones, ya que un mismo prompt aplicado al mismo conjunto de datos puede generar respuestas ligeramente diferentes en distintos momentos, debido a la naturaleza probabilística del modelo. Estas diferencias pueden afectar a la clasificación, categorización o interpretación del contenido. Para minimizar estos riesgos, se realizaron comparaciones entre modelos y revisiones manuales sistemáticas.”
Transparencia y reproducibilidad (obligatorio, puede integrarse en método o en anexos)
¿Cuándo mencionarlo? - Siempre.
Debe incluirse:
qué prompts/instrucciones se usaron (o las más importantes),
qué versiones del sistema categorial se entregaron al LLM,
qué controles de calidad se aplicaron.
Justificación - Permite que otros investigadores puedan replicar el proceso o evaluar su credibilidad.
Ejemplo breve – (en Método) “Los prompts utilizados para la codificación y síntesis asistidas por LLM se incluyen en el Anexo 2, junto con la versión final del sistema categorial y una descripción de los controles de calidad aplicados.”
Consideraciones éticas (obligatorio)
¿Cuándo mencionarlo? - Siempre, especialmente si se cargaron datos en plataformas externas.
Justificación - Debe explicarse cómo se protegieron los datos de los participantes y cómo se evitó que el LLM procesara información identificable.
Ejemplo breve - “Todos los datos fueron anonimizados antes de ser procesados por los LLM y se emplearon plataformas que no reutilizan la información para entrenar modelos.”
Ética y calidad
Buenas prácticas y ética del análisis asistido por LLM
- Capítulo transversal: aplica desde el inicio del proyecto hasta la entrega del informe.
- Si lo lees al final: úsalo para revisar que has respetado los principios P1–P6 a lo largo de todo el proceso.
- Si lo lees al principio: te ayudará a anticipar y planificar las decisiones éticas desde el diseño del estudio.
El uso de modelos de lenguaje de gran tamaño (LLM) en análisis de contenido supone oportunidades metodológicas significativas, pero también riesgos éticos, epistemológicos y prácticos. Este capítulo reúne principios fundamentales para que asegures un uso responsable, riguroso y transparente. Indico aquí algunas sugerencias ordenadas, ya mencionadas a lo largo del texto.
Si para cuando leas esto ChatGPT et al. ya nos hacen hasta el café de las 11, no importa; lo que te cuento aquí sobre el sesgo y la interpretación seguirá siendo lo que marque la diferencia entre un investigador y alguien que solo sabe copiar y pegar.
Sesgos del modelo y del investigador
Los LLM no son neutrales; aprenden patrones lingüísticos de enormes corpus de datos que incluyen sesgos sociales, culturales y políticos, heredan sesgos de sus datos de entrenamiento y pueden favorecer ciertas perspectivas o discursos. El investigador también tiene sesgos propios. Tomar conciencia de ambos es un requisito ético y metodológico.
Sesgos del modelo
Pueden aparecer en:
interpretaciones que favorecen discursos mayoritarios,
invisibilización de voces minoritarias,
estereotipos sobre docentes o estudiantes,
categorizaciones demasiado simplificadas.
Sesgos del investigador
El LLM puede reforzar sesgos humanos preexistentes:
interpretar selectivamente respuestas,
aceptar categorías convenientes,
confiar demasiado en la síntesis automatizada.
Recomendación:
Solicita siempre al LLM que identifique posibles sesgos en su salida:
¿Detectas algún sesgo o interpretación no respaldada por los datos?
Limitaciones del uso de LLM en análisis de contenido
Los modelos pueden sobreinterpretar, inventar detalles o simplificar fenómenos complejos. No sustituyen la reflexión crítica ni la negociación de significados entre investigadores. Entre sus limitaciones más comunes se encuentran:
Comprensión limitada: identifican patrones lingüísticos, pero no comprenden intenciones, contextos ni significados humanos profundos.
Riesgo de alucinaciones: pueden generar citas, datos o inferencias que no están presentes en el material analizado.
Inconsistencias en los resultados: pueden clasificar o interpretar de manera distinta según el orden, el contexto o la formulación de la solicitud.
Reduccionismo analítico: tienden a simplificar fenómenos complejos, priorizando patrones dominantes y pudiendo incurrir en cherry picking (selección parcial de evidencias que refuerzan una interpretación mientras se omiten matices o casos minoritarios).
Dependencia excesiva: existe el riesgo de que el investigador delegue la interpretación sin mantener un control crítico suficiente.
Cómo evitar la sobredependencia
Para evitar depender en exceso de la IA, se recomienda contrastar resultados con análisis manual, consultar a otros investigadores y mantener una actitud crítica ante las propuestas del modelo. Buenas prácticas:
Revisar manualmente una muestra de la codificación.
Comparar la versión del LLM con una codificación humana.
Usar varios modelos (ChatGPT, Gemini, Claude) para triangulación.
Realizar comprobaciones críticas periódicas:
Explícame por qué esta categoría es la más adecuada.
¿Qué alternativas podrían ser plausibles?
Técnica útil: “contraentrevistar al modelo”. Esto permite detectar debilidades en su razonamiento.
Defiende la categoría contraria a la que aplicaste y justifica tu posición.
Uso responsable y reproducibilidad
La reproducibilidad en análisis asistido por IA requiere documentar prompts, versiones de modelos, decisiones metodológicas y salidas clave. Aunque las respuestas del modelo pueden variar, es posible ofrecer una descripción suficiente del proceso.
Buenas prácticas para reproducibilidad:
Guardar todas las versiones del sistema categorial.
Guardar prompts utilizados.
Registrar cada revisión hecha al sistema.
Guardar tablas de codificación por bloques.
Señalar qué partes del análisis fueron realizadas por LLM.
Declaraciones obligatorias en TFG/TFM/Tesis Doctoral/artículos:
versión del modelo (ChatGPT 4.x, Gemini Pro, Claude 3, etc.),
instrucciones dadas,
papel del LLM en cada etapa,
medidas tomadas para verificar exactitud.
Cómo documentar el proceso
En la tesis doctoral o artículo (etc.), se debe describir cómo se ha utilizado la IA, en qué etapas, bajo qué controles y con qué limitaciones. Esta transparencia aumenta la credibilidad del trabajo. La documentación es clave para la transparencia y el rigor académico. Un apartado típico puede incluir (a modo de lista de control sobre la información que debe incluirse):
Descripción técnica:
qué modelo(s) se usaron,
por qué se seleccionaron,
en qué fases participaron.
Detalle operativo:
prompts maestros,
unidades de análisis,
procedimientos de codificación,
justificación de decisiones metodológicas.
Estrategias de verificación:
revisión manual,
triangulación,
contraste con literatura.
Ejemplo de declaración transparente:
“El LLM se utilizó para generar propuestas preliminares de categorías, realizar una primera codificación asistida y elaborar borradores de síntesis. Todas las decisiones analíticas finales, incluyendo fusiones y delimitación de categorías, fueron tomadas por el investigador. Se revisaron manualmente todas las citas textuales y se validó la coherencia interna del sistema categorial.”
Llegados aquí, tienes el procedimiento completo. Lo que viene a continuación no es más teoría: son herramientas para que puedas usarlo: checklists y prompts listos para copiar.
Los anexos proporcionan materiales prácticos que pueden reutilizarse directamente en futuros análisis. Funcionan como herramientas de consulta rápida y como soporte metodológico complementario para el lector.
Ayuda adicional
Anexos
Checklist para quedarte tranquila
Antes de empezar
He definido claramente el objetivo del estudio y las preguntas de investigación.
He decidido si el análisis será inductivo, deductivo o mixto.
He determinado el tipo de corpus (encuestas, entrevistas, foros, documentos institucionales).
Durante el análisis
El LLM ha recibido instrucciones claras y estables.
Se han utilizado citas textuales para justificar categorías.
He revisado manualmente muestras del corpus.
Al finalizar
El sistema categorial es coherente y estable.
Se han aplicado estrategias de validación.
El proceso está documentado de forma transparente.
Checklist de preparación y depuración de datos
Los datos están completos y sin duplicados.
Se han eliminado respuestas vacías o no codificables.
Se han anonimizado nombres propios, centros y localizaciones.
Los textos están en un formato uniforme (tabla, texto plano, documento).
Se ha decidido cómo tratar las respuestas mínimas (“Sí”, “No”, “Depende”).
Los cambios realizados en los datos han quedado documentados.
Checklist para definir unidades de análisis y tipo de codificación
He definido claramente la unidad de análisis (documento, segmento, frase, unidad semántica).
He decidido si voy a codificar:
segmentos dentro del documento,
el documento completo como caso,
ambas cosas.
He definido qué categorías funcionan como atributos/variables del documento.
He indicado explícitamente estas decisiones en las instrucciones al LLM.
Checklist para la construcción del sistema de categorías
Cada categoría tiene un nombre claro y preciso.
Cada categoría cuenta con una definición explícita.
Existen criterios de inclusión y exclusión.
Las categorías son conceptualmente distintas entre sí.
El sistema es exhaustivo respecto al corpus.
Cada categoría incluye ejemplos textuales representativos.
Checklist para la codificación asistida por LLM
El LLM dispone del sistema categorial definitivo.
La codificación incluye citas textuales exactas.
Se ha solicitado una tabla clara de codificación.
Las respuestas mínimas están marcadas como tales.
Se ha revisado manualmente una parte del corpus.
Se han corregido inconsistencias antes de continuar.
Checklist de validación y control de calidad
Se ha realizado revisión manual de una muestra.
Se ha aplicado doble codificación (humana o asistida).
Se ha pedido al LLM que justifique decisiones dudosas.
Se ha utilizado un segundo LLM como revisor crítico.
Se han revisado discrepancias y ajustado categorías.
Las decisiones de validación están documentadas.
Checklist de ética y protección de datos (para que tus datos y tú estéis seguros)
Los datos han sido anonimizados antes de usar el LLM.
Se han revisado las políticas de privacidad de la plataforma utilizada.
No se han subido datos sensibles o identificables.
Se han eliminado archivos innecesarios tras el análisis.
El uso del LLM está declarado en el informe académico.
Checklist para la elaboración del informe académico
El uso del LLM está descrito en el apartado de Método.
Las decisiones analíticas finales son humanas.
Los resultados incluyen citas textuales.
Se declaran limitaciones asociadas al uso de LLM.
Se describen las medidas éticas adoptadas.
El proceso es rastreable y reproducible.
Checklist metodológica
Una lista de verificación final para asegurar que se han cubierto todos los aspectos:
Datos anonimizados
Prompt maestro definido
Sistema categorial versionado (min. v2.0)
Muestra revisada manualmente (min. 10%)
Decisiones metodológicas documentadas
Uso de LLM declarado en método
Copias de seguridad realizadas
Límites reconocidos de los análisis
Ejemplos de prompts listos para usar (por fases)
1. Prompt maestro (usar al inicio de cada sesión)
Actúa como asistente experto en análisis de contenido en investigación educativa.
Sigue escrupulosamente mis instrucciones.
No inventes información.
Si detectas ambigüedad, solicita aclaraciones inmediatamente.
Trabajaremos por etapas: exploración, categorías, codificación y síntesis.
2. Exploración preliminar
Aquí tienes un conjunto de respuestas sobre [tema].
Realiza un análisis preliminar que incluya:
1) Resumen general (5–7 líneas)
2) 5–10 patrones o temas preliminares
3) Citas textuales representativas
4) Tensiones o contradicciones emergentes
No generes categorías definitivas.
3. Creación del sistema de categorías (inductivo)
Genera un sistema de categorías inicial basado en los datos.
Para cada categoría incluye:
- nombre
- descripción clara
- criterios de inclusión
- criterios de exclusión
- 2–3 citas textuales del corpus
4. Refinamiento
Revisa este sistema de categorías (versión X).
Identifica:
- solapamientos
- categorías amplias o ambiguas
- redundancias
- diferencias de nivel conceptual
Propón una versión mejorada y justifica los cambios.
5. Codificación
Codifica este bloque según el sistema de categorías versión X.
Devuelve la salida en una tabla con:
[Texto] – [Categoría(s)] – [Justificación con cita textual]
No inventes citas. Si una respuesta no encaja, indícalo.
6. Síntesis analítica
A partir de la tabla de codificación y el sistema categorial versión X,
elabora un análisis temático académico que incluya:
- temas principales
- relación entre categorías
- tensiones o contradicciones
- 1–2 citas representativas por subtema
No añadas información no presente en los datos.
7. Informe académico
Redacta un borrador de informe académico que incluya:
- introducción breve
- método
- resultados (por temas con citas)
- discusión preliminar
- limitaciones del análisis y del uso de LLM
Basado exclusivamente en los datos proporcionados.