Las herramientas de inteligencia artificial han llegado a este entorno en un momento de delicado equilibrio entre necesidad y equilibrio. El riesgo es que se presenten como una solución al problema equivocado: que las organizaciones las adopten esperando automatizar la tarea editorial central de la verificación y descubran que no cumplen esa función. Este artículo plantea una relación distinta: la IA como infraestructura para el análisis, no como sustituto del juicio humano. A través del trabajo innovador de Maldita.es, mostraré que, más que decirnos qué es verdad, estas herramientas nos ayudan a ver qué está ocurriendo a una escala y velocidad que, de otro modo, serían imposibles.

Un problema que superó la capacidad humana

La integridad de la información tiene un significado preciso: es el grado en que la información es exacta, trazable y se presenta en su contexto adecuado. Todas estas propiedades han estado sometidas a presión sistemática en el entorno digital, y los mecanismos son ya lo suficientemente conocidos como para nombrarlos directamente.

El primer mecanismo es el ranking de las plataformas, que recompensa la resonancia emocional y la capacidad de compartirse. Esto a veces eclipsa métricas objetivas, como la actualidad temporal o la pertenencia a la propia red de contactos, reduciendo la capacidad de los usuarios para interpretar lo que ven. El resultado general es un sesgo estructural sobre aquello que obtiene visibilidad: no el contenido más fiable, ni el contenido que uno decide ver, sino simplemente el más atractivo.

El segundo mecanismo es la facilidad con la que el contenido se desvincula de su origen, fecha o contexto, dificultando cada vez más encontrar su fuente. Un vídeo grabado en un país se presenta como si procediera de otro; una declaración hecha hace años vuelve a circular como si fuera una noticia actual. El problema no es el error humano o la mala fe en casos individuales, sino un formato que separa sistemáticamente el contenido de los metadatos necesarios para evaluarlo.

El tercer mecanismo de presión es la escala. Las herramientas generativas han reducido radicalmente el coste de producir y difundir grandes volúmenes de contenido. Lo que antes requería importantes recursos financieros y organizativos —como una operación coordinada de influencia o una red de cuentas sintéticas difundiendo una narrativa— ahora puede intentarse a bajo coste y mediante ensayo y error, lo que dificulta su detección. Así como las redes sociales redujeron en su día el coste de compartir y distribuir contenido, la IA generativa está permitiendo ahora la creación barata de contenido personalizado y de alta calidad en todos los formatos mediáticos. La saturación informativa es más fácil que nunca, y los actores maliciosos apuestan por el volumen antes que por la precisión.

La consecuencia para las organizaciones de monitorización es que el ritmo de generación de contenido ha superado la capacidad de los equipos humanos para seguirlo en tiempo real. Un equipo de analistas, por muy cualificado que sea, no puede procesar miles de publicaciones por hora, detectar patrones emergentes entre plataformas ni mantener una vigilancia continua sobre un entorno informativo en rápida evolución.

No se trata de una cuestión de recursos que pueda resolverse únicamente contratando más personal. Es un desajuste estructural que requiere herramientas estructurales.

La magnitud del desafío se hizo evidente durante las inundaciones de octubre y noviembre de 2024 en España, que causaron 238 muertes. El volumen de contenido engañoso tras la catástrofe fue difícilmente comparable con ningún otro momento o fenómeno, impulsado por malentendidos involuntarios, intereses partidistas y campañas coordinadas. Durante ese episodio, Maldita.es recibió cuatro veces más solicitudes de verificación de lo habitual: 13.000 en siete días.

Gracias a nuestra herramienta de monitorización basada en IA, pudimos agrupar esos mensajes en narrativas subyacentes (por ejemplo, que las inundaciones eran resultado de un plan de las élites, o que las autoridades ocultaban el número real de víctimas). Esto nos permitió comprender la crisis informativa y sus distintas ramas: negacionismo climático, criminalización de personas migrantes, bulos sobre salud pública, etc. Este análisis fue un paso crucial antes de redactar informes de políticas públicas como el que defendía una regulación más fuerte de las plataformas en contextos de crisis informativas.

Lo que las herramientas de IA pueden y no pueden hacer

La idea errónea más persistente y dañina sobre las herramientas de IA en este ámbito es que pueden determinar si algo es verdadero. No pueden. No de forma fiable, ni a escala, ni de una manera que pueda sustituir el juicio editorial. Al menos, todavía no. Confundir este límite conduce a un mal diseño de herramientas, a una confianza mal depositada y, en última instancia, a resultados que erosionan la credibilidad en lugar de reforzarla.

Existe una distinción fundamental que suele diluirse en el debate público: la diferencia entre detectar contenido sintético o inauténtico y detectar contenido inexacto. Son problemas técnicos distintos que requieren soluciones diferentes.

• Detectar una imagen generada sintéticamente o una red de cuentas coordinadas e inauténticas es, en esencia, un problema de reconocimiento de patrones que puede abordarse mediante herramientas de aprendizaje automático diseñadas para ello, como el watermarking, las huellas digitales o el análisis de comportamiento.

• Detectar una afirmación factual es un problema epistemológico: requiere acceso a pruebas, capacidad para evaluar fuentes y juicio sobre qué puede considerarse fiable. Los grandes modelos de lenguaje (LLM) no están diseñados para esto, y su tendencia a producir invenciones plausibles pero incorrectas hace que su uso como verificadores siga siendo hoy un desafío técnico complejo e incluso peligroso.

Sin embargo, existen escenarios en los que la variabilidad natural de la IA y su vulnerabilidad a la manipulación no representan una gran amenaza o pueden gestionarse fácilmente. Este es el caso de tareas donde no existe una única respuesta válida (por ejemplo, resumir un texto), donde no hay dependencia de datos externos (por ejemplo, clasificar en un conjunto de temas) o cuando las salidas de la IA están integradas en flujos de trabajo más amplios y supervisados.

Donde los LLM y herramientas similares sí aportan valor de forma fiable es en tareas donde no hay una única respuesta correcta que recuperar: tareas basadas en la transformación más que en la verificación, como la clasificación temática, el etiquetado lingüístico, la agrupación de contenidos o el resumen. Estas operaciones organizan y reformulan información existente en lugar de decidir sobre su veracidad.

Por ejemplo, Maldita.es participa en el proyecto europeo Prebunking At Scale utilizando LLM para procesar miles de afirmaciones presentes en vídeos cortos de TikTok, YouTube e Instagram. Las afirmaciones se clasifican en cinco categorías: salud, conflictos, Unión Europea, migración y clima. Una herramienta de IA que toma un flujo de diez mil publicaciones en redes sociales y las etiqueta está realizando algo realmente útil: convierte ruido en un conjunto de datos estructurado con el que los analistas pueden trabajar. No ha verificado nada. Ha facilitado la verificación.

La implicación práctica es clara: las herramientas de IA en este ámbito muestran su mayor potencial como asistentes analíticos —no liderando el análisis— que transforman y organizan datos. Cualquier cosa más allá de eso debe tratarse con cautela, ya sea en una propuesta comercial o en un flujo de trabajo periodístico.

Construir una cadena de monitorización: datos, memoria y ruido

El principal desafío de la monitorización basada en IA es arquitectónico antes que analítico. Antes de que una herramienta pueda detectar patrones o agrupar narrativas, necesita un flujo fiable de datos, una estructura para almacenar y relacionar lo que encuentra y una estrategia para gestionar el ruido inherente a cualquier sistema automatizado a gran escala.

1) Las fuentes de datos implican compensaciones importantes que condicionan todo lo que ocurre después. Las APIs de plataformas proporcionan grandes volúmenes de contenido, pero con un coste: la relación señal-ruido es baja porque no todo el contenido es relevante, además de que el contenido más sensible suele ser filtrado por las plataformas antes de llegar a investigadores, y las condiciones de acceso cambian de manera imprevisible. Además, las APIs oficiales suelen ser demasiado caras para pequeñas organizaciones. En el otro extremo de la escala de “curación” está el crowdsourcing ciudadano (líneas de consulta, herramientas de reporte, canales de WhatsApp), que produce aportaciones de mayor calidad y mejor contextualizadas, aunque con cobertura limitada y muy dependiente del compromiso de la comunidad. Finalmente, la curación experta proporciona los datos más fiables y ricos en contexto, pero requiere muchos recursos y no puede escalar para cubrir entornos informativos amplios en tiempo real. La mayoría de los sistemas de monitorización utilizan una combinación de estas fuentes, y esa mezcla determina las fortalezas y puntos ciegos de la herramienta. Un ejemplo de base de datos de afirmaciones desarrollada por Maldita.es es Iberifier.Con una perspectiva iberoamericana, esta infraestructura digital permite a organizaciones de verificación de distintos países compartir y conectar sus hallazgos, facilitando el análisis del movimiento de la desinformación entre países y las manifestaciones locales de narrativas transnacionales.

2) El almacenamiento y la memoria son componentes infravalorados de una monitorización eficaz. Una base de datos que preserve contenidos previamente analizados hace algo más que archivarlos: convierte el análisis en acumulativo. Cuando llega una nueva afirmación, puede compararse con registros existentes no solo para evitar duplicar trabajo, sino también para medir recurrencias, rastrear la viralidad en el tiempo y construir una visión longitudinal de cómo ha evolucionado una narrativa concreta. Esta idea es central en la línea de WhatsApp que estructura la monitorización informativa de Maldita. Los metadatos asociados a cada elemento (por ejemplo, plataforma de origen, fecha, cuentas vinculadas o apariciones previas) se convierten en materia prima para la investigación. Sin esta memoria institucional, la monitorización es episódica en lugar de estructural: se puede ver qué es tendencia hoy, pero no cómo se conecta con lo que fue tendencia hace seis meses.

3) Es importante señalar que ninguna cadena de monitorización elimina el ruido. Se trata de una característica estructural, no de un fallo corregible, especialmente cuando la fuente de datos son APIs de plataformas o cuando parte del etiquetado está automatizado. Las mitigaciones disponibles son parciales pero efectivas: flujos de trabajo con supervisión humana que revisan el contenido señalado antes de influir en resultados o bases de conocimiento externas (como Wikidata), ayudando al sistema a distinguir homónimos, resolver referencias ambiguas y evitar confundir actores o eventos distintos. El objetivo no es construir un sistema sin ruido, sino uno donde el ruido esté suficientemente gestionado para que la señal siga siendo útil.

De afirmaciones aisladas a narrativas subyacentes

Las afirmaciones falsas o engañosas son síntomas. La enfermedad subyacente es la narrativa: el marco ideológico más amplio dentro del cual las afirmaciones individuales adquieren significado y que da a la desinformación su durabilidad y capacidad persuasiva.

En un primer momento, Maldita.es detectó afirmaciones aisladas que replicaban un artículo sobre el crecimiento del hielo en la plataforma antártica entre 2009 y 2019. Pero las amenazas a la integridad informativa rara vez operan mediante piezas aisladas. Más comúnmente, se apoyan en cadenas de afirmaciones aparentemente factuales que, juntas, construyen una visión del mundo: una interpretación concreta sobre quién es responsable de un problema, quién se beneficia de una política determinada o qué significaron realmente ciertos hechos históricos.

Más tarde ese mismo año, nuestra redacción observó publicaciones que afirmaban que Al Gore se había equivocado al predecir el deshielo de los casquetes polares para 2014. Cada afirmación individual de esta cadena puede ser discutible, exagerada o simplemente estar fuera de contexto, pero el efecto acumulativo sobre las creencias del lector puede ser considerable.

Un sistema de monitorización que solo procese afirmaciones individuales de forma aislada —detectando declaraciones falsas según aparecen— pierde esta estructura más profunda. Está tratando los síntomas sin ver la enfermedad.

La combinación de bases de datos de contenidos y modelos de lenguaje ofrece una forma de trabajar al nivel de las narrativas, y no solo de las afirmaciones individuales. La capacidad central es la agrupación: dado un gran conjunto de afirmaciones sobre un tema, un LLM puede identificar cuáles invocan el mismo marco subyacente, aunque cambien el lenguaje, los actores o los contextos.

Esto supera una limitación fundamental del análisis humano: ningún equipo puede mantener simultáneamente miles de afirmaciones en memoria de trabajo, rastrear sus conexiones e identificar el patrón que las une a través del tiempo y la geografía. La agrupación computacional y el etiquetado asistido por IA amplían lo que cognitivamente es posible.

Al agrupar automáticamente contenidos similares y extraer sus afirmaciones implícitas, esta tecnología detectó de forma autónoma una narrativa que cuestionaba la crisis climática mediante afirmaciones relacionadas con el tamaño de los casquetes polares. Posteriormente desmontamos esa narrativa.

La identificación de narrativas recurrentes también permite detectar patrones con valor investigativo más allá de un solo artículo: cuando el mismo encuadre aparece en múltiples geografías en rápida sucesión, suele ser una señal digna de investigación. Las narrativas no se difunden aleatoriamente; a menudo son impulsadas por actores con interés en promover determinados marcos interpretativos.

La recurrencia transnacional, detectada de forma sistemática y no anecdótica, se convierte en un hilo del que tirar. Para seguir este tipo de dinámicas, Maldita.es coordina una base de datos de afirmaciones financiada por la National Endowment for Democracy en la que organizaciones de América Latina y Europa del Este anticipan y rastrean operaciones de influencia rusas.

Convertir la monitorización en acción

El análisis que permanece dentro de una base de datos no cambia nada. El desafío final —y probablemente más importante— en la monitorización basada en IA es conectar la cadena analítica con resultados que las organizaciones realmente puedan utilizar. Y eso implica pensar cuidadosamente quiénes son esas organizaciones y qué necesitan.

Los distintos usuarios finales tienen necesidades diferentes. Los investigadores suelen querer datos en bruto exportables, normalmente archivos CSV con metadatos completos, filtrables por fecha, plataforma y tema, para integrarlos en sus propios flujos analíticos. Las redacciones suelen necesitar algo más visual y navegable: paneles que muestren tendencias emergentes, alertas configurables que detecten picos en determinados temas o interfaces que permitan a periodistas explorar datos sin necesidad de escribir consultas. Las organizaciones de la sociedad civil y quienes trabajan en comunicación pública pueden necesitar algo distinto: resúmenes curados, mapas narrativos o briefings listos para usar. Una herramienta de monitorización diseñada sin pensar en sus usuarios no será utilizada, independientemente de la calidad de su análisis subyacente.

Las herramientas construidas sobre conjuntos de datos vivos y en crecimiento también requieren un mantenimiento continuo que los proyectos de análisis puntual no necesitan. A diferencia de una investigación sobre una filtración documental, que tiene un corpus fijo y un final definido, un sistema de monitorización opera sobre un flujo que nunca se cierra. Las definiciones temáticas deben recalibrarse a medida que evoluciona el entorno informativo. Los sistemas de procesamiento basados en IA deben vigilarse para evitar desviaciones y ajustarse cuando cambian los patrones lingüísticos. El consumo de recursos también debe gestionarse, ya que el análisis continuo a gran escala tiene costes reales.

Estos no son problemas que se resuelvan en el lanzamiento: son responsabilidades operativas permanentes. El valor más duradero de un sistema de monitorización bien diseñado no reside en una única salida concreta —ni en una investigación específica, ni en un informe de tendencias, ni en un recurso de contranarrativa— sino en la memoria institucional y la integración en los flujos de trabajo que posibilita con el tiempo. Las organizaciones que han integrado herramientas de monitorización en sus procesos editoriales —y que han construido sus rutinas diarias alrededor de la inteligencia que estos sistemas proporcionan— responden más rápido a amenazas emergentes, con más evidencia y con una comprensión más rica de cómo han evolucionado las narrativas que siguen. El conocimiento acumulativo que se genera en un sistema bien mantenido acaba convirtiéndose, con el tiempo, en una ventaja competitiva dentro del entorno informativo.

¡Tu opinión importa!

¿Qué piensas de este texto? Tómate 30 segundos para compartir tus comentarios y ayudarnos a crear contenido significativo para la sociedad civil.

Pablo Pérez Benavente es filólogo y experto en procesamiento del lenguaje natural en Fundación Maldita.es contra la desinformación, una organización que dota a la sociedad —desde legisladores hasta ciudadanía, incluyendo periodistas, plataformas digitales y educadores— de herramientas, habilidades y contenidos basados en evidencia para fomentar un ecosistema mediático e informativo más resiliente y fiable.

Su trabajo se centra en la extracción de narrativas de opinión, el uso de grafos de conocimiento aplicados a la desinformación y el desarrollo de herramientas de apoyo para periodistas e investigadores. Ha participado en mesas redondas sobre ética e inteligencia artificial y ha impartido formaciones y talleres sobre el uso de IA para profesionales de la información y medios sin ánimo de lucro.

También ha sido becario de la Fundación “la Caixa” e investigador en el Consejo Superior de Investigaciones Científicas (CSIC).

Este recurso se ha creado como parte del proyecto IA para el Cambio Social, dentro del Programa de Activismo Digital de TechSoup, con el apoyo de Google.org.

Este contenido se creó con asistencia de IA y ha sido revisado y editado por Pablo Pérez Benavente.

Las herramientas de IA evolucionan rápidamente. Aunque hacemos lo posible por mantener la validez del contenido, algunos elementos pueden quedar desactualizados. Si notas información obsoleta, contáctanos en content@techsoup.org.

Monitorización de amenazas digitales a la integridad de la información mediante herramientas basadas en IA