Guía técnica

Cómo funciona la
detección de IA

Las señales estadísticas que diferencian el texto humano del generado por IA.

El problema de fondo

Los modelos de lenguaje generan texto prediciendo la siguiente palabra más probable dado todo lo anterior, produciendo texto estadísticamente predecible. Los seres humanos toman decisiones inesperadas. Los detectores explotan esta diferencia.

Señal 1: Perplejidad

Mide cuánto se "sorprende" un modelo de lenguaje ante un texto:

PP(texto) = exp( -(1/n) x Sum log P(ti | t1...ti-1) )

Puntuación baja = texto predecible. El texto de IA tiene baja perplejidad. Limitación: La documentación técnica y el lenguaje jurídico también tienen baja perplejidad, generando falsos positivos.

Señal 2: Burstiness

burstiness = sigma(perplejidades por oración) / mu(perplejidades por oración)

Los humanos son "bursty": alternan oraciones fluidas con otras laboriosas. El texto de IA tiene perplejidad uniformemente moderada. Alta varianza = humano. Baja varianza = IA.

Señal 3: Vocabulario

Ratio tipo-token: menor diversidad léxica en texto de IA.
Hapax legomenon: palabras que aparecen una sola vez, más frecuentes en textos humanos.
Frases características: "es importante destacar", "cabe mencionar", "en conclusión".

Falsos positivos: el riesgo principal

En nuestro benchmark, las tasas de FPR variaron del 7% al 17%. Un FPR del 17% significa que 1 de cada 6 escritores humanos sería falsamente acusado. Grupos especialmente afectados: hablantes no nativos y escritores de STEM.

Advertencia

Los detectores de IA no deben usarse como única base para decisiones de integridad académica.

¿Se puede evadir la detección?

Sí. Las herramientas humanizadoras reformulan texto de IA para aumentar perplejidad y burstiness. En nuestro estudio, tasas de evasión del 23% al 91%. Los enfoques más robustos combinan detección estadística con procedencia criptográfica (C2PA, SynthID). Ver benchmark de precisión.

Preguntas frecuentes

¿Es posible engañar a un detector de IA con paráfrasis manual?

Depende del nivel de reescritura. Cambios superficiales como reordenar palabras rara vez alteran las métricas de perplejidad. Una reescritura profunda que modifique estructura, vocabulario y ritmo puede reducir la probabilidad de detección, pero exige un esfuerzo comparable a escribir desde cero.

¿Los detectores analizan solo el texto o también el formato?

La mayoría de detectores trabajan exclusivamente con texto plano. No consideran tipografía, márgenes ni metadatos del archivo. Algunos servicios empresariales como Copyleaks pueden procesar documentos completos, pero las señales de detección siguen siendo lingüísticas.

¿Qué papel juega el entrenamiento del modelo en la detección?

Los clasificadores de detección se entrenan con miles de textos etiquetados como humanos o generados por IA. Si un modelo nuevo no estaba en los datos de entrenamiento, la precisión puede bajar. Por eso los detectores serios actualizan sus clasificadores con cada generación de modelos.

¿Funcionan los detectores con textos traducidos automáticamente?

Los textos traducidos por máquina presentan patrones de baja perplejidad similares a los de texto generado por IA. Esto significa que un artículo humano traducido con DeepL o Google Translate puede ser marcado como IA, generando un falso positivo.

¿La detección de IA es diferente para textos creativos vs. académicos?

Sí, y la diferencia es significativa. Los textos creativos humanos tienen alta variabilidad (burstiness elevada), lo que facilita distinguirlos de la IA. En cambio, los textos académicos y técnicos son naturalmente más uniformes, lo que eleva la tasa de falsos positivos en esas categorías.

Cómo funciona ladetección de IA