Question 1

¿Cuántos modelos de lenguaje existen actualmente?

Accepted Answer

Se estiman más de 500 modelos de lenguaje grandes (LLM) disponibles en 2026, entre comerciales y de código abierto. Sin embargo, los detectores se enfocan en los más utilizados: GPT-4o, Claude, Gemini y LLaMA, que representan la gran mayoría del contenido generado por IA en español.

Question 2

¿GPT-4o genera texto más difícil de detectar que Claude?

Accepted Answer

En nuestro benchmark, Claude 3.5 Sonnet resultó ligeramente más difícil de detectar que GPT-4o en textos en español. La diferencia fue de 3 a 5 puntos porcentuales según el detector. Esto se debe a que Claude tiende a producir mayor variabilidad léxica, imitando mejor los patrones humanos.

Question 3

¿Los modelos de código abierto como LLaMA son detectables?

Accepted Answer

Sí, pero con menor fiabilidad. Los modelos de código abierto como LLaMA 3.1 70B presentaron tasas de detección entre 5 y 10 puntos porcentuales más bajas que los modelos comerciales. Esto ocurre porque los detectores se entrenan principalmente con muestras de modelos comerciales populares.

Question 4

¿Cada modelo tiene una "huella digital" lingüística única?

Accepted Answer

Sí. Cada modelo tiene patrones estadísticos distintivos en la selección de vocabulario, longitud de oraciones y distribución de tokens. Estas diferencias son sutiles para el lector humano, pero los clasificadores entrenados pueden identificar de qué familia de modelos proviene un texto con razonable confianza.

Question 5

¿Cómo evolucionará la detección con los modelos de próxima generación?

Accepted Answer

Se espera una carrera continua entre generadores y detectores. Los modelos futuros producirán texto más natural, pero tecnologías como watermarking (SynthID, C2PA) y procedencia criptográfica ofrecen un enfoque complementario que no depende de señales estadísticas y es más resistente a la evolución de los modelos.

Modelos de IA Detectados

¿Cómo se detectan los distintos modelos?

Preguntas frecuentes