¿Cómo detectar un texto escrito por ChatGPT?

¿Cómo detectar un texto escrito por ChatGPT?

8 min

2.6.23

Recientemente, una parte de la población ha empezado a dudar de todo. ¿Y por qué? Porque cada vez es más complicado saber si un contenido ha sido creado por IA o no. Generadores de imágenes, generadores de vídeo, deepfakes, generadores de texto... La inteligencia artificial está revolucionando la forma de crear y utilizar internet.

En la comunidad literaria, ChatGPT fue un gran éxito, llegando a más de un millón de usuarios en sólo una semana de lanzamiento. Una vez pasado el entusiasmo inicial, muchos se preguntaron cómo podían saber si un texto había sido escrito por ChatGPT o no.

Pues sí, se puede. Puedes utilizar una serie de herramientas para generar pruebas cuantificables de que el texto que estás viendo ha sido creado por ChatGPT. En los próximos minutos, veremos en detalle cómo funciona la detección de IA y le mostraremos 3 formas de analizar un texto para averiguar si ha sido escrito por ChatGPT.

¿Qué es ChatGPT?

OpenAI, el grupo que está detrás de DALL-E 2, ha desarrollado ChatGPT, un potente modelo lingüístico. Probablemente hayas oído hablar de él en TikTok, Twitter o, más recientemente, cuando se prohibió en las escuelas públicas de Nueva York e Italia.

El objetivo de la herramienta era combinar la IA con la comunicación conversacional (que domina a la perfección). Puedes preguntarle lo que quieras (aunque evita cualquier cosa ilegal) y te dará una respuesta adecuada. Algunos ejemplos de preguntas:

  • ¿Cómo sé a qué me quiero dedicar?
  • ¿Cuáles son los mayores defectos del hombre y qué se puede hacer al respecto?
  • ¿Cómo fue la vida de Napoleón I (en forma de relato)?
  • Si pudieras hablar con Dios, ¿cuál sería la primera pregunta que le harías?

Puedes ir un poco más lejos:

chatgpt defectos del hombre

¿Cómo funcionan las herramientas de inteligencia artificial?

Todas las herramientas de inteligencia artificial se basan en una gran cantidad de datos. Imagínese leer miles de millones de artículos para enseñar a un sistema a detectar patrones en un texto (como saber qué palabra va después de otra, la sintaxis, etcétera.).

La IA es como tener un cerebro informático que puede pensar y aprender. Así que tus opciones ya no están limitadas. Supongamos que quieres enseñar a tu robot Miguel a jugar a un juego como las damas. Primero le enseñaría a mover las fichas por el tablero antes de permitirle jugar contra otros programas informáticos o personas reales. Al igual que tú aprendes cosas nuevas practicando, Miguel empieza a entender más y más sobre las damas a medida que juega más y más partidas.

Miguel es "inteligente" en parte gracias a lo que se conoce como algoritmo. Se trata de un conjunto de instrucciones que le dice a Miguel cómo enfocar el juego y tomar decisiones. Por ejemplo, el programa puede decirle que busque patrones específicos en el tablero. Miguel mejora siguiendo estas reglas y tomando decisiones inteligentes a medida que juega más partidas.

El término "aprendizaje automático" se refiere a uno de los muchos tipos de algoritmos utilizados en inteligencia artificial. Los algoritmos de aprendizaje automático son increíbles. Es lo que permite a Miguel, nuestro amigo jugador de damas, progresar por sí mismo sin necesidad de instrucciones regulares. Para ayudar a Miguel a aprender, los algoritmos utilizan lo que se conoce como "datos de entrenamiento". Los datos de entrenamiento son una amplia biblioteca de ilustraciones que muestran a Miguel cómo son las jugadas de damas eficaces. La comprensión de Miguel sobre cómo jugar a las damas mejora con la cantidad de datos de entrenamiento que tiene a su disposición.

¿Cómo funciona un detector de contenidos ChatGPT?

Profesores, profesionales de RRHH e incluso estudiantes han intentado determinar si ChatGPT es la fuente de párrafos de texto aleatorios. El problema es que, por el momento, ChatGPT no añade una marca de agua al contenido que crea.

Pero, ¿cómo se comprueba la autenticidad de un contenido una vez generado (por ejemplo, un ensayo de 1.500 palabras sobre la historia de la industria textil)? Las herramientas de predicción por IA analizan la probabilidad de que aparezca cada palabra en función de las palabras que preceden a la que se quiere adivinar.

modelo linguistico prediccion

La IA simplemente reconoce y reproduce patrones preexistentes con una eficacia increíble; no es realmente inteligente, sino que predice.

Intenta escribir "Hola, espero que estés _" en tu teléfono. La herramienta predice la siguiente palabra que escribes basándose en el texto de la izquierda (en este caso, las palabras "Hola, espero que estés").

La IA se basará en todos sus datos de entrenamiento para descubrir patrones en el uso de las palabras en distintas situaciones. Por ejemplo, puede saber que la palabra "bien" sigue con frecuencia a la palabra "estés". A partir del contexto de la izquierda, el algoritmo determina la probabilidad de que cada palabra se convierta en la siguiente palabra prevista.

En este caso, "bien" es la palabra que con mayor probabilidad habría venido a la mente dado el contexto. Si hace esto varias veces a lo largo de un párrafo, verá que las palabras cambian hasta el punto de que las siguientes palabras son predecibles.

Dado que las personas son por naturaleza mucho más inventivas y espontáneas en su estilo de escritura que los robots, cuanto más predecible sea el contenido, más probable es que lo haya escrito un robot.

¿Cómo detectar un texto escrito por ChatGPT?

Utilice Originality AI

Originality AI está diseñada para ser utilizada a gran escala. Pegue su contenido y Originality se encargará del análisis. A continuación, verá un porcentaje que indica si su texto fue más o menos escrito por la IA. En realidad, es imposible probar al 100% que un texto ha sido escrito por la IA. Por lo tanto, recuerda realizar pruebas adicionales en lugar de confiar ciegamente en una IA. Cuantos más textos analices, más precisa será la herramienta a la hora de determinar el origen de un contenido.

originality ai deteccion

Haga clic aquí para registrarse en Originality AI.

Utilice Content at Scale

El detector AI de Content at Scale es una herramienta para detectar la escritura ChatGPT. En el campo de entrada, pegue el texto que desea analizar y, a continuación, haga clic en "Check for AI Content". Dependiendo del grado de previsibilidad y complejidad del texto, obtendrás resultados. Pedimos a ChatGPT un párrafo de ejemplo, que insertamos inmediatamente en la herramienta:

chatgpt pregunta

Como puedes ver, este contenido fue probablemente creado por ChatGPT. La escritura era probable, los patrones abundantes y el contenido fácilmente predecible.

Es más, cada línea que Content at Scale piensa que fue escrita por ChatGPT está resaltada (texto naranja a la derecha). En este caso, ¡se trataba de todo el contenido!

content at scale deteccion

Considere Originality si desea comprobar el contenido tanto en busca de IA como de plagio. Originality es mucho más adecuado para detectar IA en grandes volúmenes de texto, mientras que Content At Scale está diseñado para evaluar contenidos breves (y lo hace muy bien).

Utilice GLTR

Aunque no está entrenado con los últimos modelos lingüísticos (por lo que no será tan preciso), también puedes pasar tu texto por GLTR. Es una herramienta gratuita que proporciona un diagrama de mapa de calor que ilustra la previsibilidad. Aquí tienes información sobre la IA comparada con un documento académico fidedigno. Cuanto más predecible es un término, más oscuro es:

gltr deteccion

¿Existe una marca de agua en el contenido de ChatGPT?

Todavía no, pero se rumorea que OpenAI tiene previsto añadir algo en breve. Un código secreto, llamado token, exclusivo del modelo GPT-4, se insertaría en cualquier parte del texto generado para añadir una marca de agua. El token podría ser una palabra, un signo de puntuación o incluso parte de una palabra, y funcionaría como un elemento constitutivo del texto.

Al incluir estos tokens en el texto, el resultado podría utilizarse para determinar si algo ha sido creado por el modelo GPT sin dejar de ser coherente y gramaticalmente correcto. Este método es comparable a añadir una marca de agua a una imagen digital; es invisible a simple vista pero puede utilizarse para determinar el origen de la imagen.

Para ello, se examina el texto en busca de tokens especiales. Si se detectan tokens, lo más probable es que GPT haya generado el texto. Aún no se sabe si esta herramienta tendrá una interfaz pública. Los profesores y administradores académicos que necesiten evaluar contenidos para garantizar su autenticidad podrán tener acceso exclusivo.

¿Qué podemos esperar del futuro de la detección de texto generada por IA?

La verdad es que no lo sabemos. ChatGPT aún está limitado en muchos aspectos, pero está teniendo un impacto en las capacidades técnicas de nuestra empresa. Pero que no cunda el pánico. No destruirá las escuelas ni el mundo laboral, pero inevitablemente causará trastornos.

No olvides mirar cualquier resultado en retrospectiva, porque ninguna herramienta puede afirmar con certeza si un texto ha sido escrito por la IA o no. Usa tu criterio. El único propósito de este artículo es presentarte algunos métodos, así que te toca a ti desarrollar y encontrar los tuyos propios.

Los mejores detectores de IA:

  • Originality AI
  • Content at Scale
  • GLTR
  • OpenAI Classifier
  • GPTZero

¿Le preocupa el desarrollo de la IA? Aquí tienes 10 trabajos que serán sustituidos por la inteligencia artificial.

Al hacer clic en "Aceptar", acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Consulte nuestra Política de privacidad para obtener más información.