La IA de Anthropic a prueba de ‘jailbreak’

Tiempo de lectura: < 1 minuto
La IA de Anthropic a prueba de fugas
Yves Herman/Reuters

Anthropic lanzó un nuevo modelo de inteligencia artificial que, según dijo, era casi imposible de “liberar” o eludir sus salvaguardas. 

La naturaleza de las IA de modelos de lenguaje grandes implica que son difíciles de controlar para sus creadores: las empresas preferirían que no ofrecieran recetas para fabricar bombas o, en el caso de la firma china DeepSeek, opiniones sobre la soberanía de Taiwán.

Pero los usuarios generalmente han logrado encontrar formas de evitarlas, tal vez pidiéndole que imagine que es la abuela de alguien contando una historia o preguntándole en código alfanumérico.

La última IA de Anthropic tiene reglas generales que está diseñada para seguir y, después de 3.000 horas de esfuerzos públicos para liberarla (con una recompensa de 15.000 dólares por un intento exitoso), sigue intacta.

Traducido de SEMAFOR

Deja un comentario

Entrada siguiente

Una canción de los Beatles asistida por IA gana un Grammy

Mar Feb 4 , 2025
<span class="span-reading-time rt-reading-time" style="display: block;"><span class="rt-label rt-prefix">Tiempo de lectura:</span> <span class="rt-time"> < 1</span> <span class="rt-label rt-postfix">minuto</span></span>Los Beatles ganaron un Grammy por una canción creada con la ayuda de inteligencia artificial, la primera canción de este tipo en recibir ese honor.  Now and Then, premiada como Mejor Interpretación de Rock el domingo, fue grabada por John Lennon en 1977 como demo en solitario. Paul McCartney utilizó […]
Una canción de los Beatles asistida por IA gana un Grammy

Puede que te guste

Últimas noticias