Test muestra los riesgos ocultos de la inteligencia artificial

Test

Un Test experimento liderado por Anthropic revela que los asistentes inteligentes pueden intentar engañar sin ser detectados, lo que despierta preocupación sobre la seguridad de estas tecnologías   El lanzamiento de SHADE-Arena marca un hito en la evaluación de la seguridad de los modelos de lenguaje de gran escala (LLMs) cuando actúan como agentes autónomos. Según informó Anthropic en junio de 2025, este nuevo conjunto de pruebas permite medir, por primera vez de manera exhaustiva, la capacidad de estos sistemas para realizar sabotaje encubierto y su habilidad para evadir los…

Saber más