Críticas

Google revela los problemas de seguridad de Gemini 2.5 Flash

google-revela-preocupaciones-de-seguridad-sobre-gemini-2-5-flash

Breve

Las propias evaluaciones internas de Google revelan que su último sistema de inteligencia artificial, Gemini 2.5 Flashmuestra un descenso de las prestaciones de seguridad en comparación con su predecesor. La empresa señala en un documento técnico que Gemini 2.5 Flash es más propenso a producir contenidos que se salen de los parámetros de seguridad establecidos que la versión anterior Gemini 2.0 Flash.

En términos de rendimiento medido, el sistema obtuvo un 4 por ciento menos en la generación de texto inapropiado y casi un 10 por ciento menos en la generación de descripciones de imágenes, todo ello juzgado por herramientas internas automatizadas. Ambas métricas, texto a texto e imagen a texto, se gestionan mediante software y no mediante revisión humana directa.

Cambios en las normas de seguridad de la IA y tendencias del sector

Un portavoz de Google reconoció los contratiempos, confirmando que el último modelo tiene un rendimiento menos seguro en esas pruebas. Esta revelación llega en un momento en el que los principales actores de la inteligencia artificial intentan crear sistemas que respondan a una gama más amplia de peticiones reduciendo sus umbrales para rechazar temas delicados.

Otras empresas tecnológicas se enfrentan a retos similares. Por ejemplo, Meta anunció que sus últimas ofertas de IA están diseñadas a propósito para no favorecer ninguna perspectiva y abordar temas controvertidos, mientras que OpenAI se ha comprometido a crear modelos que ofrezcan una gama de puntos de vista en lugar de adoptar una postura editorial.

En ocasiones, estos esfuerzos por hacer que la IA sea más permisiva han desencadenado consecuencias imprevistas, como que ChatGPT de OpenAI genere contenido maduro para usuarios menores de edad debido a lo que la empresa describió como un error. El propio informe de Google indica que la mayor disposición de Gemini 2.5 Flash a seguir instrucciones puede contribuir a su mayor índice de traspasar los límites del contenido, incluso cuando se le pide que lo haga.

Google atribuye en parte el aumento de las infracciones de las políticas a que el sistema es más receptivo, incluso a las instrucciones que se apartan de las normas, aunque la empresa insiste en que muchos casos marcados son falsos positivos. La empresa también admite que, en algunos casos explícitos, el modelo genera contenido inapropiado cuando se le indica, lo que pone de manifiesto una tensión inherente entre obedecer las instrucciones del usuario y mantener las restricciones de seguridad.

Según las últimas herramientas de evaluación comparativa utilizadas para medir las respuestas de la IA a preguntas controvertidas, Gemini 2.5 Flash es menos propenso a rechazar peticiones que impliquen temas polémicos que el modelo anterior. Pruebas recientes han demostrado que el modelo está dispuesto a presentar argumentos a favor de posturas controvertidas en el ámbito de la política y la justicia, con lo que se vuelve a prestar atención al debate en curso sobre Seguridad de la IA.

Algunos expertos sostienen que la limitada divulgación en los informes técnicos de Google subraya la necesidad de una información más clara en lo que respecta a la seguridad de la IA. La falta de detalles sobre infracciones concretas dificulta a terceros la evaluación completa del alcance de cualquier riesgo potencial.

Anteriormente, Google se enfrentó a críticas por retrasos y omisiones en la publicación de todos los detalles de seguridad sobre sus modelos de IA más avanzados. En respuesta a estas críticas, la empresa ha publicado esta semana un informe técnico actualizado que incluye información adicional sobre cómo evalúa la seguridad de sus sistemas.

COMPARTIR

Añadir un comentario

What’s Happening in AI?

Stay ahead with daily AI tools, updates, and insights that matter.

Esto se ve mejor en la aplicación

Utilizamos cookies para mejorar su experiencia en nuestro sitio. Si continúa navegando, consideramos que acepta su uso.

Conectarse / Registrarse

Join the AI Community That’s Always One Step Ahead