LLM: qué fallos de despliegue pillan por sorpresa a los informáticos

Desde el control ilimitado sobre los sistemas de la empresa hasta los fallos que pasan desapercibido, las implementaciones LLM pueden salir mal de forma sutil, pero sus consecuencias pueden ser graves para la empresa.

LLM que ven demasiado

En la presentación de una nueva función de SharePoint para su uso con Copilot LLM, Microsoft reconoció el pasado 6 de marzo que un gran defecto de los sistemas LLM actuales es la posibilidad de acceder a una amplia gama de archivos de SharePoint que no están destinados a ser compartidos.

Nick Mullen, responsable de gobernanza de TI de una compañía de seguros de la lista Fortune 500, explica que con Copilot, "cuando se habilita el acceso de un usuario, se replica el acceso que tiene. Puede acceder a cualquier cosa a la que tengan acceso, lo sepan o no". Por lo tanto, "el repositorio de SharePoint se ejecuta en el servidor de la compañía", añade.

Mullen, que también dirige su propia empresa de seguridad, Sanguine Security, explica también que "el repositorio de SharePoint se ejecuta en segundo plano, pero también tiene acceso a todo lo que es público en todo el ecosistema. Muchos de estos sitios son públicos por defecto".

La nueva función, disponible en versión preliminar pública, se denomina Búsqueda restringida en SharePoint. Microsoft afirma que esta función "permite restringir la búsqueda en toda la organización y las experiencias de Copilot a un conjunto seleccionado de sitios de SharePoint de su elección".

La opción actual por defecto es de acceso público. Según la documentación de soporte de Microsoft, "antes de que la organización utilice la Búsqueda restringida en SharePoint, Alex [un usuario hipotético] puede ver no sólo sus contenidos personales, como sus archivos de OneDrive, chats, correos electrónicos, contenidos que posee o ha visitado, sino también contenidos de algunos sitios que no han sido sometidos a revisión de permisos de acceso de Listas de control de acceso (ACL), y no tienen aplicada la gobernanza de datos." Es decir, como Alex tiene acceso a información sensible (aunque no sea consciente de ello), Copilot también lo tiene.

El mismo problema se aplica a cualquier entorno corporativo de almacenamiento de datos. El departamento de TI debe auditar minuciosamente los privilegios de acceso a los datos de los usuarios y bloquear los datos confidenciales antes de permitirles ejecutar consultas con un LLM.

LLM con las llaves del negocio

Parte del problema con los LLM hoy en día es el acceso amplio o incluso ilimitado a todos los sistemas de la empresa, lo cual no es raro que se produzca de manera involuntaria. Según Mullen, lo peor es que la mayoría de los sistemas defensivos actuales de las empresas no detectan y, por tanto, no bloquean a los LLM, aunque se conviertan en delincuentes.

Esto significa que las empresas tienen "el motor de búsqueda más potente e intuitivo que puede buscar en todo", argumenta, para apostillar: "Históricamente, ese tipo de exploración interna disparaba una alerta. Pero los LLM son diferentes. Se trata de un vector de amenazas completamente nuevo que es extremadamente difícil de detectar. EDR [detección y respuesta de puntos finales] no va a detectarlo porque se comporta como se espera. Ahora mismo, no hay una buena forma de protegerlo. Dependiendo de quién esté comprometido, un atacante podría acceder a todo aquello que deseara".

Mullen añade: "Los LLM son muy temperamentales, y la gente se está adelantando un poco. La tecnología es tan nueva que aún se desconocen muchos de los riesgos. Es un escenario en el que no se va a saber hasta que se vea. Es la ley de las consecuencias imprevistas. Las TI están poniendo en marcha a los LLM y los otorgan acceso a una cantidad insana de recursos, lo que debería hacer reflexionar a todas las organizaciones".

Por su parte, Artur Kiulian, fundador de PolyAgent, un laboratorio de investigación sin ánimo de lucro centrado en cuestiones de IA, considera que muchas empresas adoptan los LLM con demasiada rapidez, antes de que puedan establecerse los controles adecuados.

En su opinión, "la mayoría de las empresas que está implantando LLM se encuentran en fase de experimentación y utilizan las barandillas de la ingeniería rápida. Con esto no basta. Se necesitan controles basados en permisos. El problema surge cuando la mayoría de las empresas simplemente no está ahí todavía".

Sherrets, de HackerOne, está de acuerdo en cuanto a lo arriesgadas que son las LLM hoy en día: De hecho, esta es su reflexión al respecto: "Puede interactuar con otras aplicaciones. Es aterrador porque estás dando el control de caja negra para hacer cosas en tu infraestructura interna. ¿Qué utilidades está tocando el LLM?".

David Guarrera, director de EY Americas Technology Consulting que dirige las iniciativas de IA Generativa, también se muestra preocupado por los riesgos que plantean las primeras implantaciones de LLM en empresas. "Hay muchos ataques nuevos emergentes en los que se puede engañar a los LLM para que sorteen las barreras de protección. Es el caso de las cadenas aleatorias que hacen que el LLM se vuelva loco. Las organizaciones deben ser conscientes de estos riesgos", afirma.

Por eso Guarrera aconseja a las empresas crear protecciones independientes y aisladas para los sistemas sensibles, como las nóminas o la cadena de suministro. En su opinión, TI necesita "permisos que se gestionen fuera del [acceso] de LLM. Tenemos que pensar a fondo cómo diseñamos el acceso a estos sistemas. Hay que hacerlo en la capa de datos, algo invisible para el LLM. También hay que diseñar una capa de autenticación sólida".

Maestros con mentalidad funcionarial

Otro problema es tratar de programar los LLM para que gestionen las normas de lo que necesitan conocer. Es decir, la idea de que el sistema restrinja algunos datos y sólo los comparta con personas con determinadas funciones en la empresa o que trabajen en departamentos específicos.

Esto choca con lo que algunos describen como el problema de la mentalidad funcionarial. Es decir, alguien ha recibido formación sobre las normas e incluso puede memorizarlas, pero no ha aprendido por qué se crearon inicialmente. Sin esa formación, no pueden tomar una decisión informada sobre cuándo está justificada una excepción y, por lo tanto, tienden a interpretar las normas de forma estricta y literal.

Eso es lo mismo que ocurre con los LLM. No obstante, hay muchos datos sensibles de las empresas no son tan binarios.

Volvamos al ejemplo anterior de las finanzas de una empresa pública. Es cierto que los datos sobre las finanzas no anunciadas de este trimestre tienen que restringirse a un puñado de personas autorizadas. Pero, ¿ha sido programado el LLM para saber que los datos son instantáneamente legibles en todo el mundo en cuanto se anuncian y se presentan a la SEC? ¿Y que sólo los datos comunicados son ahora públicos, mientras que los no comunicados siguen siendo reservados?

Ahora relacionemos este aspecto con la siguiente cuestión: supongamos que llega el momento de preparar las finanzas para su presentación y el director financiero solicita -y obtiene- permiso para que otras 30 personas de diferentes unidades de negocio de la empresa le ayuden temporalmente con la presentación. ¿A alguien se le ocurre reprogramar el LLM para conceder acceso temporal a los datos a esos 30 recursos temporales? ¿Alguien se acuerda de volver atrás y eliminar su acceso una vez que vuelven a sus funciones habituales?

Fallos no reconocidos

La siguiente preocupación relacionado con los LLM es más práctica. Los gestores de TI veteranos tienen muchos años de experiencia al ahora de trabajar con todo tipo de software. Su experiencia les enseña cómo se ven los sistemas cuando se bloquean, lo que se traduce en su ralentización, detención, generación de mensajes de error y lanzamiento de pantallas de caracteres basura. Pero cuando un LLM falla -su versión del fallo- no actúa de esa manera.

"Cuando el software tradicional se estropea, es obvio: las pantallas no se cargan, hay mensajes de error por todas partes. Cuando el software [LLM] se estropea, actúa de manera mucho más opaca: no se producen errores evidentes, sólo se obtiene un modelo con malas predicciones", afirma Kevin Walsh, responsable de inteligencia artificial de HubSpot. "Pueden pasar semanas o meses de tener el LLM en el mundo real antes de escuchar de los usuarios que no está resolviendo el problema que se supone que debe resolver".

Eso podría ser significativo, porque si TI no reconoce que hay un problema rápidamente, sus intentos de arreglar y limitar el sistema se retrasarán, lo que puede provocar que la respuesta sea demasiado tarde para detener el daño.

Dado que los LLM fallan de forma diferente y de maneras mucho más ocultas que el software tradicional, TI necesita establecer mucho más seguimiento, pruebas y supervisión. Podría ser una tarea rutinaria para alguien probar el LLM cada mañana.

Expectativas poco realistas

Allie Mellen, analista principal de SecOps y herramientas de seguridad de IA en Forrester, reconoce que existe una percepción inexacta de los LLM, a menudo porque éstos hacen un trabajo tan persuasivo que se hacen pasar por el pensamiento humano.

"Tenemos esta percepción errónea de la IA generativa porque parece más humana. No puede tener pensamientos originales. Sólo anticipa la siguiente palabra. La expectativa de que pueda escribir código es exagerada", afirma.

Este analista añade que los LLM deben manejarse con mucho cuidado. "Hay muchas formas de sortear las barreras. Una persona puede inventar un mensaje ligeramente diferente" para eludir las restricciones programadas.

Mellen considera que el departamento de TI "debe centrarse en lo que puede aplicarse de forma realista en casos de uso realistas". "No lo trate como si los LLM fueran martillos y todos sus problemas fueran clavos. Las capacidades [LLM] están siendo sobrevaloradas por la mayor parte del mundo empresarial: inversores y ejecutivos".

Imprimir Subir

TE PUEDE INTERESAR...

EMPRESAS

La salida de Hasso Platner marca un punto de inflexión en SAP

EMPRESAS

Anthropic lanza su 'chatbot' en Europa

EMPRESAS

Ilya Sutskever, cofundador de OpenAI, deja la compañía

ENTREVISTAS

"El 'know-how' de Sygnia va entre dos semanas y seis meses por delante del mercado"

EMPRESAS

Adam Selipsky abandona AWS y Matt Garman toma el relevo

Leonardo Freitas, gerente de Investigación en IDC Londres

ENTREVISTAS

"La IA, aunque potencialmente revolucionaria, pondrá una enorme presión sobre la infraestructura actual de TI"

TECNOLOGÍA

La industria de los chips podría no estar preparada para 2030

EMPRESAS

OpenAI lanza un nuevo GPT de escritorio multimodal y nuevas capacidades de voz

EMPRESAS

ARM planea lanzar chips de inteligencia artificial en 2025

EMPRESAS

OpenAI crea un marco para dar forma a la inteligencia artificial responsable

TECNOLOGÍA

La mejora del modelo 'cloud' ante la irrupción de la IA generativa, a debate

EMPRESAS

Kyndryl reduce sus pérdidas en más de un 75%

TENDENCIAS

La escasez de chips de IA continúa, pero puede haber un final a la vista

TENDENCIAS

Escrivá anuncia una inversión de 1.500 millones de euros para el nuevo plan de inteligencia artificial

Hicham Kabbaj, director general de Dassault Systèmes para España y Portugal.

EMPRESAS

Dassault Systèmes usa los gemelos digitales para impulsar la sostenibilidad de las compañías

TECNOLOGÍA

Fujitsu redefine el almacenamiento con ETERNUS NU200

Webinar ondemand

Actualizar la transferencia de ficheros: seguridad, flexibilidad y cumplimiento regulatorio

Las empresas han aumentado sus presupuestos para proteger la información que tienen almacenada en la nube, pero ¿qué pasa con los archivos en tránsito? Los ficheros se mueven y, en esa transferencia, suele haber una puerta de entrada para los ciberdelincuentes. En este webinar te contamos cómo proteger tus datos sea cual sea su estado: en reposo o en movimiento.

Contenido Patrocinado

"El 'know-how' de Sygnia va entre dos semanas y seis meses por delante del mercado"

16 MAY 2024

El proveedor de soluciones tecnológicas Uniway ha anunciado un acuerdo de colaboración con la compañía israelí de ciberseguridad Sygnia, con la que buscan ofrecen al mercado español un servicio integral en su viaje de prevención, detección, respuesta y recuperación ante amenazas.

Forma parte de nuestra comunidad

¿Te interesan nuestras conferencias?

Especial Administraciones Públicas

No te pierdas...

LLM: qué fallos de despliegue pillan por sorpresa a los informáticos

LLM que ven demasiado

LLM con las llaves del negocio

Maestros con mentalidad funcionarial

Fallos no reconocidos

Expectativas poco realistas

TE PUEDE INTERESAR...

Actualizar la transferencia de ficheros: seguridad, flexibilidad y cumplimiento regulatorio

"El 'know-how' de Sygnia va entre dos semanas y seis meses por delante del mercado"

Radiografía de la Administración pública local y regional en clave tecnológica

El Viejo Continente se abre camino hacia la Década Digital 2030

Angelines Turón (SEPE): "La digitalización pasa por muchos proyectos que, cuando confluyen, forman un auténtico tsunami"

La transformación digital en España como motor hacia una economía próspera y sostenible

Geografía y copilotos, aliados para los CIO de la Administración

Asegurando la integridad de los datos en la Administración pública: el papel crucial de la tecnología

La IA y los datos se alzan como protagonistas del 'Digital Government Forum' 2024

España debe acelerar la Administración digital a pesar de la complejidad de los desafíos

32 años de Linux y su comunidad

MareNostrum 5 conquista los 314.000 billones de cálculos por segundo

El gasto global en nube soberana llegará a 258.000 millones de dólares en 2027

Los 'CIO 100 Awards Spain 2023' distinguen los proyectos de innovación tecnológica del año

Gemini, de Google, a la conquista de las últimas capacidades de IA generativa

Por qué la mitad de los desarrolladores adoptarán software mejorado con inteligencia artificial

ChatGPT: 365 días después, el mundo parece otro

'Superapps': ¿La próxima gran novedad de las TI empresariales?

Las mujeres se hacen su camino en el ecosistema 'startupero' español

Grandes modelos lingüísticos: los cimientos de la IA generativa

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

Líderes de futuro: ingeniería de telecomunicación

Guía esencial de Microsoft 365