Escalando la IA Generativa: La Importancia de Implementar un Marco de IA Responsable
No se trata solo de desarrollar soluciones innovadoras, sino de hacerlo de forma ética, segura y alineada con los valores de la organización.
9 octubre, 2024 / 3:29 pm
Hay temas que me van dando vuelta en la cabeza una y otra vez, este es uno de ellos, si tengo que encontrarle el lado positivo a los viajes sin la familia por trabajo, se lo doy a las experiencias multiculturales, aprender de ellos y ampliar la visión con la que uno puede comenzar a mirar las cosas, esa mirada se va transformando en observación y en esa observación me animó a escribir hoy este articulo.
La inteligencia artificial generativa (GenAI) ha irrumpido en el escenario empresarial con el potencial de transformar drásticamente los procesos de negocio y la interacción con los clientes. Desde la automatización del servicio al cliente hasta la personalización de experiencias, GenAI está redefiniendo lo que es posible. Sin embargo, con este avance vienen riesgos importantes. La IA generativa presenta desafíos en precisión, seguridad, privacidad y equidad, que las empresas deben abordar para aprovechar su potencial de manera responsable y efectiva.
Creo y siempre termina siendo una mirada personal, un punto clave: el uso de GenAI solo puede escalar y sostenerse si está respaldado por un marco de Inteligencia Artificial Responsable (RAI, por sus siglas en inglés) que se aplique en todo el ciclo de vida de la aplicación. La falta de tal enfoque puede conducir a errores graves, como chatbots que ofrecen productos por precios equivocados, malinterpretaciones de políticas, o incluso respuestas ofensivas o sesgadas. Estas fallas pueden causar daños financieros y reputacionales que son difíciles de revertir.
El Marco de Inteligencia Artificial Responsable (RAI)
El RAI es un enfoque holístico que garantiza que los sistemas de IA no solo proporcionen los beneficios esperados, sino que también respeten los valores corporativos y normativas. Las empresas deben diseñar, probar, desplegar y monitorear sus aplicaciones de IA bajo principios clave como rendición de cuentas, equidad, interpretabilidad, seguridad, privacidad y robustez.
La IA generativa plantea desafíos únicos debido a su naturaleza dinámica y probabilística. A diferencia de los sistemas deterministas que siempre generan la misma salida para una entrada dada, los modelos de GenAI, como los grandes modelos de lenguaje (LLM), pueden producir diferentes respuestas a la misma consulta. Estos modelos pueden interactuar con los usuarios de manera conversacional, lo que aumenta las posibilidades de malinterpretaciones, errores y posibles usos indebidos.
Un ejemplo de las posibles fallas de la GenAI es un chatbot de una concesionaria de autos que ofreció, erróneamente, un vehículo a precio reducido. Incidentes como este resaltan la importancia de un marco RAI que no solo proteja a la empresa, sino que también garantice que las interacciones con los clientes sean precisas y adecuadas.
Implementando RAI a Lo Largo del Ciclo de Vida de la IA Generativa
Reflexionemos juntos y pensemos… propongo un marco RAI que se aplica desde el diseño hasta la operación y el monitoreo de los sistemas GenAI. Este enfoque que propongo abarca las siguientes etapas:
1. Diseño: Mapeando Riesgos y Usos
Al comenzar, es crucial mapear los casos de uso de la IA y evaluar los riesgos potenciales asociados. Esto implica definir los límites de la aplicación, identificar los datos necesarios y establecer las reglas de interacción con los usuarios. Durante esta etapa, las empresas deben diseñar medidas de seguridad, políticas y procesos para garantizar que la IA funcione de acuerdo con los valores y regulaciones corporativas.
Por ejemplo, si la aplicación GenAI no debe comparar productos con los de competidores, se puede configurar una regla para que decline tales solicitudes. Asimismo, se deben actualizar los datos de manera continua para reflejar los cambios en productos, precios o políticas.
2. Desarrollo y Codificación: Retos y Soluciones Específicas
El desarrollo de agentes de GenAI conlleva desafíos que superan el software tradicional. La ingeniería de prompts, la integración con otros sistemas, la optimización de rendimiento y la escalabilidad son áreas críticas.
• Ingeniería de Prompts: Crear prompts efectivos y ajustar la «temperatura» del modelo es clave. Una temperatura baja produce respuestas más conservadoras y predecibles, mientras que una temperatura alta permite respuestas más variadas y creativas. Es fundamental probar iterativamente los prompts para mejorar la precisión de las respuestas.
• Integración con Sistemas Existentes: La integración con aplicaciones empresariales y flujos de trabajo existentes asegura la consistencia a lo largo de la experiencia del usuario.
• Optimización del Rendimiento: Es importante balancear la precisión de las respuestas con el tiempo de respuesta. Ajustes como optimizar los prompts y el contexto enviado a los modelos ayudan a reducir la latencia.
• Escalabilidad: Dado el alto costo computacional de la GenAI, se deben emplear infraestructuras eficientes y escalables, preferiblemente basadas en la nube, para manejar grandes volúmenes de solicitudes.
3. Pruebas y Evaluación: Asegurando Respuestas de Calidad
La evaluación y prueba de GenAI deben ir más allá de las pruebas de software tradicionales. Sugiero una metodología de tres pasos:
1. Generar un Conjunto de Datos de Preguntas: Crear un set de preguntas variadas, incluyendo tanto consultas esperadas como adversas (por ejemplo, preguntas fuera de tema o que intentan obtener información sensible). Este conjunto de preguntas debe expandirse constantemente a medida que se despliega la aplicación y se recopilan nuevas consultas de los usuarios.
2. Realizar Pruebas con Humanos y Scripts: Un enfoque mixto de pruebas automatizadas y humanas es esencial. Los testers humanos pueden añadir valor al desafiar la IA en escenarios de alto riesgo o casos complejos. Las pruebas automatizadas permiten la verificación continua del desempeño y detección de vulnerabilidades.
3. Revisar Respuestas Generadas: Evaluar las respuestas en función de criterios como relevancia, precisión, riesgo de sesgo y adecuación al negocio. La revisión humana de respuestas críticas es fundamental para garantizar que se cumplan los objetivos de la aplicación.
4. Despliegue y Lanzamiento: Un Proceso Seguro y Ágil
El despliegue de aplicaciones GenAI debe seguir un proceso estructurado, comenzando por el desarrollo en entornos de prueba y avanzando a fases de validación de calidad y producción. Esto garantiza que la integración con otros elementos del sistema sea fluida y que se cumplan las normas de seguridad.
En cuanto al desarrollo de productos mínimos viables (MVP), las empresas deben evaluar continuamente si las nuevas versiones de la IA aportan suficiente valor para justificar la inversión en actualizaciones.
5. Operación y Monitoreo: Mantenimiento y Ajuste Continuo
El monitoreo continuo es crucial debido a la posible «deriva» de los modelos LLM con el tiempo. La supervisión debe abarcar tres niveles:
• Monitoreo de Prompts y Respuestas: Analizar las interacciones para evaluar la calidad y relevancia de las respuestas.
• Auditoría de Mensajes: Revisar manualmente respuestas que hayan violado las reglas preestablecidas.
• Monitoreo Funcional: Supervisar el rendimiento y experiencia del usuario, midiendo factores como latencia y costos computacionales.
Es importante ajustar continuamente los prompts y las reglas de la IA en respuesta a los cambios en la tecnología y las necesidades del negocio
Reflexión: La Necesidad de un Enfoque Holístico para Escalar GenAI
La GenAI está abriendo puertas a una nueva era de posibilidades, transformando la manera en que las empresas interactúan con sus clientes, automatizan procesos y mejoran sus servicios. Sin embargo, con estas oportunidades viene una responsabilidad significativa. Para América Latina y cualquier región que busque capitalizar esta tecnología, implementar un marco de IA Responsable es esencial. No se trata solo de desarrollar soluciones innovadoras, sino de hacerlo de forma ética, segura y alineada con los valores de la organización.
Las empresas deben tener claro que la adopción de GenAI no es solo una cuestión técnica; es una decisión estratégica que impactará la cultura, las operaciones y, sobre todo, la confianza de sus clientes. Implementar la IA con responsabilidad, transparencia y un monitoreo continuo es el camino para garantizar que esta tecnología cumpla con sus promesas y minimice sus riesgos. Aquellas compañías que inviertan tiempo y recursos en un enfoque holístico estarán preparadas para aprovechar al máximo los beneficios de la GenAI, garantizando un crecimiento sostenible y una ventaja competitiva en un mundo cada vez más digital.
Tenemos que comenzar a mirar estos temas seriamente, sin pausa.
Diego San Esteban
Presidente Latam Open Finance & Chief Sales Director N5
Soy un profesional pragmático, de visión estratégica, referente de la región. Mas de 30 años de experiencia transformando la industria financiera, desarrollada en más de 180 clientes, 120 de ellos, bancos y aseguradoras de la región.
Trabajando en 4 mesas de innovación de bancos centrales de la región, colaborando con 3 ministerios de desarrollo tecnológico e innovación de Centro América y Latam Norte.
Soy presidente de Latam Open Finance una organización internacional que fomenta la inclusión financiera. Director del posgrado de especialización de gestión de entidades financieras de la Universidad de Buenos Aires, una de las mejores de América. Responsable del desarrollo y estrategia comercial de N5, una empresa dedicada a la industria financiera con un crecimiento anual del 500% y nombrada por Microsoft como la startup del año 2021 para Latam & Caribe.
Vamos a reflexionar sobre los temas que afectan, impactan o modifican los comportamientos de la industria financiera, vamos a fundamentar la reflexión en datos, en comportamientos del mercado, en la realidad contextual y fundamentalmente en el sentido común, buscando romper silos de pensamiento
Reflexionar en tiempos de crisis es una necesidad, hay que detener toda acción producida por la inercia para generar valor.