Javier Barrachina (Fujitsu): «Hoy día entrenamos modelos MLL mucho más grandes con muchos menos recursos» [2/3]
TPB355 abr25. Declaraciones de Javier Barrachina, director de Transformación Digital de Fujitsu España:
Un resumen acelerado de la IA
Desde que llegó el iPhone hace quince años el cuento ha cambiado mucho con la revolución de Internet y la forma de relacionarnos. En 2014 Ian Goodfellow saca lo de GANfather que decididamente marca el camino de la IA en el sentido de sistemas neuronales que crean contenidos de manera autónoma. En 2017 ocho investigadores de Google idean un mecanismo para procesar secuencias de datos en paralelo, lo que lo hace más eficiente al no necesitar un orden fijo, pero inconcebiblemente los Transformer no obtienen el respaldo de la compañía y se van. Un año después alguno de ellos entra en OpenIA y sacan la primera versión de ChatGPT, que empleó entonces 100.000 TB de data para entrenarse, mucho más que todo lo necesario hoy día, que entrenamos modelos mucho más grandes con muchos menos parámetros. Y ya vamos por la quinta versión que está revolucionando personas y empresas.
Y se va hacia dónde
La evolución nos ha hecho pasar, cuanto más autónomos y complejos son, de los LLM a la IA generativa a los agentes IA y ya estamos viendo los multiagentes. El agente trae la acción, cumple tus deseos de manera autónoma y ejecuta una tarea especial; el multiagente ya trae distintas habilidades. Las compañías de todos los sectores aún están digiriendo, en la fase de cómo empezar a trabajar con agentes.
Esto va muy rápido, y si en 2027 estaremos ya en los modelos de agentes IA para experiencia del cliente y el 50% de los modelos de GenAI serán específicos de un vertical, en tres años el 33% de las aplicaciones empresariales incorporan agentes IA (frente al 1% actual), el 15% de las decisiones serán tomadas por agentes IA (frente al 0 actual) y el 60% de los motores de búsqueda serán conversacionales con GenAI (frente a menos del 20% actual).
«El agente trae la acción, cumple tus deseos de manera autónoma y ejecuta una tarea específica; el multiagente ya trae distintas habilidades en múltiples campos» (Javier Barrachina, Fujitsu)
Tecnologías clave que Fujitsu aterriza
El papel de Fujitsu aquí se basa en cinco pilares: cómputo, redes, inteligencia artificial, ciberseguridad y tecnologías convergentes. En España contamos con un CoE, un centro de excelencia de data intelligence, donde se crean y desarrollan sistemas de datos basados en inteligencia. Fujitsu Research tiene ocho centros de I+D por el mundo para construir soluciones de mercado más robustas, y uno es este, con el objetivo de trabajar en tres áreas: la transformación social, la experiencia y las industrias. También tenemos una cátedra de IA responsable en la Universidad de Granada. Estamos en el top 10 en patentes sobre IA. LA IA ha llegado para quedarse, no es algo puntual.
Tenemos el supercomputador más grande y más potente del mundo, Fugaku. Y estamos creando los modelos LLM de entrenamiento distribuido para un montón de propósitos: desde detectar alucinaciones a direcciones URL maliciosas, desde generación de imágenes a generación de código y aplicaciones seguras, desde crear una GenAI mixta con análisis de causa raíz, de grafos de conocimiento o de consistencia del software al enmascaramiento de contraseñas con optimización cuántica.
Y estamos en toda la cadena de valor, proporcionando desde el hardware con superordenadores HPC y ordenadores cuánticos a plataformas cloud bajo los hiperescalares, desde centros de modelaje MLOPs con el MLL que mejor se amolde a aplicaciones con agentes específicos para industria verticales, y por supuesto la capa de servicios alrededor de un conocimiento especializado en cómo usar la IA Generativa en los distintos casos de uso.
Contenido extra: