Cuatro de cada diez soluciones de IA generativa serán multimodales para 2027

  • Actualidad
IA generativa chatbot
©Freepik

Hoy en día, muchos modelos multimodales se limitan a dos o tres modalidades, aunque esto aumentará en los próximos años para incluir más. Gartner ha identificado dos tecnologías que ofrecen el mayor potencial: los modelos de GenAI específicos de dominio y los agentes autónomos.

El 40% de las soluciones de IA generativa (GenAI) serán multimodales (texto, imagen, audio y video) para 2027, frente al 1% en 2023, según Gartner. Este cambio de modelos individuales a modelos multimodales proporciona una interacción mejorada entre humanos e IA y una oportunidad para diferenciar las ofertas habilitadas por GenAI.

Erick Brethenoux, distinguido analista vicepresidente de Gartner, afirma que "a medida que el mercado de GenAI evoluciona hacia modelos entrenados de forma nativa en más de una modalidad, esto ayuda a capturar relaciones entre diferentes flujos de datos y tiene el potencial de escalar los beneficios de GenAI en todos los tipos de datos y aplicaciones. También permite que la IA ayude a los humanos a realizar más tareas, independientemente del entorno".

La GenAI multimodal es una de las dos tecnologías identificadas en el Hype Cycle de Gartner de 2024 para la IA generativa, en la que la adopción temprana tiene el potencial de generar una notable ventaja competitiva y beneficios en el tiempo de comercialización. Junto con los grandes modelos de lenguaje (LLM) de código abierto, ambas tecnologías tienen un alto potencial de impacto en las organizaciones en los próximos cinco años.

La GenAI multimodal tendrá un impacto transformador en las aplicaciones empresariales al permitir la adición de nuevas características y funcionalidades que de otro modo serían inalcanzables. El impacto no se limita a industrias o casos de uso específicos, y se puede aplicar en cualquier punto de contacto entre la IA y los humanos. Hoy en día, muchos modelos multimodales se limitan a dos o tres modalidades, aunque esto aumentará en los próximos años para incluir más.

Innovaciones de GenAI con mayor potencial

Entre las innovaciones de GenAI que Gartner espera que alcancen la adopción generalizada dentro de 10 años, se han identificado dos tecnologías que ofrecen el mayor potencial: los modelos de GenAI específicos de dominio y los agentes autónomos.

Los modelos GenAI específicos del dominio están optimizados para las necesidades de industrias, funciones comerciales o tareas específicas. Pueden mejorar la alineación de los casos de uso dentro de la empresa, al tiempo que ofrecen una mayor precisión, seguridad y privacidad, así como respuestas mejor contextualizadas. Esto reduce la necesidad de ingeniería rápida avanzada en comparación con los modelos de propósito general y puede reducir los riesgos de alucinación a través de una capacitación específica.

Los agentes autónomos son sistemas combinados que logran objetivos definidos sin intervención humana. Utilizan una variedad de técnicas de IA para identificar patrones en su entorno, tomar decisiones, invocar una secuencia de acciones y generar resultados. Estos agentes tienen el potencial de aprender de su entorno y mejorar con el tiempo, lo que les permite manejar tareas complejas.