Google inicia una nueva era en el desarrollo de la IA con Gemini

  • Estrategias digitales

Google Gemini

La compañía ha optimizado Gemini 1.0, la primera versión del modelo, en tres tamaños diferentes: Ultra, Pro y Nano, siendo capaz de funcionar eficazmente en todas partes, desde en un centro de datos hasta en dispositivos móviles, y de combinar a la perfección distintos tipos de información, como texto, código de programación, audio, imágenes y vídeo.

Google lleva casi ocho años volcada en la inteligencia artificial y los avances son cada vez más rápidos. En este momento, millones de personas ya utilizan la IA generativa de sus productos para hacer cosas que no podían hacer hace apenas un año. Desde encontrar respuestas a preguntas más complejas hasta utilizar nuevas herramientas para colaborar y crear. En paralelo, los desarrolladores están utilizando nuestros modelos e infraestructura para poner a punto nuevas aplicaciones de IA generativa, y numerosas startups están creciendo con ayuda de las herramientas de IA de la compañía. Pues bien, dado el paso siguiente en este viaje con Gemini, el modelo más avanzado y capaz que ha creado hasta la fecha.

Gemini se construyó desde cero para ser multimodal, lo que significa que puede generalizar y entender, operar y combinar a la perfección distintos tipos de información, como texto, código de programación, audio, imágenes y vídeo. Gemini es también un modelo flexible, capaz de funcionar eficazmente en todas partes, desde en un centro de datos hasta en dispositivos móviles.

Google ha optimizado Gemini 1.0, la primera versión, en tres tamaños diferentes:

--Gemini Ultra, el modelo más potente y de mayor tamaño, para tareas de gran complejidad.

--Gemini Pro, el mejor modelo para escalar en una amplia gama de tareas.

--Gemini Nano, el modelo más eficiente para ejecutar tareas directamente en un dispositivo.

Capacidades de nueva generación

Hasta ahora, el enfoque estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades y luego unirlos para imitar grosso modo algunas de estas funciones. Al ser multimodal de forma nativa, Gemini ha sido preentrenado desde el principio en diferentes modalidades. Después se ha perfeccionado con datos multimodales adicionales para refinar aún más su eficacia. Este planteamiento ayuda a Gemini a entender y razonar a la perfección sobre todo tipo de entradas, mucho mejor que los modelos multimodales existentes, y sus capacidades son punteras en casi todos los ámbitos.

Gemini cuenta con las evaluaciones de seguridad más exhaustivas de todos los modelos de IA de Google hasta la fecha, incluidas medidas contra sesgos y toxicidad. Se ha realizado investigaciones novedosas en posibles áreas de riesgo, como la ciberdelincuencia, la persuasión y la autonomía, y ha aplicado las mejores técnicas de pruebas de adversarios de Google Research para identificar problemas de seguridad críticos antes del despliegue de Gemini.

Gemini llegará a miles de millones de personas a través de los productos de Google, incluidos Bard y Pixel, y próximamente en el Buscador, Ads, Chrome y Duet A. A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de la API Gemini en Google AI Studio o Vertex AI.