Google presenta Gemini: un revolucionario modelo de IA capaz de superar a ChatGPT-4
Google ha presentado un nuevo modelo avanzado de inteligencia artificial (IA) llamado Gemini, que, según Google, puede superar significativamente al actual líder Chat GPT. La empresa está apostando fuerte por el nuevo modelo en 2024 y lo califica de gran avance en la IA personalizada.
Según Sundar Pichai, CEO de Google, ha llegado el momento de una nueva era de la IA en la compañía, que él llama la “era Géminis”. Gemini es el último desarrollo de Google en el campo de los modelos lingüísticos a gran escala. El proyecto se anunció en junio en la conferencia de desarrolladores I/O, y ahora está disponible para el público. Pichai y el CEO de Google DeepMind, Demis Hassabis, describen Gemini como un avance significativo en el desarrollo de modelos de IA que afectará a casi todos los productos de Google. señala Pichai: “Lo especial de este momento es que trabajando en una tecnología central y mejorándola, podemos tener un impacto inmediato en todos nuestros productos.”
Gemini no es sólo un modelo de IA. Existe una versión más ligera llamada Gemini Nano, diseñada para su uso sin conexión en dispositivos Android. Una versión más potente, Gemini Pro, pronto se convertirá en la base de muchos servicios de IA de Google, así como de Bard. También existe el modelo Gemini Ultra, el más potente, diseñado para centros de datos y uso corporativo.
Google está implementando actualmente el modelo de varias maneras: Bard ahora funciona con Gemini Pro, y los usuarios de Pixel 8 Pro obtendrán nuevas funciones con Gemini Nano. El lanzamiento del Gemini Ultra está previsto para el año que viene. Los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de Google Generative AI Studio o Vertex AI en Google Cloud a partir del 13 de diciembre. Actualmente, Gemini sólo está disponible en inglés, pero está previsto añadir otros idiomas. Pichai señala que el modelo acabará integrándose en la búsqueda de Google, los productos publicitarios y el navegador Chrome, entre otros.
OpenAI lanzó ChatGPT hace un año, y rápidamente se convirtió en una parte importante del mundo de la IA. Ahora Google se prepara para afrontar el reto.
Es importante destacar que Gemini destaca en la interacción con vídeo y audio, gracias a su multimodalidad. Google no creó modelos separados para imágenes y voz, como hizo OpenAI con DALL-E y Whisper, sino que desarrolló un modelo multisensorial universal desde el principio. Hassabis afirma que esto forma parte de un plan de desarrollo más amplio para Gemini, que con el tiempo adquirirá más capacidades y será más preciso y realista.
La Gemini no sólo es más potente, sino también más eficiente que los modelos anteriores. Se ha entrenado en las unidades de procesamiento tensorial de Google, lo que hace que su uso sea más rápido y barato. Google también lanza una nueva versión de su sistema TPU, TPU v5p, diseñada para el entrenamiento y uso de modelos a gran escala en centros de datos.
Pichai y Hassabis ven el lanzamiento de Gemini como el comienzo de un proyecto más amplio y un paso que cambiará las reglas del juego. Gemini podría convertirse no sólo en la respuesta de Google a ChatGPT, sino también en el comienzo de una nueva era en las tecnologías de inteligencia artificial.