Google ha anunciado la llegada de Gemini 2.0, la evolución de su sistema de Inteligencia Artificial. El nuevo modelo de IA de este gigante de la industria se basa en los 'agentes'. Es decir, entidades que funcionan de forma independiente para automatizar, en menor tiempo, tareas que le encargue el humano: aprenden y toman decisiones. Es el rumbo que ha tomado Google y que otros, como Microsoft, ya habían incorporado a su Copilot. Por ahora, parece que el futuro cercano de la Inteligencia Artificial pasa por ahí.
Los responsables de Google se han mostrado emocionados al presentar su nuevo software. "Los nuevos avances en multimodalidad -como la generación nativa de imágenes y audio y el uso nativo de herramientas- nos permitirán construir nuevos agentes de IA que nos acerquen a nuestra visión de un asistente universal", ha afirmado el consejero delegado de Google y Alphabet, Sundar Pichai, a través de un comunicado. Gemini 2.0 es su modelo "más capaz" hasta el momento.
Por el momento, Google ha puesto a disposición de los desarrolladores, y algunos testers, su Gemini 2.0. Otra versión experimental, Gemini 2.0 Flash, está ya disponible para todos los s. "También vamos a lanzar una nueva función llamada Deep Research, que utiliza capacidades avanzadas de razonamiento y contexto largo como si fuera un asistente de investigación", han añadido en el comunicado.
Qué aporta Gemini 2.0 Flash
Google se congratula por el rendimiento de Gemini 2.0 Flash, que, tal como explica, supera a la versión 1.5 Pro en potencia y también en velocidad. "Además de itir entradas multimodales como imágenes, vídeo y audio, Flash 2.0 ite ahora salidas multimodales, como imágenes generadas de forma nativa mezcladas con texto y audio multilingüe sintetizado a partir de texto", han detallado. Todos los s lo podrán disfrutar a partir del próximo mes de enero de 2025.
Los agentes de Gemini 2.0
Proyecto Astra. Estos agentes pretenden comprender de forma "multimodal", es decir, a través de imágenes, vídeos, sonidos o textos, el mundo real. El que habita el . Entre sus virtudes, Google ensalza la comprensión de un idioma, identificando acentos, por ejemplo. También está capacitado para recordar con mayor precisión las conversaciones que el ha tenido con este agente, con lo que la interacción será más personalizada.
Proyecto Mariner. Este agente pone el foco en el uso del navegador y trabaja de forma automatizada, siguiendo los patrones marcados por el , de los cuales aprende. En este punto, los responsables de Google reconocen que está en una fase temprana, no pero no duda en afirmar que su evolución será rápida. Además, insisten en que el control del navegador requerirá, en acciones especialmente delicadas, la confirmación del .
Proyecto Jules. Este agente está destinado a los desarrolladores. Les ayudará en el código, la resolución de problemas o incluso puede elaborar, y ejecutar, un plan de acción. Además, Google tiene agentes para juegos: podrá sugerir al qué hacer en base a la información de la pantalla. La compañía informa de que ya está en negociaciones con gigantes del sector para afinar esta propuesta.
Comentarios