Project Astra: el increíble asistente IA visual de Google es capaz de entender el mundo a tu alrededor
Google acaba de dejar a medio mundo con la boca abierta mostrando su nuevo asistente visual denominado Project Astra. Una herramienta increíblemente poderosa que puede suponer una auténtica revolución.
Un camino que ya están tomando otras inteligencias artificiales. De hecho, ChatGPT también acaba de mostrar todas sus increíbles novedades, las cuales os explicamos en un reportaje aparte.
Pero centrándonos ahora en Project Astra, la demostración que ha llevado a cabo la compañía norteamericana durante su reciente keynote celebrada bajo el marco de la Google I/O 2024 ha sido impactante.
¿Y en qué ha consistido dicha demostración? Pues en un vídeo grabado en una sola toma continua (sin cortes) en el que dicha IA ha sido capaz de ir identificando una serie de objetos de manera correcta, ha dado solución a un problema, dio con la ubicación actual de la persona que estaba grabando el vídeo con sólo mostrarle una vista desde una ventana... En fin, algo increíble que pasamos a explicar con detalle.
Una IA útil para la vida cotidiana
El principal objetivo que se ha marcado Google con Project Astra es dar solución a las diversas situaciones que puedan presentarse en su día a día. Y hablamos de todo tipo de circunstancias, tal y como se ha podido ver en el vídeo que seguro que va a ser viral.
Un vídeo grabado en lo que parecía ser una oficina londinense con Project Astra integrada en un móvil. Bien, pues la primera tarea que recibe esta IA fue identificar un objeto que fuera capaz de emitir sonido. Tras realizar un breve barrido, al aparecer un altavoz en la pantalla del smartphone, la IA lo reconoció en seguida.
A partir de aquí es cuando la cosa comenzó a adquirir tintes épicos, dado que la persona a cargo de Project Astra dibujo una flecha en la pantalla del móvil señalando a una parte muy concreta del altavoz (un bafle) y le preguntó acerca de él. Bien, pues la IA lo detectó sin problemas.
Una demostración clara de que es capaz de reconocer símbolos (en este caso una flecha) referidos sobre algún objeto específico.
Acto seguido, la pantalla del móvil se detuvo en el típico recipiente de bolígrafos y lápices que puede encontrarse en cualquier oficina y Project Astra recibió la orden de que realizara una aliteración sobre esa imagen. Al instante, la IA respondió con la frase "Crayones creativos colorean alegremente".
Por lo tanto, esta IA ya no sólo puede reconocer objetos, estructuras y demás, sino que también puede interpretarlos y "usarlos" para ir más allá de lo que es la mera identificación.
Pero lo mejor estaba por llegar. Justo al lado de dicho recipiente se encontraba un portátil con líneas de códigos. Al ser preguntado sobre qué tareas realizaban unas líneas concretas del código, Project Astra contestó con una precisión increíble.
Este ejemplo da muestras claras de que esta IA ya no sólo sabe de qué se trata lo que se refleja en su "campo de visión", por así denominarlo, sino que es capaz de definirlo al instante y de una forma tremendamente precisa.
Segundos después, la persona a cargo del móvil con la IA integrada en él lo usó para echar un vistazo a lo que se dejaba ver tras una de las ventanas de la oficina. Con sólo eso (una vista muy limitada), Project Astra pudo identificar sin problemas la localización exacta en la que se encontraba, en este caso un barrio londinense.
Por lo tanto, el dominio de la geografía global de esta herramienta parece que será total, ya que con una simple perspectiva no demasiado concreta puede determinar una ubicación.
Sin apenas dar tiempo a que respondiera a esta última cuestión, la persona a cargo de la IA la preguntó directamente si sabía dónde había dejado las gafas. Bien, pues la respuesta no pudo ser más precisa: dicho objeto estaba encima de la mesa, junto a una manzana roja.
O sea, que el dominio del espacio y de los objetos que se encuentran en él es absoluto, y además tiene la capacidad de "memorizar" dónde se encuentra cada elemento que rastrea.
Tras ponerse las gafas, objeto que también gozaba de esta asombrosa tecnología, la encargada de grabar el vídeo se detuvo a contemplar una pizarra en la que se mostraba lo que parecía el esquema de una cadena de trabajo, pintó una flecha sobre una parte muy concreta de dicho esquema.
Tras trazar dicha flecha, preguntó a la IA qué podía hacer en esa parte en concreto para acelerar el proceso planteado en el esquema. Y, nuevamente, la respuesta de Project Astra fue muy concisa e increíblemente técnica: según parece, bastaba con añadir caché entre el servidor y la base de datos.
Una demostración de que este soporte puede ir más allá y crear razonamientos que giran alrededor de los elementos que ya de por sí reconoce, una función que puede ser increíblemente útil.
En esa misma pizarra también se mostraban dos caricaturas de la cara de dos gatitos, uno con los ojos normales y otros en forma de aspas (xx). Justo debajo de ellos se colocó una caja de cartón con una interrogación dibujada en ella y se preguntó a la IA a qué le recordaba tan particular conjunto de elementos.
¿Y cuál fue la respuesta? La célebre paradoja de Schrödinger, demostrando que Project Astra puede analizar situaciones y dar "respuestas creativas" muy acertadas. Y eso mismo es lo que sucedió con la última parte de esta demostración.
Al colocar una especie de tigre de peluche junto a un perrete adorable de color crema, se le pidió a esta IA que les pusiera un nombre. Y dicho nombre fue Golden Stripes, muy acertado y perfectamente coherente, demostrando que esta IA es capaz de contextualizar y crear al mismo tiempo en cuestión de instantes.
Así de impresionante se postula el nuevo asistente visual de IA creado por Google, bautizado como Project Astra. Una herramienta que si es capaz de hacer realidad todo lo que promete y de manera eficiente, puede suponer un paso adelante para el futuro de esta tecnología.
"Veo" es la nueva IA de Google capaz de generar vídeo Full HD solo a partir de texto
- Ver Comentarios