Google ha creado otra herramienta IA llamada Whisk para crear imágenes, pero su particularidad radica en que no necesita texto para generarlas. Por el contrario, el usuario debe subir imágenes para que la plataforma las pueda desarrollar. Es totalmente innovador, considerando que la mayoría necesita un promt con las ideas marcadas, en este caso se requiere una colección de fotos para describir el resultado final. Conozcamos más detalles sobre ella y cómo usarla.
¿Cómo funciona Whisk y que hay que hacer para generar imágenes con ella?
Desde que la IA llego a nuestras vidas hemos aprendido a usarla a partir de un texto o comandos de voz. A partir de esa entrada de información, la herramienta generaba imágenes, vídeos, canciones o una simple conversación. Pues bien, Google ha cambiado esta manera de hacerlo con Whisk, una plataforma IA que genera imágenes a partir de otras imágenes.
Para usar Whisk los usuarios deben contemplar tres aspectos como son: el sujeto principal de la fotografía, el fondo que desea tener y el estilo de la imagen. Aunque la fuente principal para crearlos no implica ni una sola palabra, la herramienta ofrece un cuadro de texto por si la persona quiere añadir elementos especiales al resultado final.
Google ha informado en su blog oficial que Whisk utiliza dos motores de IA, el primero sin duda es Gemini y su función es traducir las imágenes que sube el usuario. La segunda es Imagen 3 que sirve para convertir los insumos fotográficos en nuevas creaciones.
Whisk no hace réplicas de fotos, genera resultados inéditos, desde cero y completamente novedosos a partir de otras imágenes. La esencia de cada recursos es lo que la IA utiliza para generar sus creaciones. De momento, la herramienta solo se puede utilizar en los Estados Unidos y es cuestión de tiempo para tenerla en España y el resto del mundo. Sin embargo, te vamos a explicar cómo usarla y algunos ejemplos de los resultados que genera:
- Una vez dentro de Whisk simplemente se arrastran las imágenes que se desean usar.
- Es importante hacerlo por bloques segun lo que se quiera crear: sujeto, fondo y estilo.
- La IA genera variaciones de ella para elegir el mejor resultado.
- Al final puedes mejorar un poco el resultado añadiendo algo de texto para especificar algunos elementos o afinar detalles.
En esta foto generada con Whisk IA de Google podemos ver como a partir de tres imágenes se puede crear una nueva. Partiendo de las categorías que solicita la herramienta, esta puedes desglosar cada elemento y hacer una totalmente nueva. Comparte esta información para que otras personas conozcan sobre el tema y estén atentos a nuevas publicaciones.