Si pudiéramos resumir estas dos últimas semanas en una palabra, esta sería DeepSeek, la plataforma de IA china que ha puesto todo el ecosistema tecnológico patas arriba, hasta el punto de hacer perder a Nvidia 600.000 millones de dólares en un solo día porque consigue mucho con pocos recursos.
Pues bien, si uno explora en todo lo que puede encontrar en esta plataforma, encontrará que recientemente ha lanzado Janus Pro 7B, una herramienta gratuita y de código abierto que es capaz de comprender imágenes y de generarlas, compitiendo en capacidad con DALL-E 3.
Para acceder a ella, puedes hacerlo a través de su página de HuggingFace.
Web: Página de Janus Pro 7B en HuggingFace
Una vez dentro, lo primero que verás será el módulo para entender imágenes, pero el tutorial de hoy nos invita a generar imágenes, así que bajaremos un poco hasta el apartado "Text-to-Image Generation", donde veremos varios parámetros que, a simple vista, se ven complejos, pero en cuanto te los expliquemos los comprenderás perfectamente.
- CFG Weight: Define cuán estrictamente la IA debe apegarse a la descripción de tu prompt. Cuanto más alto sea, más fiel será a ella.
- Temperature: Indica cuánta libertad le das a la IA para imaginar detalles por su cuenta. Cuanto más bajo sea el valor, se arriesgará menos a crearlos y permanecerá "conservadora". Cuanto más alto sea, más variada y sorprendente será la imagen.
- Prompt: Aquí escribes lo que quieres que la IA genere. Cuanto más concreto y mejor explicado sea el prompt, mejor será el resultado. Procura escribir primero lo que consideres más relevante.
Por ejemplo, si quieres sí o sí que aparezca un caballero medieval español, sin importarte mucho si el fondo es fiel a tu descripción o no, lo primero que escribirás será "un caballero medieval español…"
- Seed: este es un número que usa la IA como punto de partida para crear la imagen.
Por ejemplo, imagina que quieres generar una pintura de estilo impresionista de un oso en un bosque. Tras escribir el prompt y ajustar la temperatura y otros parámetros y pulsar en "Generate Images", se creará la seed o semilla.
Ahora bien, la imagen generada te gusta mucho y no quieres generar ninguna más porque tiene lo que buscas, pero querrías cambiarle un poco la temperatura, ya que crees que le has dado demasiada "libertad" a la IA y buscas algo más conservador.
Pues bien, para hacer esos cambios a esa imagen concreta, deberías escribir la seed de la imagen original y cambiar el parámetro que desees, que en este caso es la temperatura. Es conveniente que no modifiques el prompt, ya que es el componente que más peso tiene en la creación y el cambio sería demasiado grande.
Explicada la teoría, ahora toca probarlo, y lo vamos a hacer con el ejemplo del oso en el bosque con estilo impresionista, aunque, al igual que ocurre con todos los generadores de imágenes mediante IA, el resultado dependerá casi por completo de cómo escribas el prompt, ya sea que lo hagas en inglés, en español o en otro idioma.
Nosotros optamos por este prompt:
"Pintura al estilo impresionista de un oso pardo que deambula por un bosque frondoso y brumoso, pintada con pinceladas suaves y luz moteada. Inspirada en las obras de Claude Monet, con verdes vibrantes, remolinos suaves de color y perspectiva atmosférica. La escena transmite una sensación de paz y ensueño, enfatizando las texturas naturales y los tonos cálidos del pelaje del oso."
Como puedes ver, el prompt comienza por lo que nos resulta más importante, que es "Pintura al estilo impresionista de un oso pardo que deambula por un bosque". Después de eso, añadimos todos los demás detalles.
También resulta muy útil darle referencias de personas reales, tal y como hemos hecho escribiendo "Inspirada en las obras de Claude Monet". Por último, agrega los colores, tonos, perspectivas y texturas para que la IA te entregue lo que quieres.
Una vez hecho el prompt, observarás que el parámetro CFG Weight lo hemos colocado al máximo para que sea muy fiel a la descripción que le hemos dado de la imagen, mientras que la temperatura la hemos bajado a la mitad para que sea un poco conservadora.
Pulsamos en "Generate Images" y nos ofrece el siguiente resultado:
No está mal, aunque si no te gusta el primer resultado, ten en cuenta que genera cinco resultados por ejecución, así que te recomendamos que revises todos para encontrar el que más te guste.
Y listo, así puedes crear imágenes gratis con Janus Pro 7B de DeepSeek sin tener que depender de servicios de pago como Midjourney. No obstante, bien es cierto que a este modelo todavía le queda camino por recorrer para alcanzar el nivel de los mejores modelos de generación de imágenes.
Si TikTok ha sido baneada, DeepSeek podría correr la misma suerte
- Ver Comentarios