Tecnología

Ideas que expanden tu mente: Imágenes hiperrealistas creadas por Inteligencia Artificial con descripción de texto

Los avances en inteligencia artificial son sorprendentes y definitivamente no podemos ser ajenos ante esta asombrosa tecnología. A continuación, más sobre las imágenes hiperrealistas con descripción de texto, generadas por inteligencia artificial de última generación que expanden nuestras mentes y capacidad de asombro.

Hoy es posible entrenar redes neuronales de Inteligencia Artificial (IA), para aprender nuevos lenguajes que ejecuten una o varias series de tareas específicas. La tecnología para generación de imágenes por medio de IA, basada en texto descriptivo parece “sencilla”. Basta entrenar la red neuronal para generar imágenes de alta fidelidad.

Uno de los pioneros en el campo de generación de imágenes de este tipo en tecnología de redes neuronales es el DALL-E de Open AI, (generador de 12 Billones de parámetros, versión del GPT-3).Lanzado en enero del 2021 como una IA entrenada para generar imágenes desde textos descriptivos usando sets de datos en parejas conformadas por texto e imagen.

El generador DALL-E puede:

  1. crear versiones antropomorfas de animales y objetos mediante la combinación de conceptos no relacionados entre sí y de varias maneras posibles.
  2. Se basa en render de texto y transformación de las imágenes existentes.

Un año más tarde en 2022, aparece DALL-E-2, cuya red neuronal aprendió la relación entre las imágenes y el texto usado para describirlas. Mediante el uso de Deep Learning y un proceso llamado difusión.

El DALL-E-2 parte de un patrón de puntos aleatorios y gradualmente va alterando el patrón hacia la consecución de la imagen cuando reconoce aspectos específicos de la imagen.

Capacidades del DALL-E-2

Nuevas capacidades, mayor resolución, amplia comprensión, mayor tecnología.

El Impainting, permite desaparecer un objeto de la imagen reemplazándolo por otro, puede comenzar con una sola imagen y recrear la misma imagen desde diferentes ángulos y estilos. No solo aprende imágenes, sino que utiliza las múltiples relaciones existentes entre estas imágenes.

Sin embargo, sabemos que en la carrera de la tecnología todo avanza a velocidades increíbles, en especial en el campo de la robótica. Ahora que se ha logrado instruir a la IA para manipular los conceptos visuales a través del lenguaje descriptivo. Los investigadores han ampliado esta aplicación.

Resulta que Google ha presentado su versión de IA para creación de imágenes hiperrealistas a partir de un breve texto descriptivo y en combinaciones casi que infinitas: IMAGEN, (similar al DALLE-E-2) una IA que puede convertir un texto a imagen con lujo de detalles para que coincida con la descripción.

La novedosa IMAGEN está basada en el modelo Transformer T5 del 2020. Según Google, IMAGEN ha conseguido superar el performance, resolviendo problemas de DALLE-E-2.  La IA: IMAGEN por motivos éticos de momento no es un producto comercial y se mantiene como una herramienta experimental para uso de investigación.

Las aplicaciones de esta tecnología podrían ser amplias. Esperamos a futuro poder ver avances tan importantes de la IA, enfocadas para aplicaciones prácticas en: las artes, el branding, el marketing digital, el diseño UX, diseño en general y para todas las ramas de lo creativo.

Ideas que Duran S.A.S, su proveedor de confianza. Centro de producción, grupo de profesionales web, Marketing Digital, Diseño UX, desarrollo y diseño de empaques para productos, marca / branding y estrategia. Conozca más en la web: https://idideasqueduran.com/

Deja una respuesta

Tu dirección de correo electrónico no será publicada.