La esencia
- DALL-E 3 ya está aquí. La última versión del generador de imágenes de IA ofrece una integración perfecta con ChatGPT.
- Precisión mejorada. DALL-E 3 comprende el contexto para crear imágenes excepcionalmente precisas.
- Nuevas restricciones. La plataforma limita la creación de contenido inapropiado y agrega funciones para respetar los derechos y preferencias de los creadores.
OpenAI presentó recientemente DALL-E 3, la tercera versión de su plataforma generativa de texto a imagen con IA. ¿Qué hay de nuevo? DALL-E 3 está construido de forma nativa en ChatGPT, lo que significa que los usuarios pueden usar ChatGPT para ayudar a generar ideas, crear y perfeccionar indicaciones para imágenes.
Una demostración de DALL-E 3 muestra que cuando se le solicita una idea, ya sea una oración o unas pocas palabras, ChatGPT genera automáticamente cuatro indicaciones detalladas, que luego DALL-E 3 visualiza. Si desea realizar cambios en las imágenes, todo lo que tiene que hacer es pedirle a ChatGPT que ajuste el mensaje.
“Los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería rápidamente. DALL-E 3 representa un gran avance en nuestra capacidad de generar imágenes que se adhieran exactamente al texto que usted proporciona”, dijo OpenAI.
Lo interesante de la plataforma es la verdadera integración entre texto y gráficos. Los usuarios pueden solicitar un mensaje para una imagen y luego usar esa imagen para solicitar a ChatGPT que escriba una historia o un poema relevante. Las iteraciones son simples y toman unos segundos. Y, para los puristas, todavía es posible crear mensajes sin la ayuda de ChatGPT.
Artículo relacionado: ¿Qué es ChatGPT? Todo lo que necesitas saber
La evolución de DALL-E
OpenAI lanzó el DALL-E original, una plataforma que utiliza inteligencia artificial generativa para convertir texto en imágenes, en enero de 2021. Un año después llegó DALL-E 2, que según OpenAI generaba imágenes más realistas y precisas con una resolución cuatro veces mayor.
Ambas plataformas tienen sus fallas con la precisión, ya que no siempre completan cada solicitud en un mensaje, algo que descubrí cuando probé DALL-E 2 contra Midjourney y Stability AI’s Stable Diffusion.
Por ejemplo, le di a DALL-E el siguiente mensaje: Planeta alienígena con dos lunas y vegetación exótica de colores brillantes. El resultado: algunas de las imágenes generadas no incluían vegetación brillante ni el número correcto de lunas.
DALL-E 3, sin embargo, comprende mejor el contexto, según OpenAI. «DALL-E 3 comprende muchos más matices y detalles que nuestros sistemas anteriores, lo que le permite traducir fácilmente sus ideas en imágenes excepcionalmente precisas».
Nuevas características y restricciones de seguridad del DALL-E 3
Más allá de la capacidad de usar ChatGPT para dar vida a sus ideas visuales, DALL-E 3 incluirá características de seguridad adicionales para limitar la capacidad del sistema para crear contenido de odio, para adultos o violento.
OpenAI se asoció con los equipos rojos (personas que intentan romper sistemas para identificar vulnerabilidades, debilidades y áreas de mejora) para probar DALL-E 3 e informar sus esfuerzos de mitigación y evaluación de riesgos en áreas como propaganda y desinformación.
DALL-E 3 está capacitado para rechazar solicitudes que soliciten imágenes de figuras públicas (por nombre). También rechazará solicitudes para generar imágenes al estilo de artistas vivos, algo que podrían hacer versiones anteriores de DALL-E.
Los creadores pueden solicitar que sus imágenes no participen en el entrenamiento de futuros modelos de generación de imágenes, una posible respuesta a la demanda colectiva que los artistas presentaron contra el generador DreamUp en DeviantArt, Stable Diffusion y Midjourney por utilizar trabajos protegidos por derechos de autor para entrenar sus modelos de texto a imagen. . Los creadores que quieran excluirse de futuras capacitaciones de DALL-E deben enviar una solicitud que incluya la imagen que desean eliminar al formulario en línea de OpenAI.
La empresa de investigación de IA afirma que también está experimentando con un clasificador de procedencia, una herramienta interna para ayudar a identificar si una imagen fue generada por DALL-E 3. El objetivo de la herramienta es «comprender mejor las formas en que se pueden utilizar las imágenes generadas». dijo OpenAI.
Artículo relacionado: Midjourney vs. DALL-E 2 vs. Difusión estable. ¿Qué generador de imágenes con IA es mejor?
Cómo utilizar DALL-E 3
Si se pregunta cómo utilizar DALL-E 3, actualmente se encuentra en una vista previa de investigación. Estará disponible en octubre para los usuarios de ChatGPT Plus y ChatGPT Enterprise, y estará disponible a través de la API y en laboratorios de investigación a finales de este otoño.
En este momento, no hay información disponible sobre cuándo estará disponible una versión pública gratuita de DALL-E 3.
Al igual que con DALL-E y DALL-E 2, OpenAI dice que los usuarios no necesitan permiso para preparar, vender o comercializar las imágenes que generan con DALL-E 3.
Continuar leyendo: OpenAI lanza DALL-E 3 con tecnología ChatGPT