Alibaba lanza Qwen-Image-Edit: un modelo de código abierto de 20 mil millones de dólares para edición avanzada de imágenes y texto.
En Resumen El equipo Qwen de Alibaba Cloud ha lanzado Qwen-Image-Edit, un modelo de edición de imágenes de última generación que combina la edición semántica y de apariencia con una modificación precisa de texto bilingüe, ofreciendo capacidades avanzadas para aplicaciones creativas y prácticas.
Alibaba Cloud's Qwen El equipo ha presentado Qwen-Image-Edit, un modelo avanzado de edición de imágenes derivado del framework 20B Qwen-Image. El nuevo sistema amplía las capacidades de renderizado de texto de Qwen-Image, aplicándolas a la edición de imágenes, con especial énfasis en la precisión en las modificaciones de texto. Qwen-Image-Edit procesa las imágenes de entrada mediante dos componentes paralelos: Qwen2.5-VL, que gestiona el control semántico visual, y el codificador VAE, que gestiona la apariencia visual. Este enfoque dual permite al modelo gestionar eficazmente las tareas de edición tanto a nivel semántico como de apariencia. Se puede acceder a la herramienta a través de Qwen Chat, en la sección "Edición de Imágenes".
Qwen-Image-Edit está diseñado para funcionar en múltiples dimensiones de edición. Admite ajustes de apariencia, como la adición, eliminación o modificación de elementos visuales, manteniendo intactas las demás áreas de la imagen, y ediciones semánticas, como la creación de propiedad intelectual, la rotación de objetos o la transferencia de estilos, donde se permiten modificaciones más amplias de píxeles, manteniendo la integridad semántica. También ofrece funciones de edición de texto refinadas, tanto en chino como en inglés, que permiten a los usuarios agregar, eliminar o ajustar texto dentro de las imágenes, manteniendo la consistencia de la fuente, el tamaño y el estilo. Las pruebas comparativas realizadas con varios conjuntos de datos ampliamente reconocidos indican que Qwen-Image-Edit alcanza un rendimiento de vanguardia en la edición de imágenes, lo que lo posiciona como un modelo sólido para futuras aplicaciones en este ámbito.
Edición semántica y de apariencia de Qwen-Image-Edit para aplicaciones creativas y prácticas
El defiUn aspecto destacado de Qwen-Image-Edit es su funcionalidad avanzada en la edición semántica y de apariencia. La edición semántica implica alterar el contenido de una imagen, garantizando al mismo tiempo que el significado visual subyacente se mantenga intacto. Para ilustrar esta función de forma sencilla, el equipo de desarrollo destaca su uso con Qwen La mascota oficial de Brasil, el carpincho, como ejemplo práctico.
La observación muestra que, si bien la mayoría de los píxeles de la imagen modificada difieren de los de la imagen de entrada original (izquierda), la consistencia general del personaje del capibara se mantiene intacta. Esto demuestra la sólida capacidad de edición semántica de Qwen-Image-Edit, que facilita el desarrollo flexible y variado de contenido original de propiedad intelectual. Además, en Qwen Chat, se creó un conjunto específico de indicaciones de edición para los 16 tipos de personalidad MBTI. Con estas indicaciones, se creó con éxito una colección completa de paquetes de emojis con temática MBTI que incluyen a la mascota del capibara, ampliando eficazmente tanto la representación como la visibilidad del personaje.
Además, la síntesis de vistas innovadoras representa otro caso de uso importante dentro de la edición semántica. Qwen-Image-Edit es capaz de rotar objetos 90 grados o ejecutar una rotación completa de 180 grados, lo que permite la visualización directa de la parte posterior de un objeto. Otro ejemplo de edición semántica reside en la transferencia de estilo, donde, por ejemplo, un retrato estándar puede reinterpretarse con múltiples estéticas artísticas, incluyendo estilos que recuerdan a Studio Ghibli.
Además de la edición semántica, la edición de apariencia constituye una función frecuentemente requerida en la modificación de imágenes. Este enfoque se centra en preservar regiones específicas de una imagen sin modificaciones, al tiempo que se introducen, eliminan o modifican elementos designados. Como se demuestra en un ejemplo donde un letrero se integra a la perfección en una escena, la edición de apariencia se presta a una amplia gama de aplicaciones, como ajustes de fondo para personas o modificaciones de ropa. defiUna de las principales capacidades de Qwen-Image-Edit es su precisión en la edición de texto, una característica derivada de la experiencia avanzada de Qwen-Image en tecnologías de representación de texto.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
Anuncio de deslistado de 7 pares de trading en spot el 22 de agosto de 2025
USDE de HodlerYield: ¡Holdea USDE y gana hasta un 9% de APR!
Nuevos pares de trading con margen en spot: ¡SANTOS/USDT!
En tendencia
MásPrecios de las criptos
Más








