Resumen Breve
El video destaca dos avances significativos en inteligencia artificial provenientes de China: DeepSeek V3.1, un modelo de código abierto que rivaliza con los modelos privados más potentes y costosos, y Qwen-Image Edit de Alibaba, una IA que permite la edición de fotos a nivel profesional mediante simples instrucciones de texto. DeepSeek V3.1 sobresale por su rendimiento y costo accesible, mientras que Qwen-Image Edit revoluciona la edición de imágenes con su capacidad para realizar modificaciones semánticas y de apariencia con alta precisión.
- DeepSeek V3.1: Modelo de código abierto que compite con los modelos privados en rendimiento y es más económico.
- Qwen-Image Edit: IA de Alibaba que edita fotos profesionalmente con instrucciones de texto.
Introducción [0:00]
La inteligencia artificial está avanzando rápidamente, y esta semana, China está liderando la disrupción. DeepSeek está desafiando a gigantes como OpenAI con un modelo de código abierto que es tan potente como los modelos privados, pero mucho más barato. Además, Alibaba está desafiando a Photoshop con Qwen-Image Edit, una IA que edita fotos a nivel profesional simplemente pidiendo los cambios por texto.
DeepSeek V3.1 [0:26]
La carrera por la IA ha estado dominada por OpenAI, Google y Anthropic, con sus modelos cerrados y costosos. Sin embargo, la startup china DeepSeek ha cambiado el juego al subir discretamente su nuevo modelo, DeepSeek V3.1, a la plataforma Hugging Face. Este sistema de código abierto no solo compite, sino que supera a los sistemas propietarios más avanzados en algunas de las tareas más exigentes. Este modelo gigante tiene 685 mil millones de parámetros y una ventana de contexto de 128,000 tokens, lo que equivale a procesar un libro de 400 páginas de una sola vez. En la prueba de programación Aider, DeepSeek V3.1 alcanzó una puntuación de 71.6%, superando a Claude 4 Opus y siendo mucho más barato. Su costo es de $0.56 por millón de tokens de entrada y $1.68 por millón de tokens de salida, lo que lo hace significativamente más económico que GPT-4. La clave de su éxito parece ser su arquitectura híbrida, que integra capacidades de chat, razonamiento y programación sin degradar el rendimiento. La comunidad ha descubierto tokens especiales ocultos en su arquitectura, uno para búsquedas en la web en tiempo real y otro para activar procesos de pensamiento interno. DeepSeek V3.1 desafía el modelo de negocio de la industria al ofrecer un archivo de 700 GB para que cualquiera lo descargue, modifique y use en su propia infraestructura. Se espera que los proveedores en la nube ofrezcan versiones alojadas del modelo, facilitando su acceso a todo el mundo. La comunidad global ha reaccionado de inmediato, y DeepSeek V3.1 ha escalado rápidamente en la lista de tendencias de Hugging Face. Este lanzamiento demuestra que la capacidad de crear inteligencia artificial de vanguardia ya no es exclusiva de unos pocos gigantes tecnológicos en Estados Unidos. La carrera global por la IA se centra ahora en quién hace que la IA sea más accesible.
Qwen-Image Edit [4:49]
Adobe Photoshop ha dominado la edición de imágenes profesional durante décadas, pero un nuevo modelo de inteligencia artificial de código abierto llamado Qwen-Image Edit está cambiando el panorama. Desarrollado por el equipo Qwen de Alibaba, este modelo permite editar imágenes simplemente describiendo con palabras lo que se quiere modificar. Qwen-Image Edit está construido sobre un modelo base de 20 mil millones de parámetros y se ha publicado bajo una licencia de código abierto Apache 2.0, lo que significa que es gratuito incluso para uso comercial. Sus capacidades se dividen en dos categorías principales: edición semántica y edición de apariencia. La edición semántica permite modificar la idea o el concepto de la imagen, manteniendo la coherencia, como generar emojis con diferentes personalidades a partir de una mascota. La síntesis de nuevas vistas genera perspectivas completamente nuevas de un objeto, como reconstruir la vista frontal de una persona a partir de una foto de perfil. También puede cambiar el estilo de una imagen, transformándola al estilo de Studio Ghibli o de dibujos animados. La edición de apariencia permite hacer cambios muy precisos mientras el resto de la imagen permanece igual, como añadir un cartel con una sombra coherente o eliminar un pelo de un plato. Qwen-Image Edit destaca por su capacidad para editar texto dentro de una imagen, corrigiendo errores tipográficos, reescribiendo frases e incluso reemplazando texto en inglés por caracteres chinos de forma fotorrealista. Este lanzamiento hace que la edición de imagen de nivel profesional sea mucho más accesible, demostrando cómo la inteligencia artificial está transformando las industrias creativas.