La inteligencia artificial sigue sorprendiendo. OpenAI ha lanzado una función revolucionaria en ChatGPT que combina generación de texto e imagen en una sola herramienta, marcando lo que muchos ya describen como el “nuevo Photoshop con inteligencia artificial”. 🎨 Esta versión multimodal del modelo GPT-4, llamada GPT-4V (Vision), no solo interpreta imágenes y texto en simultáneo, sino que permite editarlas, integrarlas y modificarlas con resultados impactantes.
¿Qué puede hacer ChatGPT ahora?
Gracias a esta actualización, los usuarios pueden:
✅ Subir imágenes y editarlas directamente con instrucciones escritas, como reemplazar objetos o cambiar fondos.
✅ Generar imágenes desde cero con indicaciones específicas (por ejemplo, «un frutero con planetas en su interior y estilo realista»).
✅ Modificar detalles precisos dentro de imágenes que no fueron creadas por el modelo, como añadir un frutero en una foto real o cambiar la textura de una pared.
✅ Crear contenido coherente en secuencia, como transformar un gato en detective y luego en personaje de videojuego, con imágenes consistentes.
✅ Diseñar infografías, tiras cómicas, renders o imágenes desde un boceto, todo sin necesidad de conocimientos en diseño.
Además, este modelo entiende el contexto completo de las instrucciones y mantiene una coherencia visual notable entre ediciones sucesivas.
¿Supera a Google?
Según los primeros análisis, sí. El video demuestra cómo ChatGPT supera lo mostrado por Google hace una semana con su herramienta AI Studio. La ventaja de GPT-4V está en la precisión del contexto, fidelidad de resultados y naturalidad en la interacción, permitiendo modificaciones complejas como:
- Añadir reflejos de personas en superficies.
- Integrar texto específico en camisetas o carteles.
- Reinterpretar escenas desde distintos ángulos de cámara.
Y todo, simplemente, con una conversación escrita.
Limitaciones actuales
Aunque impresionante, el sistema no es perfecto. Algunos de los puntos débiles detectados son:
🔴 Problemas al generar texto en idiomas distintos del inglés (como errores ortográficos en español).
🔴 Imágenes con proporciones mal renderizadas o distorsionadas.
🔴 Dificultades para representar escenas muy cargadas o con muchos elementos detallados.
🔴 Limitaciones al manipular imágenes externas complejas.
A pesar de esto, los resultados siguen siendo sorprendentes, y la velocidad con la que se pueden probar ideas visuales es insuperable.
Seguridad y uso responsable
OpenAI anunció que todas las imágenes generadas por GPT-4V incluirán marcas digitales de identificación, con el fin de evitar usos maliciosos como fake news. Además, se han implementado guardarraíles éticos para prevenir contenido sensible o engañoso.
Un paso más hacia la democratización de la creación visual
Esta nueva función no requiere software especializado, solo acceso a ChatGPT Plus. 🧠 Cualquier usuario podrá editar, diseñar y experimentar con imágenes usando lenguaje natural. Ya sea para diseñadores, creadores de contenido o curiosos, el nuevo ChatGPT es una potente herramienta creativa al alcance de todos.