Aunque muchos ya estaban impresionados con ChatGPT, la nueva versión, ChatGPT Vision, ha llevado la inteligencia artificial a otro nivel. A pesar de que no puede «ver» en el sentido tradicional, esta herramienta puede procesar y analizar imágenes, acercando sus habilidades a las del cerebro humano.
OpenAI y su nueva propuesta
ChatGPT Vision es la última implementación de OpenAI que añade capacidades multimodales al chatbot generativo AI. Los suscriptores de ChatGPT Plus ahora pueden cargar una imagen en la aplicación ChatGPT en iOS o Android, y el chatbot reconocerá y comprenderá la imagen proporcionada.
Con la llegada de GPT-4 en marzo de 2023, la multimodalidad fue uno de los principales atractivos. Sin embargo, OpenAI retrasó el lanzamiento de GPT-4V (GPT-4 con visión) debido a problemas de seguridad y privacidad relacionados con sus capacidades de reconocimiento facial.
Limitaciones y seguridad
A pesar de sus impresionantes capacidades, hay cosas que ChatGPT Vision no puede (o no debería) hacer. Con el modelo anterior, los usuarios podrían haber cargado fotos de personas y pedirle que las identificara, lo que claramente es una violación de la privacidad. Según un documento técnico de OpenAI, GPT-4V ahora rechaza esta solicitud el 98% de las veces.
OpenAI ha trabajado arduamente para evitar que el modelo haga suposiciones basadas en atributos físicos o discrimine por raza o género. La empresa se refiere a estos tipos de indicaciones como «inferencias sin fundamento». La versión actual rechaza responder a tales indicaciones en un 100%.
Capacidades de ChatGPT Vision
A pesar de las preocupaciones, los usuarios han estado experimentando con ChatGPT Vision de formas sorprendentes:
- Decifrar una columna de reglas de estacionamiento confusas.
- Leer y traducir imágenes de manuscritos escritos a mano.
- Construir un sitio web completo a partir de un diagrama dibujado a mano.
- Criticar pinturas para ayudar a los artistas a mejorar.
- Descubrir un potencial nuevo uso en la presentación de informes de seguros de automóviles.
- Intentar resolver un CAPTCHA.
- ¡Y hasta encontrar a Waldo!
Conclusión
ChatGPT Vision ha demostrado ser una herramienta poderosa y versátil. A medida que la tecnología continúa avanzando, es esencial que las empresas y los usuarios sean conscientes de las implicaciones éticas y de privacidad.
¡Comparte esta noticia en tus redes sociales y sigue leyendo más sobre las últimas tendencias en MarketingHoy!