Estados Unidos.- Poco después de haber dado a conocer su nueva herramienta de interacción por voz en ChatGPT, la compañía OpenAI ha revelado nuevos detalles sobre su modelo GPT-4o, el cual permitirá tener conversaciones en tiempo real e incluso otorgará a la aplicación la capacidad de leer expresiones faciales.
Con estos cambios, la aplicación impulsada por inteligencia artificial se convertirá en una herramienta mucho más completa y versátil, pues ampliará considerablemente su capacidad de respuesta e interacción.
Te puede interesar: OpenAI incorpora nueva herramienta de interacción por voz en su ChatGPT
Y es que, según datos de ChatGPT, su tiempo de respuesta será muchísimo más cercano al de los humanos – con 320 milisegundos – contestando con naturalidad e incluso leyendo las expresiones de un rostro humano, acto confirmado durante el evento de presentación el pasado martes 14 de mayo.
Esta capacidad multimodal otorgará a ChatGPT la posibilidad de realizar tareas como:
–Describir imágenes y vídeos: puede generar descripciones detalladas de contenido visual, lo que lo hace ideal para aplicaciones como la accesibilidad o la generación de subtítulos.
–Crear historias a partir de imágenes: puede usar imágenes como punto de partida para crear historias o poemas, lo que abre nuevas posibilidades para la creatividad artificial.
–Responder preguntas sobre vídeos: puede ver y comprender vídeos para responder preguntas sobre su contenido, lo que lo convierte en una herramienta útil para la investigación y la educación.
Sigue más noticias como esta en nuestra sección de Tecnología
Por último, cabe destacar que el GPT-4o estará disponible de forma gratuita para cualquier persona, es decir que cualquier desarrollador o empresa podrá acceder a esta tecnología de vanguardia e integrar en sus propios productos y servicios.