OpenAI ha hecho una importante actualización en su aplicación ChatGPT, incorporando reconocimiento de voz e imagen. Esto significa que los usuarios ahora podrán formular preguntas oralmente y el chatbot responderá con su propia voz sintetizada. Además, la nueva versión permite subir o tomar fotos, y la aplicación responderá con una descripción de la imagen y más contexto.
Estas nuevas capacidades demuestran que OpenAI ve a sus modelos de inteligencia artificial como productos en constante actualización. De hecho, ChatGPT se está posicionando como una aplicación de consumo competitiva de Siri y Alexa.
OpenAI busca hacer más atractiva la aplicación para competir con otras empresas de IA y también para recopilar más información de los usuarios y entrenar sus motores. Para lograr esto, la introducción de datos visuales y de audio en los modelos de aprendizaje automático contribuiría a la visión de OpenAI de crear una inteligencia más parecida a la humana.
Hasta ahora, los modelos de lenguaje de OpenAI se han creado utilizando grandes cantidades de texto, pero para avanzar en la inteligencia artificial se necesitaría información sonora y visual. Es por eso que se rumorea que el próximo modelo de IA de Google, llamado Gemini, será “multimodal” y permitirá entradas de video, imágenes y voz.
La nueva tecnología de generación por voz de ChatGPT también ofrece oportunidades de licencia para otras compañías. Por ejemplo, Spotify planea utilizarla para traducir podcasts a otros idiomas imitando la voz del podcaster original.
OpenAI sigue innovando y mejorando sus productos para ofrecer a los usuarios una experiencia más completa y realista. La introducción de reconocimiento de voz e imagen en ChatGPT es solo el comienzo de lo que está por venir en el campo de la inteligencia artificial.
More Stories
¿Cómo es el dominio web perfecto?
Nueva actualización de WhatsApp: llegan los filtros de chat
Análisis del motorola edge 50 pro: características, opinión y precio – América Deportiva