ChatGPT ya tiene el modo de voz avanzado: así funciona

ChatGPT ya tiene el modo de voz avanzado: así funciona

OpenAI ha comenzado a desplegar un nuevo modo de voz avanzado para ChatGPT entre un grupo selecto de suscriptores de ChatGPT Plus, tal y como ha comunicado la compañía en su cuenta de X (antes Twitter).

Este grupo de usuarios verá una notificación de invitación en la parte inferior de la pantalla para probar el Modo de Voz avanzado después de abrir la aplicación. Al tocarla, los usuarios serán llevados a una nueva página con el título “Estás invitado a probar el Modo de Voz avanzado” y un botón para activar la función.

Imagen - ChatGPT ya tiene el modo de voz avanzado: así funciona

Esta función, que se mostró por primera vez durante el evento de lanzamiento de GPT-4o en mayo, había sido criticada por su parecido con la voz de Scarlett Johansson y posteriormente se retrasó por razones de seguridad.

En dicho evento, el nuevo modo de voz demostró ser más avanzado que el modo de voz actual de ChatGPT. Durante la demostración, los empleados de OpenAI pudieron interrumpir y pedirle al chatbot que contara historias de diferentes maneras, y el chatbot ajustaba sus respuestas sin problemas ante las interrupciones.

Además, este nuevo modo realizará respuestas en tiempo real, tendrá una voz natural y la capacidad de detectar las emociones del usuario, según afirma la compañía.

Esto ahora no ocurre, ya que ChatGPT continúa su mensaje hasta el final y casi no te deja tiempo para pensar tu respuesta, ya que como digas algo y tardes más de 2 segundos en continuar tu frase, ya comienza a interpretar y no te deja continuar, lo cual puede resultar frustrante.

El lanzamiento del modo avanzado estaba previsto inicialmente para junio, pero OpenAI decidió retrasarlo un mes para “mejorar la capacidad del modelo para detectar y rechazar ciertos contenidos”, según comentó Taya Christianson, portavoz de OpenAI.

Esta misma fuente explicó que la compañía probó las capacidades del nuevo modelo de voz con más de 100 "red teamers", que son expertos que intentan atacar a propósito la tecnología de una empresa o servicio para detectar vulnerabilidades y avisar de ellas para que las reparen antes de un lanzamiento.

OpenAI también indicó que agregó nuevos filtros que reconocerán y bloquearán solicitudes para generar música u otro audio con derechos de autor, cosa que, al parecer, no estaba debidamente protegida.

La compañía planea lanzar el modo de voz avanzado en ChatGPT a todos los usuarios de ChatGPT Plus a finales de otoño. Sin embargo, no se sabe cuándo se lanzarán las funciones de video y compartir pantalla, que también se mostraron en el evento de mayo.

Esta novedad, junto con SearchGPT, prometen ser las puntas de lanza de OpenAI en el corto plazo, con Sora y mucho más por venir en el futuro.

Cómo subir un PDF a ChatGPT: usos y prompts para utilizar

  • Ver Comentarios