Google lanza el modelo “Gemini 3.5” para la traducción de voz instantánea
Washington, el 10 de junio (QNA) — Google anunció el lanzamiento del nuevo modelo “Gemini 3.5 Live Translate”, diseñado para la traducción instantánea de voz, con el objetivo de reducir las barreras lingüísticas y facilitar conversaciones más naturales y fluidas entre usuarios de distintos idiomas.
La compañía explicó que el modelo puede reconocer automáticamente más de 70 idiomas y ofrecer traducciones de voz que conservan el tono, el ritmo y el registro vocal del hablante. Además, se distingue por generar la traducción de forma continua durante el discurso, sin esperar a que el interlocutor termine la frase.
Google presentó las capacidades del modelo con ejemplos de doblaje de vídeos en tiempo real, así como de traducción de conferencias y presentaciones multilingües, manteniendo la fluidez de la conversación entre los participantes.
La compañía confirmó que “Gemini 3.5 Live Translate” llegará a Google Meet más adelante este año, donde los idiomas admitidos pasarán de cinco a más de 70, con más de 2000 combinaciones lingüísticas posibles dentro de una misma reunión. La función se probará primero en una vista previa privada para determinadas empresas suscritas a Google Workspace, antes de ampliarse a más usuarios.
Asimismo, Google comenzó a desplegar el modelo a escala mundial en la aplicación Google Translate para Android e iOS. La actualización incluye un nuevo “modo de escucha” en Android, que permite oír las traducciones en directo mediante auriculares o a través del altavoz del teléfono.
Google señaló también que todos los fragmentos de audio generados por el modelo incorporarán una marca de agua digital invisible mediante la tecnología “SynthID”, destinada a verificar el contenido creado con inteligencia artificial y limitar su uso indebido en la difusión de información engañosa.
English
Français
Deutsch
Español
русский
हिंदी
اردو