Google presenta traducción de llamadas con tu propia voz: el show de Pixel 10 con Jimmy Fallon
Google eligió un formato poco habitual para anunciar la décima generación de sus teléfonos: convirtió su keynote en un programa matutino de TV. Jimmy Fallon condujo la presentación como si fuera un “morning show” y, entre entrevistas, gags y música, Google mostró la función que marcó la diferencia: traducción de llamadas en tiempo real que imita la voz de cada persona. Además, confirmó la llegada oficial de Pixel 10 a México, algo relevante para el mercado hispanohablante. El evento se celebró en Nueva York y mezcló anuncios de hardware con demostraciones de IA diseñadas para consumo masivo.
La estrategia de Google
En lugar de una conferencia técnica con diapositivas, Google apostó por un formato de “programa matutino” para hacer digerible un paquete grande de anuncios: nuevos Pixel 10, Pixel Watch 4 y Pixel Buds, todo cruzado por funciones de IA. El objetivo: acercar mensajes complejos a una audiencia amplia, usando los códigos de la televisión (entrevista en el sillón, mesa con productos, segmento de “demostraciones” y cierre musical). Jimmy Fallon llevó el hilo con humor y guiños tecnológicos, mientras ejecutivos de Google iban entrando para explicar piezas concretas. Incluso hubo video musical grabado con Pixel para rematar el tono de espectáculo. En resumen: un show “de tv” para empaquetar tecnología de alto impacto.
Lo más importante del evento: llamadas con traducción simultánea… en tu propia voz
La demostración que se llevó la conversación fue “Voice Translate” en la app Teléfono de Pixel 10. En vivo, Jimmy Fallon realizó una llamada con la creadora Karen Polinesia: él habló en inglés; ella, en español. El sistema tradujo en tiempo real y reprodujo la traducción con la misma voz de cada interlocutor, conservando timbre y ritmo, pero en el idioma del otro. Fallon reaccionó sorprendido —y el público también— porque no era la clásica voz sintética: sonaba a “ti”, solo que en otra lengua.
Técnicamente, esta función se ejecuta en el dispositivo gracias al chip Tensor G5 y a modelos locales (Gemini Nano), lo que reduce la latencia y evita depender de la nube. La persona al otro lado escucha la traducción con una voz que se parece a la tuya, y tú oyes una voz que se parece a la de la otra persona, ya traducida. Durante unos instantes se escucha la voz original antes de que entre la versión traducida; además, aparece una transcripción en pantalla.
Lo segundo más importante: un vistazo breve al Pixel 10
Más allá del truco de IA, Google presentó la familia Pixel 10 (Tensor G5, Android 16, 7 años de actualizaciones), con tres modelos y enfoque fuerte en cámara y funciones como Magic Cue (asistente contextual en llamadas y apps). Por primera vez, la venta oficial llega a México, con preventa desde el 20 de agosto y disponibilidad a partir del 28 de agosto. Hubo también cierre con un video musical grabado en Pixel, reforzando la narrativa audiovisual del evento.
Cómo funciona la traducción de llamadas y si llegará a otros smartphones
Activación y uso. La función vive dentro de la app Teléfono de Pixel 10. En una llamada, se abre Call Assist → Voice Translate, se eligen los idiomas (tu idioma y el del interlocutor) y el sistema anuncia brevemente que la conversación será traducida para ambos. Desde ese momento, cada parte escucha la voz “familiar” del otro, pero traducida al idioma seleccionado. Se puede dejar activado para llamadas futuras o desactivarlo en cualquier momento.
Privacidad y procesamiento. La traducción corre en el teléfono, con Gemini Nano sobre Tensor G5. Google documenta que no se almacenan audios ni transcripciones y que la conversación no se envía a servidores; también indica que puede funcionar sin conexión tras descargar los modelos necesarios. Ese diseño explica por qué el retardo es bajo y por qué la voz clonada suena consistente entre frases.
Idiomas compatibles en el lanzamiento. Voice Translate traduce de inglés hacia: francés, alemán, hindi, indonesio, italiano, japonés, portugués, ruso, español y sueco; y hacia inglés desde esos mismos idiomas. Es decir, por ahora el inglés es el puente. Esto cubre un abanico amplio de escenarios de viaje y negocios, pero aún no es “todos con todos”.
¿Necesita que ambos tengan Pixel 10? No. La clave es que la traducción y la síntesis de voz ocurren en tu Pixel; la persona al otro lado solo recibe el audio ya traducido, con una voz similar a la tuya. En la práctica, el sistema no exige que el interlocutor tenga un Pixel: escucha tu voz traducida desde su propio teléfono, como cualquier llamada normal.
¿Llegará a otros teléfonos? A corto plazo, no hay anuncio oficial fuera de Pixel 10 y posteriores (incluyendo Fold). El soporte de Google lo acota explícitamente a esa generación, lo que sugiere dependencia del hardware (Tensor G5) y de modelos de IA locales. ¿Podría Google abrirlo a más Android en el futuro? Es posible, pero hoy no hay una hoja de ruta pública.
Relación con otras novedades de IA. Voice Translate convive con otras funciones: Magic Cue (tarjetas contextuales en llamadas con datos de vuelos o reservas), Take a Message (toma recados con transcripción y recordatorios) y mejoras de cámara guiadas por IA. El hilo conductor del evento fue que la IA pasa de “demo” a utilidad cotidiana, y la traducción en tu propia voz es el ejemplo más claro.
Conclusión
El “Made by Google” de este año apostó por una puesta en escena televisiva para que más gente entendiera hacia dónde va el teléfono de Google en su décima generación. La respuesta no fue solo “más potencia” o “más cámara”, sino IA orientada a comunicación: traducir llamadas en tiempo real con voces naturales. En mercados bilingües o de alta movilidad —como México y gran parte de Latinoamérica— esta función tiene impacto inmediato porque reduce fricción sin obligar a cambiar de hábitos: es la misma llamada de siempre, con traducción embebida y privacidad por diseño.
En términos de producto, Pixel 10 llega con ciclo largo de actualizaciones y un paquete sólido de funciones contextuales (Magic Cue, Take a Message) que refuerzan el caso de uso del día a día. Pero lo que quedará del evento es la escena de Fallon hablando con Karen Polinesia y escuchándose a sí mismo en español: un momento pensado para televisión que, más allá del show, enseña una dirección clara para los smartphones de 2025 en adelante. Traducción útil, local y en tiempo real como pilar de la próxima ola móvil.


