La nueva IA de Microsoft simula la voz de cualquier persona con tan solo 3 segundos de audio

Microsoft acaba de presentar su nueva herramienta basada en IA para transformar texto en voz, siendo capaz de calcar a la perfección la voz humana con tan solo tres segundos de muestra.

Desde el lanzamiento del primer modelo de texto a voz (TTS), los investigadores han buscado formas de mejorar la forma en que estos sistemas generan el habla. El último modelo de Microsoft, VALL-E, supone un importante paso adelante en este aspecto.

Tan solo recordemos como hace unos días Microsoft ya anunció su idea de integrar ChatGPT dentro de sus principales soluciones como Bing, que se espera de cara a este primer trimestre de 2023. Además, todo apunta a que Microsoft también estaría desarrollando la forma para integrar ChatGPT con su paquete de programas para ofimática Office.

Sin embargo, un nuevo actor entra en el juego: la herramienta VALL-E. El jueves, investigadores de Microsoft anunciaron este nuevo modelo de IA de texto a voz que puede simular la voz de una persona cuando se le da una muestra de audio de tan solo tres segundos.

Una vez que aprende una voz específica, VALL-E puede sintetizar el audio de esa persona diciendo cualquier cosa y hacerlo de una manera que intenta conservar el tono de la persona que habla.

Samsung Electronics presenta un estilo de vida conectado y una nueva línea de electrodomésticos empotrados en EuroCucina 2024

¿Qué características debe tener un software de logística para enfrentar los desafíos del ecommerce en Chile?

¡La Bichota mueve a Chile! Su impacto en el turismo de la Región Metropolitana

Caffé Nocciola: La nueva apuesta de Nespresso Professional

NH Antofagasta obtuvo el nivel más alto en certificación de Sello de Sustentabilidad otorgado por Sernatur

Rapidez, seguridad y eficacia: ¿por qué la automatización está impactando en los operadores logísticos?

Riot Games presenta las notas de actualización para la versión 5.1 de Wild Rift

Las cinco fallas en ciberseguridad de emprendedores que amenazan el éxito y continuidad del negocio

La nueva IA de Microsoft simula la voz de cualquier persona con tan solo 3 segundos de audio

Continuar leyendo

Samsung Electronics presenta un estilo de vida conectado y una nueva línea de electrodomésticos empotrados en EuroCucina 2024

¿Qué características debe tener un software de logística para enfrentar los desafíos del ecommerce en Chile?

¡La Bichota mueve a Chile! Su impacto en el turismo de la Región Metropolitana

Caffé Nocciola: La nueva apuesta de Nespresso Professional

NH Antofagasta obtuvo el nivel más alto en certificación de Sello de Sustentabilidad otorgado por Sernatur

Rapidez, seguridad y eficacia: ¿por qué la automatización está impactando en los operadores logísticos?

Recomendados

Samsung Electronics presenta un estilo de vida conectado y una nueva línea de electrodomésticos empotrados en EuroCucina 2024

¿Qué características debe tener un software de logística para enfrentar los desafíos del ecommerce en Chile?

¡La Bichota mueve a Chile! Su impacto en el turismo de la Región Metropolitana

Caffé Nocciola: La nueva apuesta de Nespresso Professional

Recientes

Samsung Electronics presenta un estilo de vida conectado y una nueva línea de electrodomésticos empotrados en EuroCucina 2024

¿Qué características debe tener un software de logística para enfrentar los desafíos del ecommerce en Chile?

Destacados

Paso a paso: Cómo usar la Inteligencia Artificial de Galaxy AI en el equipo Samsung que ya tienes

¿Qué es el timelapse? vivo Smartphone te entrega consejos útiles para realizar un buen video en “cámara rápida”

Sitio Vecino

Recomendados

Samsung Electronics presenta un estilo de vida conectado y una nueva línea de electrodomésticos empotrados en EuroCucina 2024

¿Qué características debe tener un software de logística para enfrentar los desafíos del ecommerce en Chile?

¡La Bichota mueve a Chile! Su impacto en el turismo de la Región Metropolitana

Caffé Nocciola: La nueva apuesta de Nespresso Professional