OpenAI lancia Voice Engine: ecco l’app che clona la voce in pochi secondi

OpenAI ha svelato la rivoluzionaria capacità di creare voci sintetiche altamente realistiche allenandosi su soli 15 secondi di registrazione audio

L’azienda che ha creato chat gpt ha annunciato il suo nuovo tool e, oltre a elencarne i diversi metodi di utilizzo, utili in molte situazioni, come in alcune patologie mediche, ha messo subito in guardia anche sui numerosi pericoli, potenzialmente davvero paurosi, di un uso non consono e fraudolento.

Un sistema per clonare la voce – Cityrumors.it –

 

La “voce sintetica” già esiste da tempo, ma la creazione di Open AI fa un salto in avanti davvero preoccupante. Fino ad oggi, la voce creata artificialmente era molto facilmente riconoscibile, anche da un orecchio poco attento, adesso con questo tool si può imitare alla perfezione qualsiasi voce dopo averla ascoltata per soli 15 secondi. Infatti, dagli spezzoni condivisi da Open AI si capisce quanto sia facile clonare la voce in maniera da renderla indistinguibile dall’originale, con un’espressività del tutto naturale. Per esempio, in una traduzione è possibile mantenere l’accento originale della traccia audio: se la traccia originale è di un utente francese, anche la traccia “sintetica” tradotta manterrebbe l’intonazione tipica del parlato francese.

La stessa OpenAI ha parlato dei possibili rischi legati a un uso improprio di Voice Engine: “Siamo consapevoli che generare discorsi che assomiglino alla voce delle persone comporta seri rischi, particolarmente importanti in un anno di elezioni, come ad esempio per le presidenziali USA del 2024. Stiamo collaborando con partner statunitensi e internazionali provenienti da diversi settori: governo, media, spettacolo, istruzione, società civile e altri ancora, per assicurarci di incorporare il loro feedback durante lo sviluppo del tool”.

Il nuovo tool di OpenAI – Cityrumors.it –

 

Proseguono i test

L’intenzione è di non farla diffondere su larga scala, infatti Open AI sta cercando di eseguire test circoscritti con partner fidati a partire dalla fine dello scorso anno. I partner devono accettare specifiche politiche di utilizzo, come il monitoraggio dell’uso del tool e l’implementazione di una filigrana in ogni campione vocale che tracci qualsiasi riproduzione vocale generata tramite il modello. I vantaggi che ne possono derivare sono molti, a partire dall’assistenza alla lettura attraverso voci dal suono naturale, oppure permettere traduzioni di contenuti preservando gli accenti nativi, o anche assistere i pazienti nel recuperare la propria voce dopo malattie o incidenti.

Allo stesso tempo però c’è l’elevata possibilità di un uso improprio di questo strumento, per esempio per truffe telefoniche o nel caso di autenticazione a conti bancari particolari che prevedono il riconoscimento vocale come metodo di autenticazione, ma ancora più spaventoso è pensare che si potrà creare un audio di una persona che sembra dire cose che in realtà non ha mai detto. Inoltre c’è grande timore che questa voce sintetica possa sostituirsi a quella degli esseri umani, in particolare in ambito lavorativo. Per queste ragioni, Open AI ha dettato alcune regole imprescindibili come la previsione del consenso esplicito e informato dell’oratore originale e la comunicazione chiara e trasparente  al pubblico che le voci che sente sono generate dall’intelligenza artificiale. Quindi è chiaro che l’eventuale rilascio su larga scala presenta rischi di una portata incredibile, infatti, per ora, OpenAI non ha definito quando e se Voice Engine verrà rilasciato al pubblico.

Impostazioni privacy