Le nuove tecnologie generative come ChatGPT, AutoGPT e tutte le altre AI possono accelerare moltissimo il lavoro e, in alcuni casi, sostituiranno addirittura gli operatori umani. Ma non è tutto oro quel che luccica, e qualcuno ha già trovato il modo di sfruttarle per commettere reati e truffare la gente. Vi raccontiamo la prima truffa telefonica basata su Intelligenza Artificiale, e vi spieghiamo come difendervi.
Clonazione Voce con AI
La stessa tecnologia che ha riportato in vita la voce di Steve Jobs può essere usata per commettere illeciti e giocare coi sentimenti delle persone. Una donna statunitense ha ricevuto una telefonata da un numero sconosciuto; stava quasi per lasciarla alla segreteria telefonica, quando ha deciso di rispondere. È stato allora che ha sentito la figlia quindicenne disperata che chiedeva il suo aiuto:
“Mamma ho fatto un casino. Mi devi aiutare.”
Dopodiché la voce di un uomo sovrasta il pianto della ragazzina, e le dice “tieni la testa giù, sdraiati”. “Aspetta, che sta succedendo?” Urla la madre disperata, seriamente convinta di parlare con la figlia. “Ascolta, abbiamo tua figlia. Ecco cosa succede ora. Se chiami la polizia o lo dici a qualcuno, la imbottisco di droghe e la scarico da qualche parte in Messico.” E in lontananza, ancora la voce della ragazza che gridava “Aiutami mamma, aiutami, aiutami!”
“Non aveva assolutamente alcun dubbio che quella fosse sua figlia?” Chiede la giornalista. “Era al 100% la sua voce. Non ho mai messo in dubbio che potesse essere qualcun altro” spiega la donna. “Era chiaramente la sua voce. Era la sua inflessione, era il modo in cui avrebbe pianto, non ho dubitato neppure per un secondo che fosse lei.”
Eppure non era davvero un rapimento, e la ragazza in realtà era al sicuro nella località sciistica dove si trovava in vacanza con gli amici. E allora, come ci sono riusciti? Con le tecnologie di clonazione della voce rese possibili dall’Intelligenza Artificiale.
Clonazione Voce con AI
Come fa una AI a clonare fedelmente la voce di una persona a riprodurla con la sua inflessione, il suo accento e le sue specificità?
La clonazione della voce è una tecnologia che permette di creare una copia sintetica della voce di una persona, utilizzando algoritmi di intelligenza artificiale basati sull’apprendimento profondo (Deep Learning). Questa tecnologia può avere diverse applicazioni positive, come la narrazione di audiolibri, la creazione di personaggi per videogiochi, la realizzazione di campagne pubblicitarie o la riproduzione di voci famose o storiche. Ma anche scopi meno nobili, come abbiamo visto.
Per clonare fedelmente la voce di una persona, l’AI ha bisogno di due elementi: un modello vocale e dei dati audio. Il modello vocale è una rappresentazione matematica della voce che ne cattura le caratteristiche acustiche e linguistiche, come il timbro, l’intonazione, il ritmo e il vocabolario. I dati audio sono delle registrazioni della voce da clonare, che servono per addestrare il modello vocale e renderlo il più simile possibile all’originale.
L’AI utilizza dei metodi di apprendimento profondo, come le reti neurali, per analizzare i dati audio e creare il modello vocale. Le reti neurali sono dei sistemi informatici che imitano il funzionamento del cervello umano, apprendendo da grandi quantità di dati e riconoscendo dei pattern. L’AI può usare diverse tecniche di apprendimento profondo per clonare la voce, come la sintesi vocale (text-to-speech), che trasforma un testo scritto in un discorso parlato, o la conversione vocale (voice conversion), che trasforma una voce in un’altra.
Per clonare fedelmente la voce di una persona, l’AI ha bisogno di un numero sufficiente di dati audio, che dipende dalla qualità e dalla varietà delle registrazioni. In generale, più dati audio ci sono, migliore sarà il risultato. Tuttavia, ci sono dei servizi online che permettono di clonare la voce con pochi secondi di registrazione, sfruttando dei database di voci preesistenti e trovando delle similitudini tra le voci. In questo caso, l’AI può anche trasferire la prosodia, cioè le caratteristiche espressive della voce, da un parlante a un altro. Tradotto: io parlo con la mia voce, e la AI la converte nella voce di qualcun altro.
Dopo aver creato il modello vocale, l’AI può riprodurre la voce clonata e farle dire qualunque cosa. Può anche modificare la voce clonata in base al contesto o allo scopo, cambiando per esempio il tono, lo stile o l’emozione. L’AI può anche generare nuovi testi da far pronunciare alla voce clonata, utilizzando dei metodi di generazione del linguaggio naturale (natural language generation), che creano delle frasi coerenti e sensate a partire da parole chiave o da un tema.
La clonazione della voce è una tecnologia in rapida evoluzione, che offre delle opportunità creative e innovative per diversi settori e ambiti. Tuttavia, presenta anche dei rischi etici e legali, come la violazione della privacy, il furto d’identità o l’inganno. Per questo motivo, è importante usare questa tecnologia con responsabilità e rispetto per le persone coinvolte.
Come Difendersi?
La cosa più importante in questa fase è sapere che può accadere. Questo già può disinnescare una buona percentuale di tentativi di truffa. Dopodiché ecco qualche consiglio pratico:
- Rispondete solo ai numeri che conoscete. Se lo desiderate, potete impostare un blocco ai numeri sconosciuti e anonimi come spieghiamo in questa guida.
- Create una parola di sicurezza in famiglia, un termine pre-concordato che solo voi conoscete e che confermerà le vostre identità al telefono.
- Siate ottimisti sulle nuove tecnologie, ma siate anche vigili.
- Spargete la voce, condividendo questo post su Facebook, su Twitter e su tutti i canali social di cui disponete. La conoscenza è l’arma più potente che abbiamo per proteggere noi stessi e le persone che amiamo.