Autore: Dott.ssa Paola Bonalume
La voce, uno degli elementi più intimi dell’identità, rappresenta al tempo stesso un tratto distintivo immediatamente riconoscibile e un vero e proprio capitale economico. Al contempo, si tratta anche di una risorsa particolarmente esposta, poiché viene costantemente registrata, digitalizzata e diffusa attraverso contenuti online e piattaforme di streaming, risultando così sempre più facilmente replicabile grazie ai recenti sviluppi dei sistemi di intelligenza artificiale.
L’evoluzione sempre più rapida dell’intelligenza artificiale e delle tecnologie di voice cloning consente oggi di generare facilmente voci estremamente realistiche a partire da pochi secondi di registrazione, riproducendone timbro, ritmo e inflessioni. Ciò ha favorito la diffusione delle AI covers su piattaforme come YouTube e TikTok, nelle quali voci sintetiche di artisti noti, doppiatori, speaker, podcaster e creator digitali reinterpretano brani, discorsi, interventi pubblici o contenuti vocali mai realizzati, oppure vengono impiegate in contenuti promozionali non autorizzati.
Il fenomeno, che ha coinvolto numerosi artisti, anche deceduti, ha generato notevoli incertezze e prodotto impatti significativi nei settori della musica, dei social media, del doppiaggio e della disinformazione, sollevando questioni giuridiche ed etiche legate a un utilizzo creativo ma spesso non consensuale della tecnologia.
In questo contesto, si sta gradualmente affermando una possibile forma di tutela dell’identità personale attraverso il marchio sonoro, tradizionalmente associato a jingle pubblicitari o brevi elementi musicali e impiegato soprattutto in ambito promozionale come strumento di riconoscibilità commerciale, consentendo l’immediata associazione, mediante un suono, tra un’impresa e un determinato prodotto o servizio
Nel sistema giuridico italiano, la tutela dell’identità personale si ricava da un insieme eterogeneo di norme che comprendono il diritto all’immagine nella sua estensione sonora, disciplinato dall’articolo 10 del codice civile e dagli articoli 96 e seguenti della legge sul diritto d’autore; i diritti connessi degli artisti interpreti ed esecutori, previsti dagli articoli 80 e seguenti della medesima legge; la tutela della personalità ai sensi dell’articolo 2 della Costituzione; nonché la clausola generale di responsabilità civile di cui all’articolo 2043 del codice civile.
Inoltre, l’introduzione della legge 23 settembre 2025, n. 132 sull’intelligenza artificiale ha inciso in modo significativo su questo quadro, intervenendo sul diritto d’autore, sul text and data mining e sui profili penali. In particolare, il nuovo articolo 70-septies della legge sul diritto d’autore consente ai titolari dei diritti di riservare espressamente le proprie opere dall’utilizzo per l’addestramento dei sistemi di intelligenza artificiale, rafforzando così la possibilità di controllo sugli usi algoritmici dei contenuti.
Sul piano giurisprudenziale, la Cassazione (ord. n. 12956/2025, caso Sony–eredi Battisti) ha stabilito che la titolarità dei master fonografici non comporta automaticamente quella dei diritti sull’opera, escludendo inoltre che il possesso delle registrazioni autorizzi l’uso della voce per l’addestramento dell’IA. La CGUE (sentenza 4 dicembre 2025, cause riunite Mio e Konektra) ha invece ribadito una nozione ampia di originalità, estendendo la tutela autoriale anche a creazioni con limitato valore artistico.
Sebbene il marchio sonoro sia pienamente riconosciuto sia nell’ordinamento italiano sia in quello europeo, la sua funzione resta formalmente circoscritta alla dimensione distintiva del mercato e non si estende alla tutela complessiva dell’identità personale. Esso tutela, infatti, il suono registrato nella misura in cui sia idoneo a distinguere determinati prodotti o servizi da quelli di altre imprese, svolgendo quindi una funzione identificativa e commerciale, senza però ricomprendere l’intero patrimonio vocale dell’individuo.
Ciononostante, tenuto conto dello sviluppo di queste nuove tecnologie di intelligenza artificiale, si stanno progressivamente delineando risposte giuridiche e strategie di tutela volte a fronteggiare le preoccupazioni e i rischi che tali strumenti sollevano in molti artisti.
Negli Stati Uniti, infatti, iniziative di registrazione di marchi legati alla persona promosse da figure come Matthew McConaughey e Taylor Swift evidenziano strategie difensive contro l’uso non autorizzato dell’identità mediante sistemi di intelligenza artificiale. Tali segni includono elementi vocali, visivi e comportamentali riconducibili alla persona, proprio con l’obiettivo di costruire una barriera giuridica contro impieghi indebiti, in particolare tramite sistemi di intelligenza artificiale.
In Europa, analoghe dinamiche sono recentemente sorte a seguito dei depositi di marchi sonori presso l’EUIPO da parte artisti come Giusy Ferreri e Luca Ward, consistenti in brevi espressioni vocali riconducibili al rispettivo timbro. Tali depositi non tutelano però singole e specifiche interpretazioni o prestazioni artistiche, già protette dal diritto d’autore, ma la riconoscibilità della voce in sé, come forma di protezione preventiva contro possibili impieghi dell’intelligenza artificiale.
Il marchio sonoro sta quindi assumendo, nello scenario dell’intelligenza artificiale, uno strumento di tutela ulteriore rispetto agli strumenti tradizionali. In quanto segno registrato, esso costituisce un bene immateriale suscettibile di valorizzazione economica attraverso licenze e contratti, mentre la sua pubblicazione nel registro produce un effetto deterrente, rendendo immediatamente individuabili il titolare e l’estensione della protezione. Sul piano giuridico, consente inoltre di attivare le azioni tipiche del diritto dei marchi, garantendo una tutela più diretta rispetto ai soli diritti della personalità. Esso permette altresì di rafforzare il controllo sugli utilizzi della voce nei processi di addestramento dei modelli di IA, anche alla luce della disciplina europea sul text and data mining di cui alla Direttiva (UE) 2019/790, che ne consente l’impiego salvo opposizione espressa del titolare.
Tuttavia, il marchio sonoro non rappresenta uno strumento autosufficiente, ma deve essere inquadrato in una strategia multilivello che comprende la riserva dei contenuti online, l’inserimento di clausole contrattuali specifiche e il ricorso ai diritti della personalità nonché alla normativa in materia di protezione dei dati personali.
Infatti, i diritti della personalità tutelano tradizionalmente voce e immagine secondo un modello prevalentemente ex post, che richiede la prova della violazione, dell’identificabilità e del danno. L’intelligenza artificiale generativa, e in particolare il voice cloning, mette in crisi questo impianto, poiché non si limita a riprodurre contenuti esistenti ma genera voci “simili”, rendendo incerto il confine tra imitazione lecita e appropriazione dell’identità. A ciò si aggiunge la difficoltà di individuare le responsabilità, data la pluralità dei soggetti coinvolti nei processi generativi, tra sviluppatori, piattaforme e utenti. Anche il diritto d’autore presenta limiti strutturali, poiché tutela opere e registrazioni, mentre i sistemi di voice cloning possono produrre contenuti originali senza riproduzione diretta, ma con elevata riconducibilità a un determinato artista.
Inoltre, il marchio sonoro incontra i propri limiti specifici poiché esso tutela esclusivamente la sequenza registrata ma non l’identità vocale nel suo complesso, opera entro il principio di specialità ed è prevalentemente orientato agli usi commerciali. Peraltro, i sistemi di intelligenza artificiale possono imitare le caratteristiche vocali senza riprodurre il segno registrato, eludendo così la fattispecie della contraffazione.
Per queste ragioni, nessuno degli strumenti tradizionali risulta sufficiente isolatamente e la tutela della voce nell’era dell’intelligenza artificiale richiede un approccio multilivello, fondato sull’integrazione tra diritto dei marchi, diritti della personalità, disciplina della privacy e regolazione dell’IA.
L’arrivo del voice cloning basato sull’intelligenza artificiale ha inoltre aperto una significativa breccia nel sistema contrattuale, rendendo necessario rivedere i contratti discografici, gli accordi di edizione e le licenze di sincronizzazione. Infatti, molti contratti anteriori al 2023 non disciplinano l’uso dell’intelligenza artificiale, creando quindi un vuoto regolatorio nel quale clausole molto ampie (“per qualsiasi mezzo tecnico, anche non ancora conosciuto”) potrebbero essere interpretate fino a ricomprendere anche la clonazione vocale.
Invece, nei contratti più recenti si registra l’introduzione di discipline specifiche, come il divieto di utilizzare le registrazioni per l’addestramento di sistemi di IA senza consenso e senza un compenso separato, oppure di replicare digitalmente voce e timbro. Sempre più diffuse sono anche clausole di aggiornamento periodico e di monitoraggio dell’utilizzo dei master.
L’elemento centrale resta il consenso, che deve essere esplicito, informato e tracciabile, poiché la voce è sempre più considerata parte dell’identità dell’artista e per tale motivo le nuove licenze mirano a definire con crescente precisione modalità e limiti di utilizzo, prevedendo anche tutele contro impieghi impropri, ingannevoli o diffamatori.
In un contesto in cui l’intelligenza artificiale è in grado di separare l’identità dal corpo che la produce, la voce non è più soltanto un mezzo espressivo, ma si colloca in una zona di confine tra diritto industriale, diritti della personalità e nuove tecnologie.
Il diritto si trova quindi oggi dinanzi a un punto di svolta, nel quale si profila la progressiva affermazione del marchio sonoro come ulteriore forma di tutela dell’identità digitale.
Tra marchio sonoro, diritto d’autore e diritti della personalità, la voce si situa così in uno spazio intermedio ancora non pienamente definito, in cui si gioca la futura evoluzione del diritto dell’identità, chiamato a stabilire se sarà ancora possibile distinguere in modo netto ciò che appartiene al soggetto titolare dell’identità vocale da ciò che appartiene alla tecnologia che lo replica.
