Sono giorni che parliamo di quanto Siri sia inadeguata rispetto agli incredibili passi avanti fatti dagli assistenti virtuali come ChatGPT e Bing Chat. E ora almeno sappiamo il perché, e per voce di un ex ingegnere Apple: il codice di Siri è un “ammasso di codice goffo” difficile da gestire e impossibile da aggiornare. Praticamente, si fa prima a sfasciare tutto e rifarlo da capo.
Il Problema di Siri
L’indiscrezione è attendibile e proviene dalle fonti del New York Times. Lo spiega bene John Burkey, ex ingegnere Apple che ha lavorato su Siri e che nel 2014 era addirittura a capo del nel team. Il problema è che l’assistente vocale si basa su “codice goffo che richiede settimane per essere aggiornato con le funzionalità di base”.
Si tratta in altre parole di un “design macchinoso” che rende molto difficile per gli ingegneri correggere le feature esistenti o aggiungere nuove funzionalità. Un esempio? Il database di Siri consiste in un elenco infinito di frasi in oltre 20 lingue che lo rendono una “gigantesca palla al piede.” E se uno volesse aggiungere anche solo un nuovo comando al set di Siri, finirebbe banalmente “nel calderone.”
Risultato: anche solo la semplice aggiunta di nuove frasi al set di comandi di Siri impone la ricostruzione dell’interno database; operazione che potrebbe durare anche 6 settimane. E lasciamo perdere per le funzionalità più complicate: un nuovo strumento di ricerca potrebbe richiedere fino a un anno intero di revisione.
Ecco cosa intendevamo quando dicevamo che Siri è morta. Con le tecnologie emergenti è morto quel paradigma, quel modo di concepire l’Intelligenza Artificiale. Non c’è modo di trasformare Siri in un “assistente creativo” come ChatGPT. Si deve sfasciare tutto e rifarla da zero.
Apple Testa Altro
Le tecnologie di intelligenza artificiale di nuova generazione hanno evidenziato come Siri, Alexa e gli altri assistenti vocali abbiano dormito sugli allori e sprecato il loro vantaggio nella corsa all’AI. Ecco perché Apple sta valutando altre tecnologie, e soprattutto sta testando di continuo nuovi concetti di generazione linguistica in risposta all’ascesa di chatbot come ChatGPT.
ChatGPT4, l’ultima versione dell’AI OpenAI, è in grado di analizzare una foto in un’istante e capire cosa accade, quali sono i soggetti, quali sono le relazioni tra loro -fisiche, organiche, affettive, etc.- e rispondere a domande su quel che vede, creare storie o poesie, trasformare uno schizzo in un gioco o in un sito Web. Può perfino trasformare un uomo in un robot, o un intero video in una storia di robot in un modo futuristico e distopico, partendo da un video e un’immagine.
È qualcosa di affascinante e spaventoso. Ma è il presente dell’industria High Tech, e le opzioni sono due: cavalchi l’onda, o vieni spazzato via. Tertium non datur.