Che cos'è l'addestramento dei modelli AI e perché è importante?

Michael Chen | Content Strategist | 6 dicembre 2023

Nella cultura popolare, l'AI ha una brutta reputazione. I film la mostrano come il primo passo sulla strada verso un'apocalisse robotica, mentre i notiziari sono pieni di storie su come l'AI ci ruberanno il lavoro. La verità è che l'IA esiste già da un po' e che nessuno di questi peggior scenari è imminente.

Di base, l'AI utilizza i dati per fare previsioni. Questa capacità può alla base dei suggerimenti "ti potrebbe anche interessare" sui servizi di streaming, ma è anche alla base dei chatbot in grado di comprendere le query il linguaggio naturale e prevedere la risposta corretta e le applicazioni che analizzano una foto e utilizzano il riconoscimento facciale per suggerire le persone presenti. Per fornire queste previsioni, tuttavia, è necessario un addestramento efficace del modello di intelligenza artificiale, e le applicazioni più recenti che dipendono dall'AI potrebbero richiedere approcci leggermente diversi all'apprendimento.

Che cos'è l'addestramento dei modelli AI?

Fondamentalmente, un modello AI è sia un set di algoritmi selezionati che i dati utilizzati per addestrare tali algoritmi in modo che possano effettuare le previsioni più accurate. In alcuni casi, un modello semplice utilizza un solo algoritmo, quindi i due termini potrebbero sovrapporsi, ma il modello stesso è l'output post-addestramento.

Dal punto di vista matematico, un algoritmo può essere considerato un'equazione con coefficienti non definiti. Il modello entra in funzione quando gli algoritmi selezionati acquisiscono i set di dati per determinare quali valori di coefficiente si adattano meglio, creando così un modello per le previsioni. Il termine "addestramento del modello AI" si riferisce a questo processo: alimentare l'algoritmo con i dati, esaminare i risultati e modificare l'output del modello per aumentare la precisione e l'efficacia. Per farlo, gli algoritmi hanno bisogno di enormi quantità di dati in cui è considerata l'intera gamma di dati in entrata.

Valori anomali, sorprese, incongruenze, pattern che a prima vista non hanno senso... gli algoritmi devono gestire tutto questo e molto altro, ripetutamente, in tutti i data set in entrata. Questo processo è alla base dell'apprendimento: la capacità di riconoscere i pattern, comprendere il contesto e prendere decisioni appropriate. Con un modello di intelligenza artificiale sufficientemente addestrato, il set di algoritmi all'interno del modello fungerà da predittore matematico per una determinata situazione attraverso cui gestire l'inaspettato, massimizzando al contempo la prevedibilità.

Concetti chiave

  • L'addestramento del modello AI è il processo di inserimento di dati curati negli algoritmi selezionati volto ad aiutare il sistema a perfezionarsi e a produrre risposte accurate alle query.
  • Sono disponibili molti tipi diversi di algoritmi AI; per determinare quale sia quello più giusto per un progetto bisogna considerare ambito, budget, risorse e obiettivi.
  • Per un addestramento efficace del modello AI serve un elevato volume di dati di formazione curati e di qualità.
  • Formazione e test dei modelli AI sono processi iterativi basati su feedback e risultati.
  • Quando i modelli di intelligenza artificiale addestrati forniscono risultati coerenti con set di dati di formazione e test, il processo passa a test con dati reali prima che diventino operativi.

Definizione di addestramento dei modelli AI

L'addestramento del modello AI è un processo iterativo il cui successo dipende dalla qualità e dalla profondità dell'input, ma anche dalla capacità dei trainer di identificare e compensare le carenze. Sono i data scientist di solito a gestire il processo di formazione, sebbene anche gli utenti business possano essere coinvolti in alcuni ambienti low-code/no-code. Infatti, il ciclo di elaborazione, osservazione, fornitura di feedback e miglioramento è simile a quello in cui si insegna a un bambino una nuova abilità. Con l'addestramento del modello AI, l'obiettivo è quello di creare un modello matematico che crei con precisione un output bilanciando le molte variabili possibili, i valori anomali e le complicazioni nei dati. Se ci pensi, quello della genitorialità è un viaggio simile, ma molto più complesso.

Pensa al modo in cui i bambini imparano un'abilità. Ad esempio, supponiamo di voler insegnare a un bambino a identificare la differenza tra cani e gatti. Si comincia con immagini molto basilari e con incoraggiamenti. Poi vengono introdotte altre variabili, con dettagli come le dimensioni medie, latrati e miagolii, e modelli di comportamento. A seconda di ciò con cui il bambino potrebbe avere più difficoltà, puoi fare più attenzione su una certa area per facilitare l'apprendimento. Al termine di questo processo, il bambino dovrebbe essere in grado di identificare tutti i tipi di cani e gatti, dagli animali domestici comuni alle specie animali selvatiche.

L'addestramento di un modello di intelligenza artificiale è un processo simile.

  • AI: seleziona gli algoritmi e il set di dati di addestramento iniziale per il modello.

    Bambino: utilizza le foto basilari per stabilire le differenze generali tra un cane e un gatto.

  • AI: valuta l'accuratezza dell'output e ottimizza il modello per ridurre o eliminare determinate imprecisioni.

    Bambino: elogia o correggi a seconda delle risposte.

  • AI: fornisci set di dati aggiuntivi con vari input specifici per personalizzare e perfezionare il modello.

    Bambino: sottolinea tratti, forme e dimensioni diverse come parte del processo di apprendimento.

Come succede con i bambini, l'addestramento iniziale del modello di intelligenza artificiale può influenzare fortemente ciò che accade in futuro, e se saranno necessarie altre lezioni per disimparare le influenze negative. Ciò evidenzia l'importanza delle origini dati di qualità, sia per la formazione iniziale che per l'apprendimento iterativo continuo anche dopo il lancio del modello.

Il valore dei modelli AI nel business

La maggior parte delle organizzazioni sta già traendo vantaggio dall'integrazione dell'intelligenza artificiale nei propri flussi di lavoro e processi, grazie ad applicazioni che generano analytics, evidenziano valori anomali nei dati o utilizzano il riconoscimento del testo e l'elaborazione del linguaggio naturale. Pensa, ad esempio, alla trascrizione di documenti e ricevute cartacee in registri di dati. Tuttavia, molte organizzazioni stanno cercando di sviluppare modelli AI allo scopo di soddisfare bisogni specifici e urgenti. Lo stesso processo di sviluppo può vantaggi aggiuntivi, dal valore a breve termine, come i processi accelerati, al guadagno a lungo termine, come scoprire insight precedentemente nascosti o magari lanciare un nuovo prodotto o servizio.

Un motivo fondamentale per investire in un'infrastruttura in grado di supportare l'intelligenza artificiale deriva dal modo in cui le aziende crescono. Per farla semplice, i dati sono ovunque. Con così tanti dati provenienti da tutte le direzioni, è possibile generare nuovi insight per quasi tutte le parti di un'organizzazione, comprese le operazioni interne e le prestazioni dei team di vendita e marketing. Tenendo a mentre questo, una corretta formazione e un'applicazione attenta permettono all'AI di fornire valore aziendale in quasi tutte le circostanze.

Per capire in che modo un'organizzazione potrebbe addestrare l'AI per trarne il massimo beneficio, il primo passo è identificare gli input e cosa serve per operare la giusta decisione. Consideriamo ad esempio una supply chain di produzione. Una volta che un sistema AI adeguatamente addestrato ha a disposizione tutti i dati rilevanti, può calcolare i costi di spedizione, prevederne le tempistiche e i tassi di qualità/difetto, consigliare modifiche dei prezzi in base alle condizioni di mercato ed eseguire molte altre attività. La combinazione di ingenti volumi di dati in entrata e la necessità di decisioni basate sui dati rendono le supply chain mature per la risoluzione dei problemi legati all'intelligenza artificiale. Per conto, nei casi in cui le soft skills rimangono una priorità assoluta, l'intelligenza artificiale può fornire informazioni di supporto, ma è improbabile che sia promotrice di un cambiamento rivoluzionario. Un esempio è la valutazione da parte di un manager delle performance dei dipendenti durante le valutazioni annuali. In questo caso, l'intelligenza artificiale potrebbe semplificare la raccolta delle metriche, ma non può sostituire le valutazioni basate sulle interazioni fra persone.

Per trarre il massimo da un investimento nell'intelligenza artificiale, le organizzazioni devono considerare quanto segue:

  • Quali problemi dobbiamo risolvere?
  • Esistono fonti di dati di qualità in grado di fornire input per risolvere questi problemi?
  • Abbiamo l'infrastruttura necessaria per supportare il trattamento necessario e collegare le fonti di dati pertinenti?

Definendo questi parametri, le organizzazioni possono identificare le aree di business che hanno maggiori probabilità di trarre vantaggio dall'intelligenza artificiale, e quindi iniziare a prendere provvedimenti per renderle realtà.

Il processo di addestramento di un modello AI

Sebbene ogni progetto abbia le proprie sfide e i propri requisiti, il processo generale per l'addestramento dei modelli AI rimane lo stesso.

Questi cinque passaggi consistono in una panoramica dell'addestramento dei modelli AI.

  • Prepara i dati: un addestramento di modelli AI di successo inizia con dati di qualità che rappresentano in modo accurato e coerente situazioni reali e autentiche. Senza di esso, i risultati che ne conseguono sono privi di significato. Per avere successo, i team di progetto devono curare le giuste fonti di dati, creare processi e infrastrutture per la raccolta manuale e automatizzata dei dati e istituire i processi di pulizia/trasformazione appropriati.

  • Selezionare un modello di addestramento: se la cura dei dati fornisce le basi per il progetto, la selezione del modello crea il meccanismo. Le variabili per questa decisione includono la definizione dei parametri e degli obiettivi del progetto, la scelta dell'architettura e la selezione degli algoritmi del modello. Poiché diversi modelli di formazione richiedono diverse quantità di risorse, questi fattori devono essere valutati rispetto a elementi pratici come requisiti di calcolo, scadenze, costi e complessità.

  • Esegui l'addestramento iniziale: proprio come abbiamo visto con l'esempio in cui si insegna a un bambino a distinguere cani e gatti, l'addestramento dei modelli AI parte dalle nozioni di base. L'utilizzo di un set di dati troppo ampio, di un algoritmo troppo complesso o di un tipo di modello errato potrebbe portare a un sistema che elabora semplicemente i dati, piuttosto che imparare e migliorare. Durante l'addestramento iniziale, i data scientist dovrebbero concentrarsi sull'ottenere risultati entro i parametri previsti mentre fanno attenzione agli errori che interromperebbero l'algoritmo. Addestrando senza strafare, i modelli possono migliorare ordinatamente con passi costanti e sicuri.

  • Convalida l'addestramento: una volta che il modello ha superato la fase di formazione iniziale, creerà in modo affidabile i risultati previsti tra i criteri chiave. La fase successiva è la convalida dell'addestramento. Qui, gli esperti mettono appropriatamente alla prova il modello nel tentativo di rivelare problemi, sorprese o lacune nell'algoritmo. Questa fase utilizza un gruppo di set di dati diverso dalla fase iniziale, in genere con maggiore ampiezza e complessità rispetto ai set di dati di addestramento.

    Quando i data scientist testano questi data set, valutano le prestazioni del modello. Sebbene la precisione dell'output sia importante, lo è anche il processo stesso. Fra le principali priorità del processo ci sono variabili come la precisione, la percentuale di previsioni accurate e il richiamo, la percentuale di identificazione corretta della classe. In alcuni casi, i risultati possono essere giudicati con un valore metrico. Ad esempio, un punteggio F1 è una metrica assegnata ai modelli di classificazione che incorporano i pesi di diversi tipi di falsi positivi/negativi, consentendo un'interpretazione più olistica del successo del modello.

  • Testa il modello: una volta che il modello è stato convalidato utilizzando set di dati curati e adatti allo scopo, è possibile utilizzare i dati in tempo reale per testare le performance e l'accuratezza. I set di dati per questa fase dovrebbero essere estratti da scenari del mondo reale, un togliere "le rotelle" per lasciare che il modello voli da solo. Se il modello offre risultati accurati e, soprattutto, previsti con i dati di test, è pronto per diventare operativo. Se il modello mostra carenze di qualsiasi tipo, il processo di addestramento si ripete fino a quando il modello soddisfa o supera gli standard di prestazioni.

    Sebbene il go-live sia una milestone significativa, raggiungere quella fase non equivale alla fine dell'addestramento del modello. A seconda del modello, ogni data set elaborato potrebbe rappresentare un'altra "lezione" per l'AI, portando a un ulteriore miglioramento e perfezionamento dell'algoritmo. I data scientist devono continuare a monitorare le prestazioni e i risultati, in particolare quando il modello gestisce dati anomali imprevisti. In caso di risultati imprecisi, anche solo in rare occasioni, il modello potrebbe aver bisogno di ulteriori modifiche per non alterare l'output futuro.

Tipi di metodi di addestramento dei modelli AI

La formazione sull'intelligenza artificiale si presenta in molte forme diverse che variano per complessità, tipi di risultati, funzionalità e potenza di calcolo. Un metodo potrebbe utilizzare più risorse del necessario, mentre in altri casi potrebbe fornire una risposta binaria, ad esempio un sì o un no per l'approvazione di un prestito, quando la situazione ha bisogno di un risultato più qualitativo, come un "no" condizionale che rimane tale fino a quando non viene fornita più documentazione.

La scelta del metodo utilizzato per un modello AI deve tenere conto sia degli obiettivi che delle risorse; procedere senza un'attenta pianificazione potrebbe costringere i team di data science a ricominciare da zero, sprecando tempo e denaro.

Reti neurali profonde

Mentre alcuni modelli AI utilizzano regole e input per prendere decisioni, le reti neurali profonde offrono la possibilità di gestire decisioni complesse basate su diverse relazioni tra i dati. Le reti neurali profonde funzionano con numerosi livelli che identificano pattern e relazioni ponderate tra i datapoint per produrre output predittivi o valutazioni informate. Esempi di reti neurali profonde includono assistenti a comando vocale come Siri di Apple o Alexa di Amazon.

Regressione lineare

Nelle statistiche, la regressione lineare viene utilizzata per determinare la relazione tra input e output. Nella sua forma più semplice, può essere rappresentata dalla formula algebrica y = Ax + B. Questo modello utilizza un data set per creare la formula in base a input, output e possibili coefficienti variabili. Il modello finale utilizzato per la previsione presuppone una relazione lineare tra input e output. Un esempio di caso d'uso per la regressione lineare è una previsione di vendita basata sui dati di vendita precedenti.

Regressione logistica

Presa dal campo delle statistiche, la regressione logistica è un modello efficace per le situazioni binarie. La regressione logistica si basa sulla funzione logistica, che è un'equazione curva S spesso utilizzata per calcolare la probabilità. Nel caso della modellazione AI, la regressione logistica determina la probabilità e fornisce un risultato binario per fare previsioni o decidere, ad esempio, se un richiedente deve essere approvato per un prestito. Un esempio di caso d'uso per la regressione logistica è un'applicazione finance che esegue il rilevamento delle frodi.

Alberi decisionali

La maggior parte delle persone ha esperienza con gli alberi decisionali, anche al di fuori dell'AI. Gli alberi decisionali funzionano in modo simile ai nodi nei diagrammi di flusso. Nel machine learning, i processi di formazione alimentano l'albero attraverso dati iterativi per identificare quando aggiungere nodi e dove inviare i diversi percorsi nodo. Un esempio di caso d'uso per gli alberi decisionali è l'approvazione di un prestito finanziario.

Random Forest

Gli alberi decisionali possono diventare eccessivi per i loro set di addestramento quando creano troppa profondità. La tecnica random forest compensa ciò mettendo insieme un gruppo di alberi decisionali - da qui il termine "forest" - e trovando il maggior consenso o una media ponderata dei risultati. Un esempio di caso d'uso per una random forest è la previsione del comportamento dei clienti sulla base di una varietà di alberi decisionali in diversi elementi del profilo di un cliente.

Apprendimento supervisionato

In termini di educazione infantile, l'apprendimento supervisionato è l'equivalente di far seguire al bambino un programma definito con lezioni metodiche. Nel caso della modellazione AI, consiste nell'utilizzare set di dati di formazione consolidati e parametri definiti per addestrare il modello, con i data scientist che agiscono come insegnanti nella cura dei set di dati di formazione, nell'esecuzione dei set di dati di test e nella fornitura del feedback del modello. Un esempio di caso d'uso per l'apprendimento supervisionato è la ricerca cellule anomale nei raggi X ai polmoni. Il set di dati di addestramento è costituito da raggi X con e senza anomalie, specificando però quali sono i due modelli.

Apprendimento non supervisionato

Continuando l'analogia dell'educazione infantile, l'apprendimento non supervisionato è simile alla filosofia Montessori, dove ai bambini vengono presentate una serie di possibilità e la libertà di auto-dirigersi in base alla loro curiosità. Per la modellazione AI, ciò significa includere un data set non etichettato senza parametri o obiettivi: spetta all'AI determinare i pattern nei dati. Un esempio di caso d'uso per l'apprendimento non supervisionato è un retailer che fornisce dati di vendita trimestrali su un modello AI con l'obiettivo di trovare correlazioni nel comportamento dei clienti.

Apprendimento per rinforzo

Se hai mai rafforzato il comportamento desiderato offrendo prelibatezze, hai fatto uso di apprendimento per rinforzo. A livello di intelligenza artificiale, l'apprendimento per rinforzo inizia con decisioni sperimentali che portano a rinforzi positivi o negativi. Dopo un po' di tempo, l'AI impara quali sono le decisioni migliori, cioè quelle più accurate o di successo, per gestire una situazione e massimizzare il rinforzo positivo. Un esempio di caso d'uso per l'apprendimento per rinforzo è l'elenco dei suggerimenti "Forse ti può interessare anche" presentati da YouTube in base alla cronologia di visualizzazione.

Transfer learning

Un modello AI può avere successo se applicato a una situazione diversa. Con transfer learning si intende il metodo di utilizzo di un modello esistente come punto di partenza per un nuovo modello. Questa riqualificazione funziona meglio quando il modello esistente gestisce uno scenario generale; qualsiasi cosa troppo specifica può rivelarsi troppo difficile da riaddestrare. Un esempio di caso d'uso per il transfer learning è un nuovo modello AI per un tipo specifico di classificazione delle immagini basato sui parametri di un modello di classificazione delle immagini esistente.

Apprendimento parzialmente supervisionato

Utilizzando i principi dell'apprendimento supervisionato e non supervisionato, l'apprendimento semi-supervisionato inizia con il formare il modello su un piccolo gruppo di set di dati etichettati. Da lì, il modello utilizza data set non etichettati e non curati per perfezionare i pattern e creare insight non previsti. In generale, l'apprendimento semi-supervisionato utilizza solo set di dati etichettati per i primi passi, come le rotelle. Fatto ciò, il processo fa molto affidamento su dati non etichettati. Un esempio di caso d'uso per l'apprendimento semi-supervisionato è un modello di classificazione del testo, che utilizza un set curato per stabilire i parametri di base prima di essere alimentato da grandi volumi di documenti di testo non supervisionati.

Modelli generativi

I modelli generativi sono metodi AI non supervisionati che utilizzano data set di esempio molto grandi per creare un output richiesto. Esempi di questo sono immagini generate dall'intelligenza artificiale basate sui metadati di un archivio di immagini o un testo predittivo basato su un database di frasi digitate. Invece di classificare semplicemente i dati nel loro output, i risultati dei modelli generativi possono richiedere migliaia, forse milioni, di dati di esempio per imparare e creare un output originale. Esempi di caso d'uso di un modello generativo sono i chatbot, come ChatGPT.

Il ruolo dei dati nell'addestramento dei modelli AI

Perché un modello AI sia adeguatamente addestrato, ha bisogno di molti dati. In effetti, i dati sono l'elemento più importante nell'addestramento dei modelli di intelligenza artificiale. Senza di essi, il modello non può imparare. E senza dati di qualità, il modello imparerà le cose sbagliate. Pertanto, i data scientist selezionano i data set per i propri progetti con intenzione e cura.

La cura dei data set deve considerare i seguenti fattori se vuole portare a un addestramento ottimale dei modelli AI:

  • Qualità delle origini dati: se un modello AI viene alimentato con un grande volume di set di dati non controllati, omogenei e di scarsa qualità, i risultati che ne deriveranno saranno mediocri. Ciò che costituisce "dati di qualità" può differire a seconda del modello con cui si ha a che fare. Quando ci sono livelli inaccettabili di imprecisione, potrebbe essere necessario tornare sui propri passi e riaddestrare l'AI. Tuttavia, non è raro che i data scientist ricomincino un progetto da zero dopo aver visto che dati di scarsa qualità interferiscono con il modello.
  • Volume di dati: è con la pratica che l'addestramento dei modelli AI diventa efficace. Sebbene un data set possa essere un buon primo passo, il processo di formazione ha bisogno di una grande quantità di dati, nonché un livello appropriato di diversità e granularità per perfezionare il modello, aumentare la precisione e identificare i dati anomali.
  • Diversità di dati: una maggiore diversità dei set di dati spesso porta a una maggiore precisione nell'addestramento dei modelli AI. Proprio come nel mondo reale, facendo esperienze diverse si espandono le capacità e si permette più efficienza decisionale grazie alle maggiori conoscenze.

Sfide nell'addestramento dei modelli AI

La formazione sui modelli AI presenta delle sfide specifiche. Alcuni di queste sono logistiche: infrastruttura, potenza di calcolo e altre considerazioni pratiche fatte dall'inizio alla fine. Per altre sfide c'è bisogno degli insight dei data scientist, ad esempio per capire come mitigare i bias e avere risultati oggettivi.

Le seguenti sfide dovrebbero essere prese in considerazione per qualsiasi iniziativa di addestramento dei modelli AI:

  • Bias dei dati: per trarre risultati accurati da un modello AI, l'addestramento deve basarsi su dati di qualità. Per mitigare i bias sui dati, i data scientist devono esaminare attentamente le fonti di dati prima di curare i set di dati di addestramento.

  • I dati giusti: i set di dati di addestramento hanno bisogno di grandi volumi di dati per rappresentare la diversità e la granularità appropriate. Non solo quindi i team devono curare grandi quantità di dati di qualità, ma devono essere fatte anche molte considerazioni pratiche. Lo storage, la pulizia/trasformazione, l'elaborazione e il controllo generale della qualità diventano sempre più difficili man mano che un set di dati aumenta di volume.

  • Requisiti di potenza e infrastruttura di calcolo: più complesso è il modello AI, maggiori saranno la potenza di calcolo e il supporto dell'infrastruttura necessari. La praticità dell'esecuzione del modello, dall'addestramento al go-live, deve essere presa in considerazione quando viene scelto il metodo del modello. Se un tipo di modello richiede più risorse di quelle che è possibile fornire, l'intero progetto collasserà.

  • Overfitting: quando un modello AI diventa troppo ottimizzato nei data set di formazione, può bloccarsi su quelle specifiche piuttosto che essere in grado di gestire diversità e sorprese. Questo fenomeno è noto come "overfitting", e impedisce previsioni accurate in futuro. Un esempio di overfitting è quando il set di dati di addestramento produce un'accuratezza del 99%, ma un set di dati reale ne produce una che va dal 75% all'85%. Ti presente che con accuratezza percepita nell'intelligenza artificiale si intende quanto bene un sistema sembra funzionare in termini di precisione in base alle sue capacità attuali. È l'accuratezza osservata o sperimentata dagli utenti o dagli stakeholder. D'altra parte, per accuratezza potenziale nell'AI si intende il massimo livello di precisione che un sistema potrebbe raggiungere in condizioni ideali, con risorse ottimali. Comprendere la differenza tra l'accuratezza percepita e l'accuratezza potenziale è importante per valutare le prestazioni di un sistema AI e identificare le aree di miglioramento o sviluppo futuro.

    I termini "overfitting" e "overtraining" sono spesso usati in modo intercambiabile, ma hanno significati distinti. L'overfitting, come già detto, è quando l'AI funziona molto bene sui suoi dati di addestramento, ma non riesce a generalizzare bene sui dati nuovi. L'overtraining si verifica quando un modello è stato addestrato in modo eccessivo, inducendolo a prestazioni scadenti sia sui dati di addestramento che sui dati nuovi. L'overtraining può verificarsi quando un modello viene addestrato per troppo tempo o con troppa complessità, portandolo ad avere difficoltà a generalizzare. Entrambi i problemi devono essere evitati nel processo di addestramento del modello.

  • Spiegabilità: una questione irrisolta nella modellazione dell'intelligenza artificiale è la mancanza di spiegabilità sul modo in cui vengono prese le decisioni. Gli utenti fare deduzioni in base agli output, ma le ragioni del modello potrebbero rimanere vaghe. Alcuni sviluppatori hanno creato strumenti per colmare questa lacuna, tra cui modelli costruiti per fornire una spiegabilità più trasparente. Tuttavia, l'implementazione, l'usabilità, i dettagli e l'accessibilità variano, sia per l'input che per l'output.

Il futuro dell'addestramento dei modelli AI

L'intelligenza artificiale è, in qualche misura, in circolazione dagli albori del computing, ma i progressi negli algoritmi, nella potenza delle CPU, nella potenza delle unità di elaborazione grafica (GPU) e la condivisione delle risorse basata sul cloud hanno dato una spinta significativa all'intelligenza artificiale negli ultimi due decenni. L'intelligenza artificiale è incorporata in così tante applicazioni che molti utenti la utilizzano senza rendersene conto. Quando ascolti musica in streaming, le playlist personalizzate provengono da un'intelligenza artificiale che analizza le tue canzoni e i tuoi artisti preferiti. Quando digiti un messaggio di testo, un'intelligenza artificiale offre suggerimenti predittivi basati sulle parole che più utilizzi. Se hai trovato un nuovo programma TV che ti piace grazie a un suggerimento automatico, ringrazia l'AI.

Questo è il presente dell'AI, ma cosa c'è dietro l'angolo?

Il potenziale dell'intelligenza artificiale dipende dalle capacità in evoluzione dell'addestramento dei modelli. Diamo un'occhiata alle possibilità future nell'addestramento dei modelli AI.

Progressi nelle tecniche di addestramento dei modelli AI

Se ti sembra che le innovazioni dell'intelligenza artificiale siano cresciute in modo esponenziale, c'è una buona ragione: l'esplosione di dati e connettività negli ultimi dieci anni ha reso molto più facile addestrare i sistemi di intelligenza artificiale e ha permesso di realizzare modelli complessi, mentre nuovi e migliori algoritmi stanno contribuendo al successo. Per questo motivo, sembrano raggiungibili nel prossimo decennio una serie di obiettivi "arroganti", tra cui il ragionamento approfondito, in cui l'intelligenza artificiale acquisisce la capacità di comprendere il come e il perché alla base delle situazioni, una maggiore efficienza nella formazione tramite set di dati più piccoli, e modelli più efficienti e accurati coltivati a partire da un apprendimento non supervisionato.

Il potenziale del transfer learning

Per le persone, le competenze trasferibili aumentano l'occupabilità e la produttività rendendo molto più facile iniziare una nuova attività. Lo stesso vale per il transfer learning nell'AI. Tuttavia, un transfer learning efficace deve comunque affrontare una serie di sfide. Attualmente, il transfer learning funziona meglio in domini simili per il modello originale, cosa che ne limita l'uso. L'ampliamento delle capacità di transfer learning richiederà una maggiore potenza di calcolo e risorse per supportare la maggiore complessità del riaddestramento. Senza innovazioni nell'efficienza e nell'elaborazione, potrebbe essere più facile costruire un modello da zero.

Il ruolo della supervisione umana nell'addestramento dei modelli AI

Forse il tratto più potente dell'intelligenza artificiale è la sua capacità di eseguire le attività in modo più rapido e accurato rispetto agli esseri umani, risparmiando alle persone che si occupano delle spedizioni, ai contabili e ad altri l'esecuzione di attività ripetitive. Naturalmente, per arrivare a questo punto serve dedicare tempo e fatica alla cura dei set di dati, all'analisi degli output e alla modifica del modello.

Come scegliere lo strumento giusto per l'addestramento dei modelli AI

Una varietà di strumenti di addestramento dei modelli AI può accelerare il processo di sviluppo e formazione. Fra questi strumenti ci sono librerie di modelli predefinite, framework open source, supporti per la programmazione e l'ambiente e gradient boosting. Alcuni si basano sul tipo di modello utilizzato, mentre altri richiedono determinati standard per le risorse di calcolo.

Per determinare quale strumento o quali strumenti funzionano meglio per il tuo progetto, compila le risposte alle seguenti domande:

  • Che tipo di risultato vuoi dal tuo modello AI?
  • Quali sono le tue risorse di calcolo alla base?
  • Quali sono la portata e il budget del tuo progetto?
  • In che punto del processo di sviluppo ti trovi?
  • Quali sono le competenze del tuo team?
  • Esistono limitazioni di governance o compliance per il tuo settore o progetto?
  • Quali aree del tuo progetto hanno più bisogno di aiuto?

Queste risposte possono aiutarti a creare un breve elenco di strumenti efficaci per aiutare il tuo processo di addestramento del modello AI.

OCI supporta l'addestramento dei modelli e le applicazioni parallele

L'addestramento di modelli AI complessi può essere un'iniziativa dispendiosa in termini di risorse, con centinaia, forse migliaia, di servizi indipendenti che coordinano e condividono informazioni. Oracle Cloud Infrastructure (OCI) fornisce GPU connesse tramite una rete Ethernet ad alte prestazioni per far risparmiare tempo e denaro ai clienti massimizzando al contempo disponibilità e stabilità. Con OCI, i clienti ottengono interconnessioni semplici e veloci per supportare la formazione e l'implementazione di modelli altamente complessi su larga scala.

I precursori del machine learning nell'intelligenza artificiale sono stati costruiti in base a regole intensive e probabilità guidate da calcoli potenti. Il supercomputer Deep Blue ha gareggiato in tornei di scacchi di livello mondiale in questo modo. Tuttavia, l'AI si è evoluta andando oltre l'uso di regole basate su dati esterni; i modelli AI ora si concentrano sulla generazione di insight interni addestrando con enormi volumi di set di dati. Sebbene alcuni modelli AI utilizzino ancora alberi decisionali basati su regole, altri supportano processi e previsioni complesse grazie alle reti neurali.

I progressi nell'AI sono entusiasmanti, ma il futuro di questa tecnologia dipende da un'addestramento di qualità elevata.

E-book sui casi d'uso di AI

Le imprese che intraprendono l'addestramento di un modello, a qualsiasi livello, vorranno garantire che i set di dati pertinenti e le conoscenze istituzionali siano ben documentate. Un ottimo modo per raggiungere questo obiettivo è avere un centro di eccellenza AI, che offre tantissimi altri vantaggi oltre al supporto all'addestramento.

Domande frequenti sull'addestramento dei modelli AI

Che cos'è l'addestramento dei modelli AI?

L'addestramento dei modelli AI è il processo attraverso cui si forniscono set di dati curati a un modello AI affinché migliori l'accuratezza del suo output. Il processo può essere lungo, a seconda della complessità del modello AI, della qualità dei set di dati di addestramento e del volume dei dati di addestramento. Una volta che il processo di formazione supera un benchmark per i successi previsti, i data scientist continuano a monitorare i risultati. Se la precisione scende o il modello ha difficoltà a gestire determinati tipi di situazioni, il modello potrebbe avere bisogno di un ulteriore addestramento.

Dove posso addestrare un modello AI?

Chiunque abbia accesso agli strumenti appropriati può addestrare un modello AI utilizzando qualsiasi PC, dando per scontato abbiano accesso ai dati necessari. I passi includono l'identificazione del problema, la selezione del modello di addestramento, la ricerca di set di dati di addestramento e l'esecuzione dei processi di addestramento. Questo può essere su piccola scala, su scala locale o su larga scala a seconda della portata del progetto e delle risorse disponibili. Gli sviluppatori nuovi o indipendenti possono sfruttare i servizi cloud che forniscono risorse CPU in una vasta gamma di linguaggi di programmazione e rimuovere l'area geografica dall'equazione.

Quanto costa addestrare i modelli AI?

Il costo dell'addestramento di un modello AI dipende dalla portata del progetto. In tutto il settore, i costi continuano a scendere poiché la potenza delle CPU/GPU e l'accesso al cloud forniscono più risorse. In effetti, il costo medio di formazione per un progetto di piccole dimensioni, come la classificazione delle immagini, è stato di 1.000 dollari nel 2017, ma solo di 5 dollari nel 2022, secondo l'AI Index dello Stanford's Institute for Human-Centered Artificial Intelligence.

In confronto, il costo per i grandi progetti AI aziendali sta effettivamente aumentando. Ad esempio, qualcosa come l'addestramento ChatGPT può richiedere un budget stimato che va da 3 a 5 milioni di dollari statunitensi. Questa disparità dipende dalla complessità dei progetti e dal fatto che le crescenti risorse rendono disponibili progetti sempre più complessi e che spingono i limiti, se puoi permetterteli.

Come imparare ad eseguire la modellazione AI?

Per imparare a eseguire l'addestramento dei modelli di intelligenza artificiale, è necessaria un'istruzione formale o una formazione sul posto di lavoro. Una volta acquisita esperienza, inizia con i quattro passaggi necessari per creare un modello AI.

  • Identifica il problema: che si tratti di un progetto aziendale, accademico o personale, qualsiasi modello di intelligenza artificiale inizia con il conoscere il problema che desideri risolvere. Facendo così viene creata una direzione che il progetto può seguire e vengono identificati vari elementi chiave, come la portata, il budget e le esigenze di risorse.
  • Cura i dati di formazione: i modelli AI funzionano solo quando hanno dati da cui imparare. Ciò significa che i set di dati di formazione devono essere curati a partire da fonti di qualità, e poi preparati (puliti/trasformati) per essere usati in un algoritmo.
  • Sviluppo dei modelli: gli sviluppatori possono scegliere tra una serie di tipi di AI per il proprio modello AI a seconda del tipo di output necessario e del tipo di dati disponibili. Una volta stabilito questo, il processo di formazione può iniziare. Quando il modello raggiunge livelli elevati di precisione con i dati di formazione, i team di sviluppo possono passare a dati reali per testare le prestazioni.
  • Implementazione: dopo aver confermato i risultati reali, il modello può essere attivato. In questa fase, gli sviluppatori dovrebbero continuare a monitorare i risultati per rilevare eventuali anomalie che richiedono ulteriori perfezionamenti. Un modello AI dovrebbe essere trattato come un progetto continuo in grado di continuare a evolversi.

Quali sono i quattro tipi di modelli AI?

Generalmente, sono questi i quattro tipi di modelli AI:

  • L'apprendimento supervisionato utilizza set di dati di formazione consolidati e parametri definiti per addestrare il modello.
  • L'apprendimento non supervisionato prevede l'inclusione di un set di dati non etichettati senza parametri o obiettivi e la determinazione dei pattern nei dati.
  • I modelli di apprendimento per rinforzo iniziano con decisioni sperimentali che portano a rinforzi positivi o negativi. Passato del tempo, l'AI impara la "migliore" linea d'azione.
  • L'apprendimento generativo è un metodo AI non supervisionato che utilizza una grande quantità di dati di esempio per creare un output richiesto.

Alcuni data scientist utilizzano anche il transfer learning, in cui un modello AI esistente è un punto di partenza per un nuovo modello, e l'apprendimento semi-supervisionato, che fonde l'apprendimento supervisionato e non supervisionato.