Michael Chen | Content Strategist | 25 novembre 2024
Il machine learning è diventato un termine familiare negli ultimi anni, quando il concetto è passato dalla fantascienza a essere un aspetto chiave del modo in cui le aziende e le organizzazioni elaborano le informazioni. Con il ritmo della creazione dei dati che continua a crescere in modo esponenziale, gli strumenti di machine learning sono fondamentali per le organizzazioni che cercano di scoprire modelli, individuare le tendenze e tracciare il percorso più redditizio da seguire.
Quanto è comune il machine learning? Se hai fatto clic su una raccomandazione da un sito Web di e-commerce o da una piattaforma di streaming, sei stato informato di un potenziale uso improprio di una carta di credito o di un software di trascrizione utilizzato, hai beneficiato del machine learning. Viene utilizzato in finance, sanità, marketing, retail e molti altri settori per estrarre insight preziosi dai dati e automatizzare i processi.
Il Machine Learning (ML) è un sottoinsieme dell'intelligenza artificiale che si occupa di creare sistemi che imparano e migliorano man mano che consumano più dati. Intelligenza artificiale è un termine generico e si riferisce a sistemi o macchine che imitano l'intelligenza umana. I termini apprendimento automatico e intelligenza artificiale vengono spesso utilizzati insieme e in modo interscambiabile, ma non hanno lo stesso significato.
In breve, tutto il machine learning è intelligenza artificiale, ma non tutta l'intelligenza artificiale è machine learning.
Concetti chiave
Il machine learning è una tecnica che scopre relazioni precedentemente sconosciute nei dati, cercando set di dati potenzialmente molto grandi per scoprire modelli e tendenze che vanno oltre la semplice analisi statistica. Il machine learning utilizza algoritmi sofisticati addestrati per identificare i pattern nei dati, creando modelli. Questi modelli possono essere utilizzati per fare previsioni e categorizzare i dati.
Si noti che un algoritmo non è uguale a un modello. Un algoritmo è un insieme di regole e procedure utilizzate per risolvere un problema specifico o eseguire un compito particolare, mentre un modello è l'output o il risultato dell'applicazione di un algoritmo a un data set.
Prima dell'addestramento, hai un algoritmo. Dopo l'addestramento, hai un modello.
Ad esempio, il machine learning è ampiamente utilizzato nel settore sanitario per attività come l'analisi dell'imaging medico, l'analisi predittiva e la diagnosi delle malattie. I modelli di machine learning sono ideali per analizzare le immagini mediche, come le scansioni MRI, i raggi X e le scansioni TC, per identificare modelli e rilevare anomalie che potrebbero non essere visibili all'occhio umano o che un diagnostico oberato di lavoro potrebbe non notare. I sistemi di machine learning possono anche analizzare i sintomi, le informazioni genetiche e altri dati dei pazienti per suggerire test per condizioni come cancro, diabete e malattie cardiache.
Le caratteristiche principali del machine learning sono
Esistono quattro tipi principali di machine learning. Ognuno ha i propri punti di forza e i propri limiti ed è importante scegliere l'approccio giusto per il compito specifico.
Il machine learning di rinforzo, come il machine learning non supervisionato, utilizza data set non etichettati e consente agli algoritmi di valutare i dati. Tuttavia, l'apprendimento del rinforzo differisce in quanto sta lavorando verso un obiettivo prefissato piuttosto che esplorare i dati per scoprire quali modelli potrebbero esistere. Con un obiettivo in mente, l'algoritmo procede in un processo di prova e di errore. Ogni mossa riceve un feedback positivo, negativo o neutro, che l'algoritmo utilizza per affinare il proprio processo decisionale generale. Gli algoritmi di apprendimento di rinforzo possono lavorare a livello macro verso l'obiettivo del progetto, anche se ciò significa affrontare conseguenze negative a breve termine. In questo modo, l'apprendimento di rinforzo gestisce situazioni più complesse e dinamiche rispetto ad altri metodi perché consente al contesto dell'obiettivo del progetto di influenzare il rischio nelle scelte. Insegnare a un computer a giocare a scacchi è un buon esempio. L'obiettivo generale è vincere la partita, ma ciò potrebbe richiedere il sacrificio di pezzi man mano che il gioco continua.
Qual è l'approccio più adatto alle tue esigenze? La scelta di un approccio supervisionato o di uno degli altri tre metodi di solito dipende dalla struttura e dal volume dei dati, dal budget e dalle ore che possono essere dedicate all'addestramento e dal caso d'uso a cui si desidera applicare il modello finale. Ignorare un suggerimento riguardo a una camicetta da abbinare a una gonna potrebbe sembrare irrilevante. Non individuare un tumore, meno.
Come indica il suo nome, il machine learning funziona creando modelli statistici basati su computer che vengono perfezionati per un determinato scopo valutando i dati di addestramento, piuttosto che con l'approccio classico in cui i programmatori sviluppano un algoritmo statico che tenta di risolvere un problema. Quando i data set vengono inseriti nel modello ML, l'output risultante viene giudicato in base all'accuratezza, consentendo ai data scientist di regolare il modello attraverso una serie di variabili consolidate, chiamate iperparametri, e variabili regolate algoritmicamente, chiamate parametri di apprendimento.
Poiché l'algoritmo si regola mentre valuta i dati di addestramento, il processo di esposizione e calcolo attorno a nuovi dati addestra l'algoritmo a diventare migliore in ciò che fa. L'algoritmo è la parte computazionale del progetto, mentre il termine "modello" è un algoritmo addestrato che può essere utilizzato per casi d'uso di parole reali.
L'ambito, le risorse e gli obiettivi dei progetti di Machine Learning determineranno il percorso più appropriato, ma la maggior parte coinvolgerà una serie di passi.
1. Raccolta e compilazione dei dati
I modelli ML di formazione richiedono molti dati di alta qualità. Trovarli a volte è difficile ed etichettarli, se necessario, può essere molto impegnativo. Dopo aver identificato potenziali origini dati, valutale per determinare la qualità complessiva e l'allineamento con le risorse esistenti di integrazione/repository dei dati del progetto. Queste fonti costituiscono la base di addestramento di un progetto di machine learning.
2. Selezionare un algoritmo appropriato per generare il modello desiderato
A seconda che il progetto preveda l'uso di apprendimento supervisionato, non supervisionato o apprendimento semi-supervisionato, i data scientist possono scegliere gli algoritmi più adatti. Ad esempio, un progetto più semplice con un data set con etichetta può utilizzare un albero decisionale, mentre il clustering, ovvero la divisione di campioni di dati in gruppi di oggetti simili, richiede più risorse di calcolo poiché l'algoritmo funziona senza supervisione per determinare il percorso migliore per un obiettivo.
3. Perfezionare e preparare i dati per l'analisi
È probabile che i dati in entrata non siano pronti per l'uso. La preparazione dei dati pulisce i data set per garantire che tutti i record possano essere facilmente inclusi durante l'addestramento. La preparazione include una serie di task di trasformazione, ad esempio la definizione di formati di data e ora, l'unione o la separazione delle colonne in base alle esigenze e l'impostazione di altri parametri di formato, ad esempio cifre significative accettabili nei dati dei numeri reali. Altri task chiave includono la pulizia dei record duplicati, anche denominati duplicazione dei dati, nonché l'identificazione ed eventualmente la rimozione dei valori anomali.
4. Educare il modello attraverso l'addestramento
Dopo aver selezionato il modello finale desiderato, viene avviato il processo di addestramento. Durante l'addestramento, un set di dati curato, etichettato o non etichettato, viene fornito all'algoritmo. Nelle esecuzioni iniziali, i risultati potrebbero non essere ottimi, ma i data scientist si modificheranno in base alle esigenze per perfezionare le prestazioni e aumentare la precisione. Quindi all'algoritmo vengono mostrati nuovamente i dati, di solito in quantità maggiori per sintonizzarli in modo più preciso. Più dati l'algoritmo vede e più il modello finale dovrebbe migliorare nel fornire i risultati desiderati.
5. Valuta le prestazioni e l'accuratezza del modello
Dopo che il modello è stato addestrato fino a raggiungere una precisione sufficiente, è il momento di fornire dati precedentemente invisibili per testare le sue prestazioni. Spesso, i dati utilizzati per i test sono un sottoinsieme dei dati di addestramento messi da parte per l'uso dopo l'addestramento iniziale.
6. Ottimizza e migliora i parametri del modello
Il modello ora è molto probabilmente vicino alla distribuzione. Le esecuzioni con set di dati di test devono produrre risultati altamente accurati. I miglioramenti avvengono attraverso una formazione aggiuntiva con dati specifici, spesso unici per le operazioni di un'azienda, per integrare i dati generalizzati utilizzati nella formazione originale.
7. Avvia il modello
Con i risultati ottimizzati, il modello è ora pronto ad affrontare i dati non visti in precedenza nell'uso normale della produzione. Quando il modello è attivo, i team di progetto raccoglieranno dati sulle prestazioni del modello in scenari reali. Ciò può essere fatto monitorando le metriche chiave delle prestazioni, come l'accuratezza, la correttezza complessiva delle previsioni del modello e il rapporto tra osservazioni positive correttamente previste. Considera anche in che modo le previsioni del modello influenzano i risultati aziendali sul campo: stanno generando valore, sia nell'aumento delle vendite di camicette che grazie a una diagnostica migliore?
Effettuare regolari audit e revisioni delle prestazioni del modello può aiutare a identificare problemi o distorsioni che possono essere sorti dopo la distribuzione e sono essenziali per garantire che il modello funzioni in modo efficace e soddisfi gli obiettivi desiderati.
Gli algoritmi sono la parte computazionale di un progetto di machine learning. Una volta addestrati, gli algoritmi producono modelli con una probabilità statistica di rispondere a una domanda o raggiungere un obiettivo. L'obiettivo potrebbe essere quello di trovare alcune caratteristiche nelle immagini, come "identificare tutti i gatti", o potrebbe essere quello di individuare anomalie nei dati che potrebbero indicare frodi, spam o un problema di manutenzione di una macchina. Altri algoritmi potrebbero tentare di fare previsioni, ad esempio quali articoli di abbigliamento potrebbero piacere a un cliente in base a ciò che ha al momento nel carrello.
Alcuni degli algoritmi più comuni utilizzati nel machine learning sono i seguenti:
Oltre le reti neurali
Il machine learning utilizza una vasta gamma di algoritmi. Mentre quelli discussi sopra regnano supremi in termini di popolarità, ecco cinque algoritmi meno comuni ma utili.
| Gradient boosting | Crea modelli in sequenza concentrandosi sugli errori precedenti nella sequenza. Utile per il rilevamento di frodi e spam. |
| K-nearest neighbors (KNN) | Un modello semplice ma efficace che classifica i datapoint in base alle etichette dei vicini più vicini nei dati di addestramento. |
| Principal component analysis (PCA) | Riduce la dimensionalità dei dati identificando le caratteristiche più significative. È utile per la visualizzazione e la compressione dei dati, ad esempio per il rilevamento delle anomalie. |
| Q-learning | Impiegati e agenti che apprendono attraverso tentativi ed errori, ricevendo ricompense per le azioni desiderate e sanzioni per aver fatto la mossa sbagliata. |
| Support vector machines (SVM) | Crea un iperpiano per separare in modo efficace i datapoint appartenenti a classi diverse, ad esempio la classificazione delle immagini. |
Il machine learning consente alle organizzazioni di estrarre insight dai propri dati che potrebbero non essere in grado di trovare in altro modo. Alcuni dei vantaggi più comuni derivanti dall'integrazione del machine learning nei processi includono i seguenti:
I progetti di machine learning sono efficaci solo quanto il sistema e le risorse con cui sono costruiti. Ciò evidenzia la necessità di investire in una corretta pianificazione e preparazione.
Di seguito sono riportate alcune delle sfide più comuni che i progetti di machine learning devono affrontare:
Il machine learning può offrire vantaggi significativi a quasi tutti i settori e a tutti i reparti all'interno di un'organizzazione. Se i numeri vengono elaborati e i dati esistono, il machine learning offre un modo per aumentare l'efficienza e derivare nuovi tipi di coinvolgimento. I casi d'uso comuni del machine learning in tutti i settori includono i seguenti:
Il machine learning in Oracle Database offre una gamma di funzionalità e caratteristiche finalizzate ad accelerare il processo. Grazie alla possibilità di conservare i dati all'interno del database, i data scientist possono semplificare il flusso di lavoro e aumentare la sicurezza, sfruttando al contempo oltre 30 algoritmi integrati ad alte prestazioni, il supporto per i linguaggi più diffusi, tra cui R, SQL e Python, le funzionalità di machine learning automatizzate e le interfacce senza codice.
Per le organizzazioni con data set di grandi dimensioni, il machine learning integrato nel database con HeatWave MySQL annulla la necessità di spostare i dati in un sistema separato per il machine learning, il che può contribuire ad aumentare la sicurezza, ridurre i costi e risparmiare tempo. HeatWave AutoML automatizza il ciclo di vita del machine learning, inclusa la selezione degli algoritmi, il campionamento intelligente dei dati per la formazione dei modelli, la selezione delle funzioni e l'ottimizzazione degli iperparametri, cosa che permette ai clienti di risparmiare molto tempo e tanta fatica.
Il vantaggio del machine learning è la capacità di analizzare e interpretare grandi quantità di dati in modo rapido e accurato. Una volta addestrati, i modelli di machine learning possono identificare in pochi secondi o minuti modelli, tendenze e insight che potrebbero richiedere settimane agli esseri umani o che potrebbero non vedere mai la luce del giorno. Il risultato è un processo decisionale più informato, una migliore risoluzione dei problemi e la capacità di fare previsioni basate sui dati. Inoltre, i modelli di machine learning possono automatizzare i processi ripetitivi, risparmiando tempo e risorse. Il machine learning sta realizzando il suo potenziale per rivoluzionare il posto di lavoro e promuovere l'innovazione.
Il machine learning è la chiave per sbloccare il valore dei tuoi dati e il primo passo di un programma di intelligenza artificiale di successo.
Qual è la differenza tra AI e ML?
L'intelligenza artificiale è il nome dato all'ampia materia informatica che si concentra sull'ideazione e il perfezionamento di sistemi per pensare come gli esseri umani. Il machine learning è un sottoinsieme di questo campo che si concentra specificamente sull'aspetto computazionale del processo di apprendimento. I due termini sono spesso usati in modo intercambiabile e affrontano sfide simili, ma hanno una loro identità specifica nonostante questa connessione.
Quali sono i quattro principali tipi di machine learning?
I quattro tipi di machine learning sono i seguenti:
È difficile imparare il machine learning?
Come ogni mestiere tecnico, imparare i dettagli del machine learning è un processo iterativo che richiede tempo e dedizione. Un buon punto di partenza per il machine learning è avere una base di conoscenza dei linguaggi di programmazione, come Python o R, oltre a una comprensione della statistica. Molti elementi coinvolti nella valutazione dell'output del machine learning richiedono la comprensione di concetti statistici, come regressione, classificazione, adattamento e parametri.
Qual è un esempio di machine learning?
Uno degli esempi più comuni di machine learning è un motore di suggerimenti. Nell'e-commerce, è un suggerimento di prodotto come "ti potrebbe anche piacere..." Nei media di streaming video è un suggerimento su cosa guardare dopo. In questi casi, l'algoritmo prende la cronologia di un utente e crea previsioni per ciò che l'utente potrebbe trovare interessante e più l'utente aggiunge punti dati, più l'algoritmo può perfezionare le previsioni.