Vi siete mai chiesti cosa succede davvero quando le persone usano ChatGPT o Copilot per lavoro? Non le promesse di marketing, non le previsioni apocalittiche – proprio quello che fanno nella pratica, ogni giorno. Microsoft Research ha deciso di scoprirlo analizzando 200.000 conversazioni reali con Bing Copilot, e i risultati ribaltano parecchie convinzioni.
Il cuore della questione: misurare l’uso reale, non le capacità teoriche
La differenza tra questo studio e quelli precedenti sta tutta qui. Fino ad oggi, chi voleva capire l’impatto dell’AI sul lavoro partiva dalle capacità tecniche: questo modello sa fare X, quindi probabilmente sostituirà chi fa X. Un approccio che ha senso sulla carta ma che ignora completamente come la gente usa davvero questi strumenti.
I ricercatori di Microsoft – Kiran Tomlinson, Sonia Jaffe e il loro team – hanno fatto il contrario. Hanno preso conversazioni reali, anonimizzate, dal primo gennaio al 30 settembre 2024. Solo utenti negli Stati Uniti. Poi hanno costruito una pipeline basata su LLM per classificare ogni conversazione secondo le attività lavorative del database O*NET.
Ma ecco la parte interessante: hanno distinto tra quello che l’utente voleva ottenere (user goal) e quello che l’AI ha effettivamente fatto (AI action). Sembra una sottigliezza, invece cambia tutto.
User goal vs AI action: perché questa distinzione conta
Pensateci un attimo. Se chiedo a Copilot di aiutarmi a scrivere un’email, il mio obiettivo è comunicare. Ma l’AI sta scrivendo, spiegando, fornendo assistenza. Sono ruoli diversi.
Questa distinzione rivela pattern interessanti nelle diverse professioni:
- Chi lavora nella preparazione del cibo o nelle riparazioni tende a usare l’AI come assistente – gli utenti delegano compiti
- Chi lavora nei media, nelle arti o nei servizi sociali collabora attivamente con l’AI per svolgere lo stesso lavoro
In pratica, alcune professioni potrebbero liberare tempo delegando all’AI. Altre potrebbero diventare più produttive lavorando insieme all’AI. Due scenari molto diversi.
Le professioni con maggiore applicabilità AI: qualche sorpresa
La classifica delle 25 professioni con il punteggio di applicabilità AI più alto ha dentro qualche nome atteso e qualche outsider.
Al primo posto? Interpreti e traduttori, con un punteggio di 0.492. Seguono storici (0.462) e scrittori (0.454). Fin qui, nessuna sorpresa – sono lavori che girano attorno alle parole.
Ma poi saltano fuori i programmatori CNC (0.419), i rappresentanti del servizio clienti (0.408), i telemarketer (0.404). E nella top 25 trovate anche matematici, data scientist, sviluppatori web.
In fondo alla classifica invece? Assistenti sanitari domiciliari (0.04), giardinieri (0.04), operatori di impianti (0.04), lavoratori forestali (0.03). Professioni dove il contatto fisico o l’ambiente non permettono deleghe significative.
Cosa fanno le persone con l’AI, concretamente
Le attività più comuni che emergono dai dati:
- Imparare e raccogliere informazioni
- Comunicare
- Insegnare e spiegare
- Scrivere
L’AI risponde principalmente fornendo informazioni, spiegando concetti, rispondendo a richieste, scrivendo testi. I verbi più frequenti? Provide, Explain, Teach, Assist, Respond. Un ruolo di servizio, insomma.
Information work: il pattern dominante
C’è un filo rosso che attraversa tutti questi dati: le attività che funzionano meglio con l’AI riguardano l’information work – creare, elaborare e comunicare informazioni. Queste attività compaiono nei risultati in modo sproporzionato rispetto alla loro presenza nella forza lavoro generale.
Il paragone storico che fanno i ricercatori è illuminante. Così come i word processor hanno trasformato la dattilografia da competenza specializzata a skill diffusa, l’AI potrebbe democratizzare competenze legate alla gestione delle informazioni.
Ma attenzione: questa democratizzazione funziona solo se le persone hanno le conoscenze di base per valutare e applicare l’assistenza dell’AI. Non basta premere un bottone.
Correlazioni socioeconomiche: meno lineari del previsto
Uno dei risultati più interessanti riguarda il rapporto tra applicabilità AI e salario. La correlazione? Debole – r=0.13 quando si pesa per l’occupazione. Le professioni dove l’AI è più applicabile non sono necessariamente le più pagate.
Sull’istruzione il quadro è più sfumato. L’applicabilità AI si distribuisce lungo tutto lo spettro educativo, con una leggera tendenza verso le professioni che richiedono laurea o titoli superiori.
I dati demografici mostrano correlazioni interessanti: positiva con la percentuale di donne (r=0.21) e di asiatici (r=0.19), negativa con la percentuale di ispanici/latini (r=-0.43). Numeri che sollevano domande su accesso e familiarità con questi strumenti.
Quello che questo studio NON dice (e i ricercatori ci tengono a precisarlo)
E qui arriviamo alla parte che mi preme di più. Gli autori sono stati molto chiari – anzi, a un certo punto hanno dovuto rilasciare una dichiarazione ufficiale perché i titoli dei giornali stavano dicendo tutt’altro.
Lo studio NON conclude che i lavori verranno eliminati. Punto. Gli autori avvertono esplicitamente contro questa interpretazione.
Portano l’esempio degli ATM, che è perfetto. Gli sportelli automatici automatizzavano un compito centrale dei cassieri bancari. Il risultato? Le banche hanno aperto più filiali perché i costi erano scesi, e il numero di cassieri è aumentato. Gli effetti downstream delle tecnologie sono spesso controintuitivi.
Altre limitazioni importanti:
- I dati vengono solo da Bing Copilot – non altri LLM, non AI specializzate, non sistemi aziendali
- È difficile distinguere le conversazioni di lavoro da quelle personali
- Solo utenti USA
- Solo chatbot, non altre forme di AI
- Le metriche di completamento misurano utilità, non produttività effettiva
Confronto con le previsioni precedenti
C’è una buona notizia metodologica. La correlazione tra questi dati empirici e le previsioni dello studio Eloundou del 2024 (quello che stimava l’esposizione delle professioni all’AI) è di 0.73. Vuol dire che le previsioni basate sulle capacità teoriche non erano così sballate.
Però i dati reali mostrano una correlazione più debole con il salario rispetto a quanto previsto. La realtà, come al solito, è più complicata dei modelli.
Task completion: come hanno misurato se l’AI funziona
Un aspetto tecnico che vale la pena capire: come hanno valutato se Copilot ha effettivamente aiutato gli utenti?
Tre metriche:
- Task completion: un LLM valuta se l’obiettivo dell’utente è stato raggiunto, validato con il feedback reale (pollice su/giù)
- User feedback: le reazioni esplicite degli utenti
- Scope: quanto della attività lavorativa Copilot riesce ad assistere, su una scala da “niente” a “completo”
I risultati? Copilot eccelle in comunicazione, insegnamento e scrittura. Va peggio con la generazione di immagini e l’analisi dati. E c’è una correlazione forte (r=0.64) tra lo scope e la frequenza d’uso – le persone usano di più ciò che funziona meglio.
Cosa aspettarsi nei prossimi anni
I ricercatori indicano alcune direzioni di ricerca future che mi sembrano sensate:
Primo: capire come le professioni riorganizzeranno le loro responsabilità in risposta all’AI. Non quale lavoro sparirà, ma come cambierà.
Secondo: l’emergenza di nuove occupazioni. Dato storico interessante – la maggioranza dell’occupazione attuale è in professioni nate negli ultimi 100 anni grazie a nuove tecnologie.
Terzo: aggiornare la comprensione stessa delle attività lavorative. Il database O*NET è stato progettato prima di ChatGPT – alcune categorie potrebbero non catturare più la realtà.
Un dato che fa riflettere: quasi il 40% degli americani riporta di usare AI generativa. Una diffusione che supera quella iniziale del PC e di Internet. Stiamo parlando di un’adozione di massa, non di una nicchia tech.
Il punto della situazione
Se devo tirare le fila, direi questo: l’AI ha una qualche applicabilità alla maggior parte delle professioni, perché quasi tutti i lavori hanno una componente di elaborazione informazioni. Ma applicabilità non significa sostituzione.
L’impatto reale dipenderà da decisioni aziendali che nessuno può prevedere. Come le aziende sceglieranno di usare i guadagni di produttività? Per ridurre il personale o per fare di più? Per abbassare i costi o per migliorare la qualità?
Quello che i dati mostrano con certezza è che stiamo già usando questi strumenti per lavorare, in modi specifici e misurabili. Il futuro non è una speculazione – è già in corso nelle 200.000 conversazioni che questo studio ha analizzato.
