Un insieme di numeri che lasciano senza parole
Nel marzo 2026, il direttore dell'Ufficio nazionale di statistica Liu Liehong ha lanciato un insieme di numeri al Forum di alto livello sulla sviluppo della Cina:
1000 miliardi → 100 trilioni → 140 trilioni
Il nostro volume medio giornaliero di chiamate ai token è aumentato di oltremille volte
Ancora più sorprendente è che alcune aziende modello hanno guadagnato più dell'intero anno precedente in soli 20 giorni
A dire il vero, quando ho visto questo numero per la prima volta, sono rimasto sbalordito per alcuni secondi
Non perché la crescita sia così sorprendente
Nell'era di Internet abbiamo visto troppe storie di crescita esponenziale
Ma è perché il termine 'token' è improvvisamente passato dal gergo tecnico a un indicatore economico che può essere discusso in forum di alto livello.
Quando un termine tecnico inizia a comparire nel discorso di un capo ufficio, non si tratta più solo di una questione tecnica, ma anche economica.
Questo mi ricorda il 2010 circa, quando il "traffico dati" era solo un termine tecnico usato internamente dagli operatori di telecomunicazioni e dalle aziende internet. Alla gente comune non importava quanti MB consumasse ogni giorno. Ma pochi anni dopo, l'ansia da dati è diventata un argomento di interesse nazionale, e con essa sono nati pacchetti dati, schede dati e l'economia dei dati.
Ora, la storia sembra ripetersi, solo che i protagonisti sono cambiati e ora sono parole.

Che cos'è esattamente un elemento lessicale?
I tecnici ti diranno:
Un token è la più piccola unità di informazione elaborata da un modello di grandi dimensioni. Si tratta di un segmento discreto che il modello è in grado di comprendere, formato dalla segmentazione del testo in parole tramite algoritmi di segmentazione. Un carattere cinese può costituire un token, una parola inglese può essere segmentata in due o tre parti, e la descrizione di un'immagine può contenere centinaia di token.
Ma questa spiegazione non ha senso per la maggior parte delle persone.
In altre parole: ogni volta che interagisci con ChatGPT, fai scrivere del codice all'IA, generi un'immagine o persino fai prenotare un volo o organizzare le tue email da un agente, stai consumando token in background. I fornitori di modelli quasi sempre addebitano il costo in base ai token.
Il costo del tuo input e il costo della risposta dell'IA sono visualizzati in modo chiaro.
Per esempio
Scrivi un articolo di 3000 parole utilizzando GPT-4.
→ Consuma circa 5000 unità lessicali
→ Costo approssimativo: 0,15 dollari
Lascia che l'agente di intelligenza artificiale si occupi di prenotare voli, scrivere email e aggiornare il calendario.
→ Il consumo di parole supera facilmente le 10.000
→ I costi sono aumentati di oltre 10 volte
È come fare una telefonata: prima si pagava al minuto, ora l'intelligenza artificiale paga in base al numero di pensieri. Solo che il processo di pensiero è quantificato in parole.
La domanda è: sai quante parole consumi ogni mese?
Proprio come nel 2010 le persone non sapevano quanti dati avessero utilizzato.
L'Amministrazione Nazionale dei Dati ha ufficialmente denominato il Token "Unità Cenomica", il che non è solo una questione di traduzione, ma anche un riconoscimento delle sue caratteristiche economiche. Viene definito come un'ancora di valore e un'unità di regolamento nell'era dell'intelligenza artificiale. In parole semplici, fornisce uno standard quantificabile per la determinazione del prezzo del lavoro dell'IA.

Da un buco nero che brucia denaro a una macchina per stampare denaro
Il fatturato di un importante produttore di modellini, in soli 20 giorni, ha superato il fatturato totale dell'intero anno precedente.
Negli ultimi anni, abbiamo sentito innumerevoli storie di aziende di intelligenza artificiale che hanno bruciato denaro.
L'addestramento di un modello di grandi dimensioni può facilmente costare decine di milioni di dollari, l'acquisto di GPU è economico come comprare cavoli e le bollette dell'elettricità possono tenere sveglio il direttore finanziario tutta la notte.
A quel tempo, le unità lessicali erano più spesso viste come un costo: quante unità lessicali venivano consumate durante l'addestramento, quante unità lessicali venivano consumate durante l'inferenza e come ottimizzare per spendere meno.
Ma ora la situazione è cambiata.
Una volta che l'intelligenza artificiale entra nella fase di applicazione su larga scala, ogni conversazione con l'utente e ogni attività svolta da un agente intelligente consumano continuamente vocabolario. Più parole vengono consumate, più i produttori vendono.
La parola "costo" si è trasformata in "merce" che può essere prodotta in serie, prezzata a livelli e scambiata su larga scala.
La fabbrica lessicale di Huang Renxun
Alla conferenza GTC del 2026, il CEO di Nvidia, Jensen Huang, ha proposto direttamente il concetto di "meta-economia".
Ha ridefinito il data center come una "fabbrica lessicale":
Sembra fantastico, vero? Ma ecco il problema: questo non trasforma forse le aziende di intelligenza artificiale in semplici "convertitori di energia elettrica"? Tu consumi energia elettrica per produrre parole, io consumo energia elettrica per produrre parole e, alla fine, si tratta di una competizione a chi riesce a convertire le parole in modo più efficiente. Qual è la differenza fondamentale tra questo e la logica della produzione tradizionale?
Paradosso di Jevons: maggiore efficienza ≠ costi ridotti
Ancora più importante, questa logica nasconde una classica trappola economica: il paradosso di Jevons.
Nel XIX secolo, l'ingegnere britannico Jevons scoprì che, con il miglioramento dell'efficienza della macchina a vapore, il consumo di carbone in realtà aumentava anziché diminuire, perché l'energia più economica ne stimolava un maggiore utilizzo. Ora, il costo notevolmente ridotto dell'inferenza basata sull'intelligenza artificiale sta paradossalmente stimolando un maggiore utilizzo, portando a un continuo aumento del consumo e della spesa complessivi.
Quindi, quando i fornitori di modelli celebrano l'"impennata del volume delle chiamate lessicali", penso sempre:
Si tratta di un dividendo di efficienza derivante dal progresso tecnologico o di una nuova frenesia consumistica?

Nuove regole del gioco nella filiera industriale
L'attenzione della Cina alla convenienza economica contro l'attenzione degli Stati Uniti alla premiumizzazione: chi la spunterà?
La metaeconomia sta creando una chiara catena industriale, in cui ogni anello viene rimodellato. Ma la cosa ancora più interessante è che Cina e Stati Uniti stanno percorrendo strade completamente diverse.
Sul fronte della produzione: chi ha l'elettricità più economica?

Il risultato è che, sebbene il modello americano possa essere di qualità superiore, il rapporto costo-efficacia del modello cinese supera di gran lunga quello dei suoi concorrenti.
La situazione è simile a quella del settore della telefonia mobile: Apple vende prodotti di fascia alta, ma Xiaomi e OPPO si sono aggiudicate la maggior parte del mercato globale offrendo prodotti ad alte prestazioni a prezzi competitivi.
Aspetto di ottimizzazione: Quanto denaro può far risparmiare il software?
Questo è il livello che, a mio parere, è il più sottovalutato. Senza aggiungere nuovo hardware, la sola ottimizzazione del software può aumentare la generazione di parole di 3-5 volte.
Caso di studio: Tecnologia di routing modellato

Ad esempio, gli algoritmi di accelerazione dell'inferenza (quantizzazione, potatura, distillazione) possono aumentare la velocità di inferenza dello stesso modello di 2-3 volte, il che equivale a produrre più token con la stessa quantità di elettricità.
Ecco perché la futura competizione nell'IA potrebbe non risiedere nei modelli stessi, bensì nei "sistemi di pianificazione" e nelle "capacità di ottimizzazione dei costi".
Fine della distribuzione: qual è l'essenza della diffusione globale dei word token?
I modelli cinesi, sfruttando il loro vantaggio in termini di costi, stanno consentendo l'"esportazione di token lessicali" tramite API. Sembra fantascienza, ma in sostanza è vero:
➢ Le aziende statunitensi che utilizzano API cinesi pagano un terzo del costo per milione di parole rispetto a OpenAI.
➢ Gli sviluppatori del Sud-est asiatico, dell'America Latina e dell'Africa possono creare direttamente applicazioni locali utilizzando il modello cinese.
➢ Non è richiesta alcuna dichiarazione doganale, né logistica, né tantomeno una presenza fisica.
Si tratta di un nuovo tipo di "esportazione digitale": non vendiamo beni, ma l'intelligenza stessa.
Ma sorge spontanea una domanda: gli Stati Uniti limiteranno la circolazione delle parole come fanno con le patatine? Ci sarà un "embargo sulle parole"? Questa domanda merita continua attenzione.
Dal punto di vista dell'applicazione: chi sta consumando il maggior numero di token?
I tre scenari con il più alto consumo lessicale:
① Agente intelligente del servizio clienti
Un operatore di assistenza clienti basato sull'intelligenza artificiale gestisce 1.000 conversazioni al giorno, utilizzando in media 5.000 parole chiave per conversazione, per un totale di 5 milioni di parole chiave al giorno. Un'azienda di e-commerce di medie dimensioni potrebbe utilizzare oltre 100 milioni di parole chiave al mese.
② Generazione del codice
Un programmatore che utilizza Copilot potrebbe consumare dalle 100.000 alle 200.000 unità di parola al giorno. Un'azienda tecnologica con 100 dipendenti potrebbe consumare fino a 500 milioni di unità di parola al mese.
③ Generazione di contenuti
Un organo di informazione autogestito utilizza l'intelligenza artificiale per generare articoli, sceneggiature video e descrizioni di immagini, consumando dalle 200.000 alle 300.000 unità di testo al giorno.
In futuro, il bilancio di ogni azienda SaaS potrebbe includere un "costo di tokenizzazione", proprio come avviene oggi per i servizi cloud.
Il "buco nero lessicale" degli agenti intelligenti
Gli agenti intelligenti sono particolarmente degni di nota. Conosco un team di una startup che ha creato un assistente amministrativo basato sull'intelligenza artificiale per aiutare le aziende a gestire le attività quotidiane. Sembrava un'ottima idea, ma sono rimasti sbalorditi nel primo mese dopo il lancio:
Analisi dei costi di un caso reale
Compito: Prenota il volo, l'hotel, il taxi e la sala riunioni per il viaggio a Shanghai del tuo capo la prossima settimana.
Passaggio 1: Verifica le informazioni sul volo
→ Il modello è stato chiamato 3 volte, consumando 8000 token.
Passaggio 2: Confronta prezzi e tempi
→ Il modello è stato chiamato due volte, consumando 5000 token.
Passaggio 3: Prenota e conferma
→ Il modello è stato chiamato due volte, consumando 6000 token.
Passaggio 4: Genera l'itinerario e invialo via email
→ Il modello è stato chiamato una sola volta, consumando 3000 token.
Totale: 22.000 parole, costo approssimativo: 0,50 dollari
Se un'azienda ha 100 dipendenti e ogni dipendente ha 5 di questi compiti al giorno:
Alla fine, il team ha dovuto eliminare l'80% delle funzionalità, mantenendo solo gli scenari più essenziali, per contenere i costi entro limiti accettabili.
Il fondatore mi ha detto una cosa:
"Non si tratta di creare un prodotto; si tratta di guadagnarsi da vivere. Il limite per gli agenti intelligenti non è la tecnologia, ma il prezzo delle unità lessicali."
Questo è il paradosso degli agenti intelligenti: più sono potenti, più diventano costosi; più diventano costosi, più è difficile diffonderli. Pertanto, il futuro degli agenti intelligenti potrebbe non dipendere dal livello di avanzamento tecnologico, ma da quanto si riuscirà a ridurre il costo delle unità lessicali.
Per certi versi, la guerra dei prezzi è appena iniziata.

Quindi, le regole del gioco sono cambiate.
Per le aziende: ➢ Il calcolo del ROI è diventato più preciso.
In passato, era difficile quantificare i benefici e i costi nella valutazione dei progetti di intelligenza artificiale.
Ora puoi calcolare con precisione: quante unità sono necessarie per sostituire un addetto al servizio clienti, quante unità sono necessarie per elaborare un contratto e quante unità sono necessarie per generare un report.
Le strutture dei costi stanno cambiando: parte del lavoro umano viene sostituito dall'automazione e le mansioni non essenziali vengono rapidamente meccanizzate. Nei bilanci, il volume di elaborazione testi potrebbe diventare un nuovo indicatore chiave.
Per il settore, l'intelligenza artificiale è passata a tutti gli effetti dalla fase di "presentazione" a quella di "infrastruttura".
L'intelligenza non è più una capacità misteriosa celata in una scatola nera, ma una risorsa quotidiana che può essere misurata, scambiata e ottimizzata, proprio come l'elettricità, l'acqua e il flusso.
Da una prospettiva macroeconomica, ➢ Le unità lessicali, in quanto nuovo tipo di fattore produttivo, stanno rimodellando la funzione di produzione.
Collega energia, potenza di calcolo, dati e applicazioni, dando vita a un nuovo sistema di valori.
I vantaggi della Cina in termini di energia elettrica verde, costi della potenza di calcolo e scenari applicativi hanno reso possibile la diffusione globale delle unità di misura mondiali.
In sostanza, si tratta di esportare energia elettrica e potenza di calcolo sotto forma di intelligenza digitale.
Ma ho sempre avuto la sensazione che qualcosa non andasse.
Quattro questioni scomode
Il "rinoceronte grigio" della metaeconomia
Innanzitutto, la meta-economia si trasformerà in una nuova "trappola per il traffico"?
Nell'era di Internet, abbiamo assistito all'ascesa e alla distorsione dell'economia del traffico.
Inizialmente, il traffico era una quantificazione dell'attenzione degli utenti; in seguito, è diventato un gioco di numeri che poteva essere manipolato, acquistato e falsificato.
Le unità lessicali seguiranno lo stesso percorso? Quando le unità lessicali diventeranno metriche fondamentali, qualcuno creerà chiamate non valide per gonfiare le metriche? Emergerà una filiera industriale di "manipolazione delle unità lessicali"? Le misure di supporto come la regolamentazione, gli standard internazionali e la sovranità dei dati saranno in grado di tenere il passo?
In secondo luogo, la fornitura di dati di alta qualità sarà in grado di tenere il passo?
Il valore di un'unità lessicale dipende non solo dalla sua quantità, ma anche, e forse soprattutto, dalla sua qualità. Tuttavia, i dati di alta qualità sono limitati.
Quando tutti producono freneticamente unità lessicali, le fonti di dati non diventeranno sempre più omogenee? L'intelligenza artificiale rimarrà intrappolata in un ciclo di "autoapprendimento"?
Utilizzare contenuti generati dall'IA per addestrare l'IA, ottenendo risultati sempre più mediocri?
In terzo luogo, come risolvere la pressione sul consumo energetico?
L'essenza della metaeconomia consiste nel trasformare l'elettricità in intelligenza. Ma l'elettricità non è infinita, soprattutto l'elettricità pulita.
Quando il consumo di parole aumenta di mille volte, l'offerta di energia sarà in grado di tenere il passo? Ci sarà una contraddizione tra sovraccapacità di parole e carenza di energia?
In quarto luogo, chi detiene il potere di fissare i prezzi?
Attualmente, il prezzo delle unità di parola è determinato principalmente da pochi fornitori leader di modelli. Ma con la trasformazione delle unità di parola in infrastrutture, la concentrazione del potere di determinazione dei prezzi porterà a un nuovo monopolio?
Si creerà un "oligopolio lessicale"? Le piccole imprese e i singoli sviluppatori saranno estromessi dal mercato?
Per ora queste domande restano senza risposta. Ma credo che prima di celebrare il "Primo Anno della Meta-Economia", dovremmo almeno sottoporle a discussione.

Insomma
Dal carbone e dal petrolio nell'era industriale, al traffico e ai dati nell'era dell'informazione, e ora alle parole nell'era intelligente, l'economia umana si è sempre evoluta attorno a "energia di base e unità di misura". Questa logica è ineccepibile.
Ma ogni evoluzione è accompagnata da nuove disuguaglianze, nuovi sprechi e nuove forme di alienazione:
Il carbone ha dato origine alla Rivoluzione Industriale, ma ha anche causato inquinamento ambientale.
Il petrolio ha portato la civiltà moderna, ma ha anche scatenato guerre per le risorse.
Il traffico ha provocato un'esplosione di informazioni, ma ha anche portato allo sfruttamento dell'attenzione.
Che cosa apporteranno gli elementi lessicali? È troppo presto per trarre conclusioni.
Ho solo la vaga sensazione che quando il "pensiero" e la "creazione" vengono quantificati come merci commerciabili,
Quando ogni output dell'IA viene fatturato con precisione, rischiamo di perdere di vista qualcosa di più importante.
Quel tipo di esplorazione a prescindere dai costi, quel tipo di ispirazione che non si può quantificare, quel tipo di valore che trascende l'efficienza.
Forse ciò di cui dovremmo davvero diffidare non è la parola "economia" in sé, ma la nostra fascinazione per le cose quantificabili.
Non tutto ciò che ha valore può essere misurato, e non tutto ciò che può essere misurato ha valore.
Un'ultima domanda per te:
La vostra azienda ha iniziato a includere nel budget il consumo lessicale? Quando gli agenti consumano lessicali come se fossero acqua, vi fermate mai a pensare: cosa stanno creando esattamente questi lessicali per noi?

