Il valore dell'AI si è spostato. Ma continuiamo a guardare dalla parte sbagliata.

Da qualche settimana si parla molto di orchestrazione multi-modello. L’esempio più discusso è Sakana Fugu, il router di un laboratorio di Tokyo che smista le richieste tra GPT, Gemini e i modelli di Anthropic: in molti lo hanno letto come il segnale che il dominio USA sui modelli frontier si sta incrinando, si parla di fine del primato americano, di potere che si sposta a est. Persino Sakana, dopo i primi giorni, ha smorzato quella lettura: uno spokesperson ha parlato di un momento contingente, non di un riallineamento permanente verso un altro blocco di player.

Il dettaglio che conta non è chi vince la classifica dei modelli. Ed è anche vero che la reazione più diffusa nei primi giorni, su Hacker News e altrove, non era trionfalismo geopolitico ma scetticismo tecnico: in tanti si chiedevano se Fugu fosse davvero qualcosa di nuovo o solo un router molto costoso travestito da modello. Ma il CEO di Sakana lo ha scritto senza girarci troppo intorno: gli orchestration model sono la prossima frontiera, oltre ai modelli più grandi.

Ha ragione. Ma non esattamente per il motivo che intende lui.

Lo spostamento

Il valore si sta spostando dal modello che risponde a chi decide quale modello deve rispondere, e con quali istruzioni. Non è una scoperta di dieci giorni fa. Framework come LangChain e CrewAI orchestrano modelli a mano da tempo, OpenRouter fa sintesi multi-modello con Fusion. Quello che cambia con sistemi come Fugu è che il coordinamento viene appreso invece che scritto a mano, un coordinatore addestrato a decidere chi chiamare, in che ordine, quando verificare il lavoro fatto. Fugu, in particolare, nasce anche come hedge contro un rischio molto concreto: due dei modelli con cui si confronta, Fable 5 e Mythos Preview di Anthropic, sono usciti dal suo stesso pool il 12 giugno 2026, quando sono diventati soggetti a export control USA. Ma il meccanismo di fondo, il valore che si sposta dal modello al layer che lo usa, era già in corso prima di questo singolo lancio.

Il buco nella tesi

Un orchestratore, per definizione, instrada. E instrada sulla base del contesto che riceve: la voce del brand, le regole di cosa dire e cosa evitare, cosa è già stato comunicato la settimana prima. Se quel contesto è vago o non esiste in forma strutturata, il routing non lo corregge. Lo esegue più in fretta.

Pensa a un caporedattore che assegna pezzi a freelance bravissimi. Senza una linea editoriale chiara, chi sono i lettori, cosa è già uscito, continua comunque ad assegnare. Ogni pezzo torna ben scritto, ma scollegato dagli altri. La redazione non è peggiorata. È rimasta senza la materia su cui esercitare giudizio.

I primi test reali su Fugu vanno letti in questa cornice, anche se parlano di un problema leggermente diverso. Ethan Mollick ha scritto che Fugu Ultra è lentissimo nei suoi test abituali di coding, circa mezz’ora a run, con risultati discreti ma non all’altezza di Fable nell’uso reale. Il punto non è smontare Fugu. È che un motore di routing, per quanto sofisticato, non compensa un contesto povero a monte. Al massimo lo elabora con più efficienza.

Il layer scoperto

Che il contesto sui dati conti, ormai lo sa il mondo enterprise: semantic layer, ontologie, governance dei dati sono diventati temi seri, con analisti che dicono apertamente che il modello è commodity e il contesto è il vero moat. Quello che manca quasi ovunque è lo stesso trattamento applicato al contesto di brand. Voce, target, guardrail editoriali, cosa è già stato pubblicato: in molte organizzazioni vive in un documento condiviso mai aggiornato, non è strutturato, non compone nel tempo, non è interrogabile da un sistema che deve decidere in tempo reale a chi instradare cosa.

Cosa rimane

Con Fylle presidiamo esattamente quel layer: contesto ottimizzato per l’AI e leggibile per le persone. Un sistema che cresce nel tempo e resta di proprietà di chi lo usa, sempre, non nella cache temporanea di un vendor.

L’esecuzione ormai è commodity. I modelli cambiano. Ma il contesto, la memoria, quello che l’AI sa di te e che vuoi che sappia e si ricordi, quello resta.

Per le aziende con cui lavoriamo, un sistema model-agnostic è la risposta giusta: lavora con OpenAI, Anthropic, Gemini, DeepSeek, e questo apre a due cose che per certi settori non sono un dettaglio:

Modelli open weight, non solo API proprietarie chiuse.
Deployment on-prem, il vincolo vero per chi opera in settori regolamentati come finance o pharma, dove i dati non possono uscire verso un orchestratore cloud gestito da un terzo.

E nella settimana in cui abbiamo scoperto che l’accesso a un modello può sparire per una riga di export control firmata da un governo, questo smette di essere un dettaglio di posizionamento.

Fonti

Sakana AI, comunicato di rilascio Fugu, 22 giugno 2026: sakana.ai/fugu-release
Ethan Mollick su Fugu Ultra in test reali, riportato da Business Standard, 23 giugno 2026: business-standard.com
TechCrunch, sul posizionamento di Sakana e la dichiarazione dello spokesperson, 27 giugno 2026: techcrunch.com
Anthropic, annuncio export control su Fable 5 e Mythos, 12 giugno 2026: anthropic.com/news

Lo spostamento

Il buco nella tesi

Il layer scoperto

Cosa rimane

Fonti

Ricevi la prossima uscita.