Gli LLM generalisti sono potentissimi... ma restano "tuttofare". Oggi esistono modelli specializzati: alcuni eccellono nel codice, altri nel ragionamento profondo, altri ancora nei testi lunghi, ricerca web o multimodale.
L'editor nasce proprio per questo: invece di chiedere tutto a un unico modello, ti mette in mano un'orchestra di LLM, ognuno chiamato al momento giusto per fare ciò che sa fare meglio.
Un modello generalista va bene "per tutto", ma raramente è il migliore in qualcosa. Combinando più LLM puoi usare: il modello top per analisi e ragionamento, quello più forte sulla scrittura creativa, lo specialista di coding e debugging, ottenendo un risultato finale che un singolo modello difficilmente raggiunge.
La ricerca su ensemble di LLM e "LLM council" mostra che far lavorare più modelli insieme, con confronto e voto, riduce hallucination ed errori rispetto ad affidarsi a una sola voce.
Nel tuo flusso puoi: usare modelli veloci ed economici per classificare, riassumere, pulire dati; riservare i modelli premium solo per gli step davvero critici. È il "triangolo" costo-velocità-qualità: orchestri più modelli per avere il massimo risultato col minimo spreco.
Quando esce un nuovo modello super-specializzato (più contesto, più ragionamento, più coding...), non devi rifare tutto: lo aggiungi al tuo flusso e lo metti dove rende di più. Il tuo lavoro non è legato a un unico fornitore.
Andrej Karpathy ha pubblicato llm-council, una piccola web app open source che fa una cosa geniale: invece di chiedere la risposta a un solo modello, manda la tua domanda a più LLM, lascia che si critichino e si valutino a vicenda, e poi un "Chairman" sintetizza il meglio in una risposta unica.
Vari lavori accademici stanno estendendo questo approccio: consigli di modelli eterogenei che verificano gli step intermedi, votano e correggono il percorso, per risultati più robusti e consistenti.
Quando costruisci un flusso nell'editor:
Scomponi il problema in step (analisi, ricerca, scrittura, verifica...).
Ad ogni step scegli (o lasci scegliere al sistema) il modello più adatto: creativo, analitico, tecnico, revisore.
L'output di uno step diventa contesto strutturato per lo step successivo, così tutta la "catena" ragiona sullo stesso obiettivo.
Dove serve, puoi far lavorare più modelli in parallelo, confrontare le loro risposte, chiedere una sintesi finale "alla Karpathy".
Risultato: non stai più "parlando con un chatbot", ma stai dirigendo un team di intelligenze artificiali.
L'editor ti dà la bacchetta, tu decidi la sinfonia.