Generalistische LLMs sind unglaublich leistungsfähig... aber sie bleiben "Alleskönner". Heute gibt es spezialisierte Modelle: einige glänzen bei Code, andere bei tiefgreifendem Denken, wieder andere bei langen Texten, Websuche oder multimodalen Aufgaben.
Der Editor wurde genau dafür entwickelt: Anstatt alles von einem einzelnen Modell zu verlangen, gibt er Ihnen ein Orchester von LLMs in die Hand, jedes zum richtigen Zeitpunkt aufgerufen, um das zu tun, was es am besten kann.
Ein generalistisches Modell ist "für alles" in Ordnung, aber selten das Beste in irgendetwas. Durch die Kombination mehrerer LLMs können Sie verwenden: das Top-Modell für Analyse und Argumentation, das stärkste für kreatives Schreiben, den Coding- und Debugging-Spezialisten, und erzielen ein Endergebnis, das ein einzelnes Modell kaum erreichen würde.
Forschung zu LLM-Ensembles und "LLM-Räten" zeigt, dass das Zusammenarbeiten mehrerer Modelle mit Vergleich und Abstimmung Halluzinationen und Fehler im Vergleich zu einer einzelnen Stimme reduziert.
In Ihrem Workflow können Sie: schnelle und günstige Modelle zum Klassifizieren, Zusammenfassen, Bereinigen von Daten verwenden; Premium-Modelle nur für wirklich kritische Schritte reservieren. Es ist das Kosten-Geschwindigkeit-Qualität-"Dreieck": orchestrieren Sie mehrere Modelle für maximale Ergebnisse bei minimalem Aufwand.
Wenn ein neues super-spezialisiertes Modell herauskommt (mehr Kontext, mehr Argumentation, mehr Coding...), müssen Sie nicht alles neu machen: Sie fügen es Ihrem Workflow hinzu und setzen es dort ein, wo es am besten funktioniert. Ihre Arbeit ist nicht an einen einzigen Anbieter gebunden.
Andrej Karpathy hat llm-council veröffentlicht, eine kleine Open-Source-Webanwendung, die etwas Brillantes tut: Anstatt ein einzelnes Modell nach der Antwort zu fragen, sendet sie Ihre Frage an mehrere LLMs, lässt sie sich gegenseitig kritisieren und bewerten, und dann synthetisiert ein "Chairman" das Beste zu einer einzigen Antwort.
Verschiedene akademische Arbeiten erweitern diesen Ansatz: Räte heterogener Modelle, die Zwischenschritte verifizieren, abstimmen und den Weg korrigieren, für robustere und konsistentere Ergebnisse.
Wenn Sie einen Workflow im Editor erstellen:
Sie zerlegen das Problem in Schritte (Analyse, Recherche, Schreiben, Verifizierung...).
Bei jedem Schritt wählen Sie (oder lassen das System wählen) das am besten geeignete Modell: kreativ, analytisch, technisch, Reviewer.
Die Ausgabe eines Schritts wird zum strukturierten Kontext für den nächsten, sodass die gesamte "Kette" auf dasselbe Ziel hinarbeitet.
Wo nötig, können Sie mehrere Modelle parallel arbeiten lassen, ihre Antworten vergleichen, eine finale Synthese "à la Karpathy" anfordern.
Ergebnis: Sie "sprechen nicht mehr mit einem Chatbot", Sie dirigieren ein Team künstlicher Intelligenzen.
Der Editor gibt Ihnen den Taktstock, Sie entscheiden die Symphonie.