KI ist Teufelszeug. Außer beim Balancing.
Selbstverständlich, Künstliche Intelligenz ist Teufelszeug. KI ist wie eine gigantische Piratenbibliothek, die mit der Ausrede „Ich lerne doch nur“ angelegt wird. KI ist das perfekte Instrument, um den Arbeitgebertraum vom menschenfreien Betrieb zu verwirklichen. KI ist das Exoskelett der Tech-Bros, die getrieben von ihren dystopischen Ideologien eine globale Broligarchie errichten, in der Demokratie, Rechtsstaat und Gewaltenteilung bestenfalls noch als Fußnote in den Terms of Services auftauchen.
Auf der anderen Seite…
Wenn KI dabei helfen könnte, bessere Regelsystem für Rollenspiele zu gestalten?
Warum nicht?
Playtests reichen nicht — sagt der Verlag selbst
Im vergangenen August hat der Uhrwerk Verlag in einem ausführlichen Werkstattbericht über Playtests für das Myranor-Regelsystem berichtet. Natürlich, so die Aussage damals, gebe es Playtests zum neuen 5e-Regelwerk. Playtests von Regelfeatures seien sogar wertvoll. Aber: 1. Balancing-Themen lassen sich kaum am Spieltisch testen. 2. Vollständige Playtests sind nicht möglich. Und 3.: Playtests brauchen Zeit (die man nicht habe). Daher, so das Fazit: „Playtests haben natürlich einen Nutzen. (…) Letztendlich ist intensives Lesen der Texte und Auseinandersetzen mit den Inhalten die besser machbare und erfolgversprechendere Variante.“
Das kann man natürlich so machen. Mit fundierten Regelkenntnissen, Erfahrung und Bauchgefühl lässt sich ein solides, vermutlich sogar ein gutes Regelwerk gestalten. Und gelegentlichen Balancing-Probleme, sofern sie nicht wirklich auffällig und gravierend sind, dürfte für die meisten Spielrunden ohnehin wenig Bedeutung haben.
Gänzlich unwichtig ist Balancing dennoch nicht, weder am Spieltisch noch im Verlag. Im jüngsten Update zu Melliador erst hat der Uhrwerk Verlag geschrieben: „Wir verheizen gerade massenhaft Monster und SC in Probekämpfen gegeneinander, um zu testen, wie gut Kreaturenprofile, Klassen und Unterklassen balanciert sind.“
Nicht geschrieben haben sie allerdings, wie diese Probekämpfe aussehen. Ob da wirklich ein paar Menschen um einen Tisch sitzen, mit ihren Würfeln in der Hand, ein Monster nach dem anderen in die Mitte legen und Stunde um Stunde Probekämpfe ausfechten. Oder ob sie das tun, was sich anbietet: Eine gut trainierte KI tausendfach Simulationen durchführen zu lassen.
Was eine KI-Simulation kann, und was nicht
Simpel ist das nicht. „Gut trainiert“ sind die beiden Zauberworte. Ein 5-Minuten-Prompt erledigt die Aufgabe nicht. Neben der korrekten und umfassenden Datengrundlage muss die Simulation Mechanik-Treue und realistische Rahmenbedingungen gewährleisten. Bevor eine KI das valide und skalierbar abbilden kann, dürften zahlreiche Iterationen notwendig sein.
Im Ergebnis aber könnte eine solche KI-Simulation ein Balancing nicht nur über ein paar Spielabende hinweg testen, wie bei Playtests üblich, sondern über tausende Kämpfe. Nicht Würfelglück entscheidet dann mehr, stattdessen werden auch Balancing-Probleme, die am Tisch durch ihre Seltenheit kaum auffallen, zuverlässig sichtbar. Nicht mehr Tagesform, Spielleitung, taktisches Geschick und Gegner-Design werden vermischt, sondern einzelne Variable lassen sich isoliert und systematisch über viele Stufen und Gegnertypen hinweg überprüfen. Dann wäre ein Regelsystem wirklich nahezu ausbalanciert.
Was eine solche Simulation nicht testet: das Spielgefühl, die Klassenidentität. Ob sich tatsächlich der Eindruck einstellt, eine Rolle zu spielen. Oder schlicht: Ob das Spiel Spaß macht. Das kann KI so nicht leisten. Sie kann harte Regeln testen und ein Regelsystem auf Schwächen abklopfen. Nicht mehr. Aber auch nicht weniger. Und das wenige ist mehr, als viele Rollenspiele bislang belegbar leisten können.
Wenn ein Verlag das nicht möchte, stattdessen weiter auf punktuelle Playtests setzt, ist das eine Designentscheidung. Es gibt gute Gründe, auf den Einsatz von KI zu verzichten. Aber die Frage, ob ein Regelsystem wirklich das leistet, was es leisten soll, bleibt dann in Teilen Bauchgefühl. Etwas mehr Validität, künstlich erzeugt, wäre nicht immer verkehrt.

Schwierig…
Was ist denn dieses ominöse „Balancing“? Heißt das, dass jede Klasse im Schnitt pro Runde über ein Dutzend verschieden designete Encounter hinweg einen ähnlichen „Damage-Output“ haben soll? Oder analog viel austeilen? Oder ein wie auch immer sich ausgedachtes Gleichgewicht aus beidem? Oder den DPS von n Teamkameraden um soundsoviel Prozente erhöhen oder y debuffs negieren zu können? Soundso oft Verbündete vor dem Tod retten?
Oder einen abstraktes Kampf-Ranking gegen ein ebenso abstraktes Sozial- oder Wildnis-Ranking aufwiegen…?
Ist es überhaupt sinnvoll, zu versuchen, den Barden und den Barbaren zu „balancen“?
Ich denke, dass diese Art von Balancing („der Paladin muss genauso stark sein wie der Waldläufer wie der Hexenmeister“) eine Illusion ist und dabei im Zweifelsfall eher seelenlose bzw. sich sehr „gamy“ und wenig spielweltplausibel anfühlende Systeme rauskommen.