Der Entwurf einer neuen Härtetabelle

(Michael Schröpl)

Motivation

Nachdem die "gigantische Hirnwixerei" (O-Ton Süd) in den letzten Heften Ergebnisse gebracht hat, die von mancherlei Seite (siehe vorherige Seite) eher belächelt werden, möchte ich nun endlich mal Nägel mit Zöpfen machen.

Zielsetzung

Da gibt es nun also irgend eine Disziplinarmatrix. Es gab auch schon vorher eine, die in Oberfoul erfunden wurde. Ich hatte dann später eine zweite geraten, die mir irgendwie besser gefiel. Die schrecklichen Extreme mit 7 oder gar 8 Strafen, die ein Team im besten United3-Stil zerstückeln konnten, hatten mir ebensowenig gefallen wie die Möglichkeit, noch bei Härte 9 völlig straflos davonkommen zu können.

Nachdem nun die Theorie etwas besser erforscht ist als zuvor, möchte ich die nächste Disziplinarmatrix, die in der kommenden Saison in AUFSTIEG Gültigkeit haben wird, nicht mehr blind raten. Mit dem geeigneten Handwerkszeug müßte sich nun doch etwas mehr erreichen lassen.

Analyse des Ist-Zustandes

Wenn man den Erkenntnissen aus Heft 8 glauben schenken darf, dann ist Härte 10 selbst im aktuellen Spiel schlechter als Härte 5 - ganz zu schweigen von den langfristigen Auswirkungen. Etwa 50% des positiven Effektes, den der Einsatz von Härte hat, wird allein durch die Gefahr von Elfmetern wieder aufgewogen. Der restliche Nutzen ist bei kleinen Härtestufen überproportional hoch, ab Stufe 6 fressen die drohenden Roten Karten aber alles wieder weg. Diese Zahlen gelten für ein starkes United-Szenario, in dem die durchschnittliche Stärke eines Vereins pro Saison über 100 WP liegt und eine Hintermannschaft von T 8 / A 8 nur durchschnittlich gut ist.

Demzufolge konnte man in diesem Szenario unter der bisherigen DI-Matrix jedem Manager nur zum permanenten Einsatz von 3-6 Härtepunkten raten und empfehlen, mit 12 oder 13 Spielern zu altern, um die Langzeitsperren wegzustecken.

Analyse des Soll-Zustandes

Was sollte die Disziplinarmatrix eigentlich bezwecken? An der United3-Regel hatte die Designer die gewaltige Streuung gestört; außerdem waren kleine Härtestufen aufgrund der Gefahr heftiger Strafen für untauglich gehalten worden. Die bisher verwendete Disziplinarmatrix hatte dagegen den Einsatz von viel Härte sinnlos gemacht, während vorsichtiger Härteeinsatz zu stark belohnt wurde. Das war sicher - wenn überhaupt - nur eine bescheidene Verbesserung. Eher wohl gar keine.

Das Verfahren zur Bestimmung der Elfmeter betrachte ich als heilige United-Grundregel, die ich auf keinen Fall anrühren möchte, wenn es nicht unvermeidlich ist. Andererseits hauen gerade bei guter Hintermannschaft die Elfmeter furchtbar rein (siehe oben). Dies zu berücksichtigen soll jedoch eigentlich Sache der Manager sein. Und daß Hintermannschaften der Klasse T 8 / A10 und besser nicht der Durchschnitt des Ligasystems werden, daran sollte ein GM, der nicht bei jedem Spiel ausschließlich den Zufall entscheiden lassen will, ohnehin interessiert sein. Also bleibt es bei der bisherigen Elfmeterregelung.

Dafür spricht auch, daß Andre Bronswyk die Strafen gegen das hart spielende Team möglichst in aktuellen Spiel sehen möchte. Ich bin da zwar anderer Meinung (gerade die Verschiebung von 'Stärke' von einem Spiel in ein anderes halte ich für den entscheidenden Aspekt der Härte überhaupt), aber mit den oben erwähnten 50% wird solchen Wünschen hinreichend Rechnung getragen.

Elfmeter kosten Härtewirkung direkt proportional zur Anzahl der eingesetzten Härtepunkte. Würde dies für Rote Karten ebenfalls zutreffen, dann wäre in diesem Punkt Gleichheit zu United3 hergestellt. Und das möchte ich ja eigentlich: Der Einsatz von Härte soll in beiden Regelsystemen nach grundsätzlich ähnlichen Überlegungen erfolgen, damit sich ein Manager nicht umgewöhnen muß. Bloß die Streuung möchte ich etwas im Griff behalten.

Abschätzung der genauen Werte

Der Rest der Bestrafung findet also in Form Gelber bzw. Roter Karten statt.

Hierbei sind die Formeln für beides nach der Oberfoul-Regel leider ziemlich komplex miteinander verbunden. Die Tendenz ging dabei (im Vergleich zu United3) in Richtung von mehr Gelben und weniger Roten Karten bei niedriger Härte. Wenn nun also beim Einsatz weniger Härtepunkte das Strafmaß bei Roten Karten auf United3-Niveau erhöht wird, dann gibt es bestimmt zu viele Gelbe Karten. Wir werden dies zu berücksichtigen haben.

Wieviel Rest-Nutzen soll nun aber übrigbleiben? Mit den Werten von United3 (nach dem letzten Ansatz 25%) bin ich doch etwas unzufrieden; andererseits bleibt kaum mehr ein Spielraum nach oben. Wenn ich 30% Restwirkung haben will, dann sind Elfmeter bereits 2.5 mal so wichtig wie Platzverweise, bei 25% nur doppelt so schlimm.
Da ich aber mit zu vielen Gelben Karten rechne, setze ich dennoch 30% Restwirkung der Härte an. Das heißt also, daß durch die Gefahr von Roten Karten 20% der eingesetzten Härtepunkte aufgewogen werden sollen.

Tabellen-Chirurgie

Da ich aus früheren Artikeln die entsprechenden Zahlen besitze, könnte ich nun eine Tabelle zusammensetzen, die diesem Ideal möglichst nahe kommen würde.

Diese Tabelle sähe aber ähnlich unlogisch aus wie die Kieler Neuerfindung. Also setze ich mir ein paar zusätzliche Ziele:

Da Ereignisse der Form '1 Strafe' für die Bestimmung der Erwartungswerte von Roten Karten unberücksichtigt bleiben können, werde ich solche Tabelleneinträge zum Nachkorrigieren des Erwartungswertes für Gelbe Karten verwenden können. Zur Erinnerung die Umrechnungseinheit: Eine Rote Karte wurde im Durchschnitt mit einem Verlust von 4.5 WP im laufenden Spiel veranschlagt.

Erster Versuch

Härte 1 soll 0.2 WP an Roten Karten kosten. Das wären also 0.044 rote Karten. Das könnten 4 Einträge mit 2 Strafen sein, oder je ein Eintrag mit 2 bzw. 3 Strafen.

Andererseits möchte ich aber im Schnitt nur 0.3 gelbe Karten haben. Bei niedrigen Härtestufen werden sich beide Ziele schlecht vereinbaren lassen.

Da ich keine Sprünge in der Tabelle haben will, kann ich nun über 0-0-0-0-0-0-0-1-2-3 oder 0-0-0-0-0-0-0-0-1-2 nachdenken. Die erstgenannte Spalte kommt bei Roten, die zweitgenannte bei Gelben Karten besser hin. Wir werden sehen müssen, wie die Tendenz lautet - bei mehr Härte kann man besser modellieren. Anscheinend ist es also sinnvoll, oben anzufangen.

Härte 10

Bei Härte 10 wären das also dann 2 WP oder etwas mehr, also knapp 0.5 Platzverweise im Schnitt. Der bisherige Tabellenwert liegt mit 3.051 WP deutlich höher. Es scheint wohl am einfachsten zu sein, die entsprechende Tabellenspalte etwas abzumagern.

Soll der Maximalwert von 6 Strafen, d. h. bis zu 3 Platzverweisen, erhalten bleiben? Wenn möglich ja. Mal sehen, ob wir dann überhaupt hinkommen. Was kostet denn so ein Tabelleneintrag? 0.45 WP mal dem entsprechenden Erwartungswert an Roten Karten. In Tabellenform sieht das folgendermaßen aus:

Anzahl der Strafen: 123456
Wahrscheinlichkeit für Rot: 0.0000.1000.2800.5230.8151.143
Kosten an WP pro Tabelleneintrag: 0.0000.0450.1260.2350.3670.514

Die Zeile 3-4-4-4-4-5-5-5-5-6 muß nun also abgerüstet werden. Wenn keine 2 hineinkommen sollte, dann dürfte sie minimal 3-3-3-3-3-3-3-4-5-6 werden, was aber nicht schön aussieht, obwohl es mit 1.998 WP phantastisch gut hinkommen würde. Wenn das Minimum auf 2 Strafen sinken würde, dann käme die Spalte 2-2-2-3-3-3-4-5-5-6 mit 1.996 WP am besten hin - die merken wir uns.

An Gelben Karten waren im Schnitt 3 angestrebt - die erste Tabellenspalte bewirkt 3.6, die zweite immer noch 3.5 Gelbe Karten. Das ist etwas zu viel. Um dies zu ändern, können die kleinsten Tabellenwerte auf 1 gesetzt werden, was am EW:Rot wenig ändert. Das würde allerdings die mögliche Streuung wieder in die Höhe treiben.

Härte 9

... sollte vielleicht keine 6 Strafen mehr erlauben. Tut die bisherige Tabelle ja auch nicht. Mehr als ein Eintrag mit 5 Strafen wird den Schnitt wohl kräftig heben - mehr als 2 verbieten sich fast von selbst. Mit Raten und Nachschönen kommen wir auf 2-2-2-3-3-4-4-4-5-5 mit 1.826 WP. Statt 2.7 Gelber Karten kommen 3.5 heraus - das ist happig. Offenbar kommen wir doch nicht ohne größere Streuung aus? Auch hier muß wohl wenigstens ein Tabelleneintrag mit 6 Strafen her.

Intermezzo

Nun denn: Bevor ich überhaupt keine DI-Matrix hinbekomme, die United3 in der Wirkung ähnelt, versuche ich es mit Entgegenkommen. In diesem Falle bedeutet dies: etwas mehr Streuung.

Die gesamte Probiererei mache ich nur noch selbst und lasse die Leser die fertigen Ergebnisse bestaunen.

Eine neue Disziplinarmatrix?

Anzahl der
Härtepunkte
Geplante Anzahl Erreichte Anzahl Tabellenspalte der neuen
Disziplinarmatrix
Gelb Rot-WP Gelb Rot-WP
10.30.20.60.1710-0-0-0-0-0-0-1-2-3
20.60.41.10.3420-0-0-0-0-1-2-2-3-3
30.90.61.50.5770-0-0-0-1-2-2-3-3-4
41.20.81.80.7670-0-0-1-1-2-3-3-4-4
51.51.02.10.9440-0-1-1-2-2-3-3-4-5
61.81.22.41.1850-1-1-1-2-2-3-4-5-5
72.11.42.61.3770-1-1-2-2-2-3-4-5-6
82.41.62.91.5310-1-2-2-2-3-4-4-5-6
92.71.83.21.7801-1-2-2-3-3-4-5-5-6
103.02.03.51.9962-2-2-3-3-3-4-5-5-6

Kontrolle

Stimmt das denn nun alles? In den Werten, die zur Bestimmung der zu erwartenden WP-Verluste verwendet wurden, steckt eine Annahme drin, die vermutlich nicht allgemeingültig ist: Es wird nämlich davon ausgegangen, daß immer auf alle 10 Spieler außer dem Torwart Härte eingesetzt wird.

Sinnvoller wäre es wohl, über alle möglichen Härteeinsätze zu mitteln. Bloß: Wo bekommt man dafür die Zahlen her? Ah - da war doch dieses Programm von Martin Ahlemeyer, das muß dies eigentlich können. Gesagt, getan, neue Matrix eingetippt, Programm angeworfen - und es kommen folgende Ergebnisse heraus (wobei ich auf den Torwart keine Härte eingesetzt habe):

Härtepunkte: 12345678910
Geplanter Verlust: 0.2000.4000.6000.8001.0001.2001.4001.6001.8002.000
bei Härte auf 10: 0.1710.3420.5770.7670.9441.1851.3771.5311.7881.996
mittlerer Verlust: 0.1830.3660.6140.8141.0061.2461.4441.6921.9112.096

Warum denn das? Nun, das liegt an folgender allgemeiner Erkenntnis: Die Gefahr für Rote Karten ist genau dann am größten, wenn Härte auf 3 oder 4 Spieler eingesetzt wird. Bei Härte auf 10 Spieler verteilen sich die Karten gleichmäßiger; bei Härte auf nur einen Spieler gibt es zwar einen einzelnen höher gefährdeten, aber dennoch selten getroffenen Spieler (das ist etwa so gefährlich wie Härte auf 7-8 Spieler). Die Schwankungen im Erwartungswert für rote Karten liegen etwa bei 10%.

Nächste Iteration

Wo kann man also noch dran drehen?

Härte 8 bis 10 liegen mir etwas zu deutlich über dem Schnitt; diese Werte möchte ich noch etwas senken. Wenn man in der Tabelle einen hohen Eintrag um 1 senkt und dafür einen niedrigen um 1 anhebt, dann bleibt der Erwartungswert für Gelbe Karten erhalten, der Erwartungswert für Rote Karten dagegen sinkt (da hohe Werte einen stärkeren Einfluß auf den Schnitt haben). Zudem will ich immer noch keine Sprünge in der Tabelle haben.

Fast automatisch korrigiert sich die Matrix nun auf das folgende Aussehen:

Eine neue Disziplinarmatrix!

Anzahl der
Härtepunkte
Geplante Anzahl Erreichte Anzahl Tabellenspalte der neuen
Disziplinarmatrix
Gelb Rot-WP Gelb Rot-WP
10.30.20.60.1830-0-0-0-0-0-0-1-2-3
20.60.41.10.3660-0-0-0-0-1-2-2-3-3
30.90.61.50.6140-0-0-0-1-2-2-3-3-4
41.20.81.80.8140-0-0-1-1-2-3-3-4-4
51.51.02.11.0060-0-1-1-2-2-3-3-4-5
61.81.22.41.2460-1-1-1-2-2-3-4-5-5
72.11.42.61.4440-1-1-2-2-2-3-4-5-6
82.41.62.91.6171-1-1-2-3-3-3-4-5-6
92.71.83.21.8641-1-2-3-3-3-4-4-5-6
103.02.03.42.0471-2-2-3-3-3-4-5-5-6

Interpretation der Ergebnisse

Wie man es auch dreht und wendet: Es ist nicht nur eine neue Matrix, sondern auch wieder eine Interpretation dessen geworden, was ich unter Härte verstehe.

In Sachen 'sofortige Bestrafung' bin ich in allen Bereichen gut an das vorgegebene Ziel herangekommen. Wenn man keine Stufen in der Tabelle haben will, dann bekommt man aber einfach zu viele kleine Tabelleneinträge, die nur noch für die Bestimmung der Gelben, nicht aber der Roten Karten von Bedeutung sind.

An dieser Stelle muß man sich, wie bei jedem trade-off, entscheiden, welches der einander widerstrebenden Ziele man mit höherer Priorität verfolgen will. Und an dieser Stelle habe ich festgestellt, daß die neue Tabelle meinen Vorstellungen von Härte ziemlich gut entspricht.

Während nun also der Einsatz von Härte in Bezug auf seine sofortige Wirkung in praktisch jeder Höhe eine Berechtigung hat, ist die Langzeitwirkung aufgrund der Gelben Karten ein wenig verschärft worden. Dafür liegen die Rot-Strafen bei Härte 1 und 2, wo es besonders viele Gelbe Karten gibt, auch unter dem Durchschnitt.

Die neue Disziplinarmatrix bewirkt, daß ein Manager, der permanent Härte einsetzen will, nun mit einer größeren Anzahl von Sperren - sowohl aufgrund Gelber als auch aufgrund Roter Karten - rechnen muß als zuvor; daher ist ein 12., eventuell gar ein 13. Spieler auf der Bank jedem Manager anzuraten. Dies wird die Verflüssigung des Vereinsvermögens in der letzten Handelsrunde wohl etwas bremsen; auch werden Schrottspieler als Härtereserve hoffentlich im Kurs etwas steigen. Da in AUFSTIEG Schrottspieler wie ein X III 4 weder privat (gibt's nicht) noch über die Transferliste (nur Spieler, die auf 0 oder mehr altern) gehandelt werden können, muß sich dort jeder Manager bereits bei Saisonbeginn überlegen, welche Spieler er behalten und welche er wegwerfen will.