FANDOM


Bemerkung: Der folgende Text bezieht sich auf grundlegende statistische Mängel in der Durchführung des Stresstestes. Dieser Artikel berührt mehrere Teilbereiche des sma Audits, insbesondere Arbeitsperimeter und Abstimmung der Systemgrenzen (Seite 020), Umgang mit Anschlüssen (Seite 129), Durchführen der Simulation (Seite 147), Verwendung der Reservezeiten zum Verspätungsabbau (Seite 153), Ur- und Einbruchsverspätungen (Seite 157), daher ist es sinnvoll, diese Problematik ausserhalb der einzelnen Steckbriefe zu diskutieren.

Statistische Annahmen über StörfälleBearbeiten

  • Größere Störungen kommen nur über die sogenannten Einbruchsverspätungen
    an den Systemgrenzen in das System, siehe Ur- und Einbruchsverspätungen (Seite 157).
  • Der Eintrag von Störungen im Betrachtungsraum selbst (Urverspätungen) ist sehr gering und kleiner als der am einzelnen Haltepunkt als möglich angenommene Verspätungsabbau, siehe ebenfalls Ur- und Einbruchsverspätungen (Seite 157).
  • Verspätungseintrag im Betrachungsraum sind daher primär durch Trassenkonflikte ausgelöst.
  • Alle Störungen werden als statistisch unabhängig angenommen! Siehe hierzu den exzellenten Kommentar von Bluesbrother auf Seite 157, der weiter unten noch einmal wiedergegeben ist.

Kritik an den statistischen AnnahmenBearbeiten

  • Züge bewegen sich im Modell weitgehend deterministisch durch den Betrachtungsraum, so dass Dispositionsentscheidungen weitgehend optimal getroffen werden können. In der Realität ist auch inerhalb des Betrachungsraumes mit dem gesamten Spektrum an Verzögerungen zu rechnen.
  • Im Modell werden nachfolgende Züge von vorausfahrenden mit großer Wahrscheinlichkeit nicht ausgebremst. In der Realität sammelt aber der vorausfahrende Zug mehr Passagiere ein als der Nachfolgende!
  • Einbruchsverspätungen werden im Modell auf langen Zuläufen schon signifikant vor erreichen der Engstellen abgebaut. In der Realität werden Verspätungen in der Morgenstude durch stetiges Füllen der Züge im Zulauf auf Stuttgart eher ansteigen.
  • Es gibt relativ wenige sehr stark verspätete Züge. Auch das ist nicht realistisch.
  • Das Modell kann die angenommenen Einbruchverspätungen an der Grenze des Betrachungsraumes nicht selbstkonsistent erklären: würde man den Betrachtungsraum vergrößern, so würden die Verspätungen im Mittel an den jetzigen Grenzen zurückgehen. Daher führt ein großer Betrachtungsraum in der Modellrechnung zu besseren Resultaten.
  • Die zu erwartende Aufenthaltsdauer einzelner Züge in kritischen Abschnitten der Infrastruktur wird stark bis massiv unterbewertet.
  • Mittelwerte der Verspätungsstatistik verhalten sich trotz allem weitgehend plausibel, andere Parameter wurden nicht untersucht.

Es ist denkbar, dass allein die Umlage der Einbruchverspätungen auf statistisch hinreiched korrelierte Urverspätungen bei Beibehaltung aller anderen (teilweise durchaus ebenfalls zu optimistischen) Parameter schon zu einem Kippen des Gesamtsystems führen kann.

Anschauliche Erklärung des Problems der statistischen UnabhängigkeitBearbeiten

(Wörtliche Übernahme eines Kommentars Bluesbrother von Seite 157. Layout nachbearbeitet)

Ich habe eine Weile grübeln müssen, bis mir der zentrale methodische Fehler der Stresstestsimulation klar geworden ist. Ich versuche es so zu formulieren, dass es auch Nicht-Mathematiker verstehen.

Die Simulation arbeitet mit zwei unterschiedlichen Verspätungstypen. Dies sind die sogenannten Einbruchverspätungen und die Urverspätungen.

  • Die Urverspätungen werden so abgebildet, dass sich die Haltezeiten in den Bahnhöfen verlängern. Man kann kritisieren, dass man die Verspätungen nicht den Störungen verschiedener Elemente wie dem Fahrgastaufkommen, den Türen, Fahrzeuge, Weichen oder Signalen zuordnet hat und seltene, größere Störungen überhaupt nicht abgebildet sind. Ich halte die vorgenommene Pauschalierung aber durchaus für akzeptabel, wenn man bei der Parametrisierung auf der sicheren Seite ist. Vermutlich gibt es auch keine Software, die das könnte. Aber darum geht es mir nicht. Die angesetzten Werte sind auch etwa in Ordnung. Das zentrale Problem ist, dass die Urverspätungen als voneinander unabhängige zufällige Ereignisse angesehen werden. Das heißt bei jedem Halt wird “gewürfelt” ob eine - und wenn ja in welcher Höhe - eine Halteszeitverlängerung angenommen wird. Die Wirklichkeit verhält sich aber nicht nach dieser Gesetzmäßigkeit. Es gibt - jenseits des Zufalls – verschiedene Gründe, warum Züge, die verpätet sind, immer mehr Verspätung erhalten. Verspätungen durch Anschlüsse, Fahrstrassenausschlüsse und ähnliches klammere ich völlig aus und betrachte nur den einzelen Zug. Dann gibt es zwei Hauptursachen:
    1. Die Verspätungen eines Zuges an allen (oder einigen) Halten haben die gleiche Ursache. Einfach verständlich ist das Problem der Türstörung. Für die Erststörung einer Türe kann man eine gewisse Zufallswahrscheinlichkeit annehmen. Die Wahrscheinlichkeit, dass beim nächsten Halt die gleiche Türe wieder klemmt, hat haber eine sehr viel höhere Wahrscheinlichkeit als die Erststörung. Auch bei einer blockierten Türe verzögert diese den Fahrgastwechsel nicht zufällig, sondern dieser dauert grundsätzlich bei jedem Halt länger. Auch beim Zustieg von Gruppen, Fahrgästen mit Gepäck, Rollstühlen, erhöhtem Fahrgastaufkommen infolge von Ereignissen außerhalb des Eisenbahnsystems gilt die statistische Wahrscheinlichkeit nur für das Erstereignis. An den Folgehalten sind aber weitere Verspätungen nicht nur zufällig, sondern in kausaler Abhängigkeit vom Erstereignis (zum Beispiel, weil die Gruppe oder Rollstuhlfahrer wieder aussteigen möchte).
    2. Die Verspätung eines Zuges ist die Ursache für weitere Verspätungen Dieses Phänomen tritt regelmäßig im S-Bahn-Verkehr mit dichten Takten auf. Die Fahrgäste kommen zu einem gewissen Teil zufallsverteilt zur Haltestelle (die anderen schauen auf die Uhr). Bei einem 5-Minuten-Takt (durch Linienüberlagerung) kommt also von dieser Fahrgastteilmenge jede Minute 1/5 an. Wenn eine Bahn eine Minute Verspätung hat (alle zuvor waren pünktlich), wollen 1/5 mehr Fahrgäste zusteigen. Entsprechend erhöht sich die Fahrgastwechselzeit An der nächsten Haltestelle sind dann aus 60s Verspätung schon 75s Verspätung geworden. Dieses Phänomen schaukelt sich immer weiter hoch und wird zu einer Art Bugwelle.
Wenn man bei der Simulation die wesentlich höheren Wahrscheinlichkeiten von weiteren Verspätungen für bereits verspätete Züge (egal aus welchem Grund) ignoriert macht man einen Fehler. Normalerweise fallen solche Fehler bei der Kalibrierung am Istzustand auf. Aber den verweigert die Bahn bekanntlich. Wenn man in das System – wie geschehen – Pufferzeiten geringfügig oberhalb der Höhe der durchschnittlichen Verspätungen einbaut, dann bauen sich die Verspätungen wieder ab. Genau das bildet das Ergebnis der Simulation ab. Die mathematische Aussage der aufwändigen Rechnung ist also so ähnlich wie eine Beweisführung, bei der 0 = 0 herauskommt.
Natürlich wird man dieser Argumentation entgegenhalten, dass die angewendetet Vorschrift dies doch sicherlich in irgendeiner Weise berücksichtigt. Sie tut es auch, und zwar durch die Einbruchverspätungen. Wer Einbruch- und Haltszeitverlängerungen vergleicht, stellt fest, dass für die Einbruchverspätungen wesentlich höhere Mittelwerte angesetzt sind. Da auch die einbrechenden Züge im nicht abgebildeten Vorlauf nichts anderes machen wie die Züge im betrachteten Netz – nämlich fahren und halten -, können aus wenigen einzelen Halteereignis im Vorlauf mit den angegebenen Mittelwerten niemals die Mittelwerte (und erst recht nicht die Maximalwerte) der Einbruchverspätung erwachsen. Die Einbruchverspätungen sind folglich nicht die statistische Summe der Haltszeitverlängerungen im nicht abgebildtetn Vorlauf, sondern diese berücksichtigen auch die oben beschriebenen Effekte eines Verspätungsaufbaus.
  • Wenn man also eine Netz/Fahrplan-Kombination untersucht, hat man von “Außen” die Einbruchverspätungen und “Innen” die Haltezeitverlängerungen. Das Verhältnis von “Außen” und “Innen” ist von der Größe des Netzausschnittes abhängig. Je größer, desto mehr “Innen”. Für Züge, die im Untersuchungsgebiet beginnen, werden Abfahrsverspätungen angesetzt. Die Wahrscheinlichkeiten und Mittelwerte sind geringfügig höher aber ähnlich den Haltezeitverängerungen.
  • Das untersuchte Netz für S21 ist relativ groß. Ich vermute, das mit dieser Methode noch nie ein so großes und komplexes Netz simuliert worden ist. Damit wird aber der Anwendungsbereich der Vorschrift/Methodik verlassen. Bei einem kleineren Netz würden die Einbruchverspätungen das Geschehen dominieren; die Haltezeitverlängerungen hätten nur einen geringen Einfluss. Ungenauigkeiten an dieser Stelle könnten vernachlässigt werden. In den Einbruchverspätungen sind die kummulierenden Verspätungseffekte ausreichend abgebildet. Die so berechneten Ergebnisse wären methodisch in Ordnung. Auf diesen Fall ist die Methodik abgestimmt. Die Absicht, es möglichst gut und genau und nicht angreifbar zu machen, hat im vorliegenden Fall dazu geführt, dass man das betrachtete Netz sehr weit ausgedehnt hat. Das führt dazu dass die Einbruchsverspätungen der (relativ wenigen) einbrechenden Züge durch die Puffer entlang der langen Strecken gut abgebaut werden können. Die Pufferzeiten sind in richtiger Weise in einer Proportinalität zur Grundfahrzeit angesetzt worden. Die Verspätung-aufbauenden Effekte werden aber in nicht korrekter Weise bestimmt, da vor allem bei vielen Halten eines Zuges im betrachteten Netzausschnitt die kausalen Verkettungen von Verspätungsursachen keine zu vernachlässigende Größe mehr sind. Das hat SMA nicht erkannt (oder wollte es nicht erkennen). Der Fehler ist fatal und macht die gesamte Simulation nahezu wertlos. Es ist mit hoher Wahrscheinlichkeit anzunehmen, dass bei einer Berücksichtigung von nicht-zufälligen Verspätungen in Folge von zufälligen Urverspätungen sich die Verspätungssituation anders darstellen würde und der Fahrplan in den Simulationsläufen mehrmals “kippen” würde.
    • Praktisches Beispiel: Ein Regionalzug fährt eine Strecke von 30 min mit 10 Halten. In der Fahrzeit ist ein Puffer von 3 Minuten enthalten. Dieser Zug wird in 100 Simulationsläufen berechnet. Für jeden Halt wird per Zufallsgenerator bestimmt, ob eine Haltezeitverlängerung erfolgt. Die Vorgabe ist, dass eine Haltezeitverlängerung in 10% der Fälle vorkommt. Bei einem Durchschnittswert von 1 Minute, beträgt die Haltezeitverlängerung in 65% (von 10%) der Fälle weniger als 1 Minute, und nur in 5% (von 10%) der Fälle ist die Haltezeitverlängerung größer als 3 min. Wenn man den Puffer gedanklich vor die Endhaltestelle legt, wäre dieser Zug in etwa 1,5% der Fälle minimal verspätet, weil der Puffer nicht ausreichet, d.h. nach Zufälligkeit wahrscheinlich in einem oder zwei Simulationsläufen. Korrekt wäre aber folgende Betrachtung: Nach dem Eintritt einer zufälligen Haltestellenverlängerung gilt für alle folgenden Halte eine (geschätzt: 5-fach) erhöhte Wahrscheinlichkeit für weitere Haltezeitverlängerungen. Da es aber insgesamt nicht mehr Haltezeitverlängerungen gibt (die Vorgabe beruht ja auf Beobachtungen) verändert sich nur die Wahrscheinlichkeit, dass der Zug mehrmals länger Halten muß. Das führt zu einer Spreizung des Ergebnisses: Der Anteil der Fälle, bei denen es bei keinem Halt eine Haltezeitverlängerung gibt nimmt zu, gleichzeitig nimmt auch der Anteil Fälle zu, bei denen mehrfach Haltezeitverlängerungen auftreten. Bei diesen tritt dann der Fall ein, dass die Puffer nicht ausreichen und der Zug mit echter Verspätung am Ziel ankommt. So ähnlich ist auch die Realität.
  • Notwendig ist es natürlich auch auf sie sogenannten “Deadlocks” (dt.: "Verklemmungen") hinzuweisen. Es ist natürlich richtig, dass es bei einer Simulation immer vorkommen kann, dass sich das System aufhängt. Wenn man Pkw-Verkehr simuliert, würde dieser Fall eintreten, wenn an einer rechts-vor-links-Kreuzung aus allen Richtungen gleichzeitig Fahrzeuge kommen. Für diesen Fall gibt es keine Regel. Im echten Leben würde gehupt und gewunken. Normalerweise sind Deadlocks aber ein Hinweis, dass ein System wegen partieller Überlastung in die Knie geht, z.B. weil sich mehrere Züge gegenseitig so blockieren, dass nur noch “rückwärts” raus ginge. Naturlich kann man das im echten Leben durch Disponenteneingriff verhindern. Aber fast immer nur um den Preis von weiteren Störungen und Verspätungen. Bei der S21-Simulation mussten 3 von 100 Simulationsläufen mit einem Deadlock abgebrochen werden. Das kann passieren. Ich finde es aber nicht korrekt, wenn diese in der statistischen Auswertung nicht berücksichtigt werden. Korrekt wäre, den unvollständigen Lauf auszuwerten und den nicht abgearbeiteten Rest der Züge mit einem Maximalwert zu versehen.

Einbruchverspätungen und Urverspätungen auf freier StreckeBearbeiten

Hier noch eine Rechnung, die eventuell für Experten interessant ist, da sie noch etwas quantitative Präzision in die der Verspätungsstatistik zugrundeliegenden Annahmen bringt. Die wesentlichen Schlussfolgerungen sind bereits weiter oben beschrieben.

Wenn man für die Urverspätungen ebenfalls eine Exponentialverteilung annimmt (eine solche wird in der Simulation für Einbruchverspätungen verwendet, für Urverspätungen ist die Wahrscheinlichkeitsverteilung im Audit nicht genannt), so kann man die komplette Wahrscheinlichkeitsverteilung, die aus den Modellannahmen folgt, auf freier Strecke (d.h. ohne Trassenkonflikte) komplett analytisch ausrechnen. Die Formeln sind kompliziert und nur per Computeralgebrasystem zu handhaben, daher werde ich auf die Details nicht weiter eingehen, kann aber bei Interesse gerne die Rechnung aufbereiten und schicken.

Um die Sache zu illustrieren, habe ich die Strecke Tübingen-Plochingen herausgenommen, die in 6 Stationen abgefahren wird und wo wohl mit großer Wahrscheinlichkeit ein "freier" Verspätungsabbau stattfindet. Die Züge fahren in Tübingen bereits mit einer relativ hohen Einbruchverspätung los (da die Linie in Tübingen anfängt, sollte man hier eigentlich eine Abfahrtverspätung verwenden, aber die auf Seite 164 beschriebenen Verspätungsmittelwerte sind mit einer angenommenen regulären Einbruchverspätung in Tübingen sehr gut konsistent), in Reutlingen wird erst der Verspätungspuffer aufgebraucht, dann eine neue zufällige Urverspätung aufaddiert. (Diese Reihenfolge ist eine weitere Annahme, da mir nicht klar ist, in welcher Reihenfolge das Modell vorgeht. Da ich die Verspätungsabbauzeit grob kalibriere, glaube ich nicht, dass dies ein entscheidender Punkt ist.) Und so weiter.

Die zum Verspätungsabbau zur Verfügung stehende Zeit schätze ich auf 35s pro Zwischenhalt, dann kommt man in etwa auf die auf Seite 164 beschriebe 1 Minute Abbau mittlerer Verspätung zwischen Tübingen und Plochingen. Alle anderen Größen sind wie auf Seite 157 beschrieben.

Wir erhalten an Verspätungen (in Sekunden):

             Mittelwert  Standardabweichung
Tübingen     162         247
Reutlingen   148         239
Metzingen    136         231
Nürtingen    124         223
Wendlingen   114         215
Plochingen   104         207

Man kann auch die gesamte Wahrscheinlichkeitsverteilung der verspäteten Züge plotten (das Integral über jede der Kurven ist kleiner als 1 weil ja auch die pünktlich fahrenden Züge eine positive Wahrscheinlichkeit haben), die am flachesten verlaufende Kurve ist Tübingen:

Plot1.png


Spannend ist, die gleiche Rechnung bei pünktlicher Abfahrt in Tübingen zu machen:

             Mittelwert  Standardabweichung
Tübingen      0           0
Reutlingen    6          26
Metzingen     9          33
Nürtingen    11          36
Wendlingen   13          38
Plochingen   13          40

Und wieder die komplette Wahrscheinlichkeitsverteilung der verspäteten Züge (Kurven aufsteigend bis Plochingen)

Plot2.png

Vergleicht man die beiden Rechnungen, so sieht man, wie gering der Verspätungseintrag durch die Urverspätungen ist. Zum Vergleich: im Audit auf Seite 164 steht, dass die wirkliche Verspätung von 0 in Tübingen auf 1 Minute in Plochingen ansteigt. D.h. die dem Modell zugrundeliegenden Urverspätungen unterschätzen den Verspätungseintrag innerhalb des Sytems massiv! Wir stellen fest, dass die Verspätungsstatistiken auf den Zulaufstrecken nur deshalb plausibel erscheinen, weil die Züge relativ lange ihre anfängliche Einbruchverspätung mit sich führen, die aber auch im Zulauf auf Stuttgart langsam abgebaut wird und vor dem ersten Engpass minimal wird!

Innerhalb des Simulationsgebietes bewegen sich die Züge fast deterministisch. Dadurch ist anzunehmen, dass sich das Problem von Trassenkonflikten in der Simulation signifikant entschärft, weil nach einem einmal gelösten Trassenkonflikt beide Züge wieder praktisch frei fahren werden.

Störung durch Adblocker erkannt!


Wikia ist eine gebührenfreie Seite, die sich durch Werbung finanziert. Benutzer, die Adblocker einsetzen, haben eine modifizierte Ansicht der Seite.

Wikia ist nicht verfügbar, wenn du weitere Modifikationen in dem Adblocker-Programm gemacht hast. Wenn du sie entfernst, dann wird die Seite ohne Probleme geladen.

Auch bei FANDOM

Zufälliges Wiki