Manfred Börgens
Mathematische Probleme  # 53
Liste aller Probleme mit Lösungen
voriges Problem      nächstes Problem
zur Leitseite


Wieviele Spiele ?


Im Monatsproblem Juli/August 2001 wurde die Frage diskutiert, bei welcher Anzahl von Spielen der schwächere Spieler die besten Aussichten auf den Gesamtsieg hat. Das Resultat kann man so zusammenfassen:

Zwei Spieler bestreiten eine Serie von Einzelpartien, die kein Unentschieden zulassen. Die Spielstärke der beiden ist nicht gleich: Der schwächere Spieler gewinnt mit Wahrscheinlichkeit  p < 1/2 , der stärkere mit  q > 1/2 .

Falls eine ungerade Anzahl  N = 2n + 1  von Spielen vereinbart wird, sinkt die Chance für den Gesamtsieg des schwächeren Spielers streng monoton mit wachsendem  n . Er hätte also die besten Aussichten, wenn nur ein einziges Spiel stattfände (d.h.  n = 0 ).


Für dieses Problem gibt es eine interessante Verallgemeinerung, deren Lösung nicht so leicht vorhersehbar ist wie im oben dargestellten Fall. Es soll nämlich jetzt auch eine gerade Anzahl  N = 2n  von Spielen erlaubt sein. Dann können natürlich auch Unentschieden bei der Gesamtwertung vorkommen.

Bei den folgenden Fragen soll der Spieler A jede Einzelpartie mit Wahrscheinlichkeit  p  gewinnen ( 0 < p < 1 ) und sein Gegner B mit Wahrscheinlichkeit  q = 1 - p .

1.
Sei  N  eine beliebige natürliche Zahl. Wie groß ist die Chance von A auf Sieg, Unentschieden und Niederlage in der Gesamtwertung?

2.

Sei  N  eine beliebige natürliche Zahl. Für welches  N  sind die Aussichten von A auf den Gesamtsieg am besten?

Nun kommt die Kernfrage  -  mit einer nur schwer zu erratenden Lösung.
3.
Sei  N  gerade. Für welches  N  sind die Aussichten von A auf den Gesamtsieg am besten?

4.

Diskutieren Sie das Monotonie- und Grenzwertverhalten der Wahrscheinlichkeiten für Sieg, Unentschieden und Niederlage.
Tipp: Wenden Sie einen der Grenzwertsätze der Wahrscheinlichkeitsrechnung an.

5.
Eine naheliegende Variante entsteht durch die "Neutralisierung" der Unentschieden. Was ändert sich bei den Fragen 2 - 4, falls Unentschieden nicht gewertet werden?
Das kann man sich so vorstellen: Gewinnt A, erhält er einen Euro; verliert er, zahlt er einen Euro; bei Unentschieden fließt kein Geld. Wie maximiert A seinen Ertrag?

6.
Eine weitere Variante ergibt sich aus der Änderung der Spielregel: Was ändert sich bei den Fragen 2 - 4, falls auch ein Unentschieden schon zum Gesamtsieg von A ausreicht?







Lösung



Zu 1.

Die Anzahl der Siege für A ist binomialverteilt mit den Parametern  N  und  p . Die Wahrscheinlichkeit  wN  für seinen Gesamtsieg in  N  Spielen ist dann die Summe der Wahrscheinlichkeiten für mehr als  N/2  Siege. Sowohl für gerade  N = 2n  als auch für ungerade  N = 2n + 1  sind das mindestens  n + 1  Siege. Also gewinnt A mit folgender Wahrscheinlichkeit:

W'keit fuer Sieg des Schwaecheren

Ein Unentschieden kann nur für gerade  N  vorkommen, und zwar mit der folgenden Wahrscheinlichkeit:

W'keit fuer Unentschieden

Daraus ergibt sich die Wahrscheinlichkeit für eine Niederlage von A:

W'keit fuer Niederlage von A

Ein Beispiel:
Gewinnt ein Spieler im Mittel  40 %  aller Spiele und vereinbart mit seinem Gegner  15  Partien, so beträgt seine Chance auf den Gewinn der Serie nur  21,31 %. Werden  16  Partien vereinbart, so sinken seine Gewinnchancen auf  14,23 %; die Serie würde in  14,17 %  aller Fälle unentschieden enden.


Zu 2.

Für ungerade  N  können wir die Ergebnisse aus dem Monatsproblem Juli/August 2001 heranziehen. Bei  p = 1/2  spielt die Anzahl der Spiele keine Rolle, alle  wN = w2n+1  sind dann identisch gleich  1/2 . Für  p < 1/2  fällt die Folge der  wN  = w2n+1  streng monoton mit wachsendem  n , also liegt das Optimum bei  N = 1 . Für  p > 1/2  wächst  wN = w2n+1  streng monoton mit wachsendem  n , also gibt es kein Optimum; für einen solchen Spieler würde gelten: Je mehr Spiele, desto besser.

Lässt man beliebige  N  zu, so zeigt eine leichte Überlegung, dass die Chance auf einen Sieg in einer geraden Anzahl von Partien immer kleiner ist als bei den benachbarten ungeraden Anzahlen, d.h. es gilt  w2n+1 > w2n+2 < w2n+3  für alle  n . Zur ersten Ungleichung: Liegt man nach  2n + 1  Partien im Rückstand, so kann man maximal ein Unentschieden erreichen; führt man aber mit genau  n + 1  Siegen, kann man den Gesamtsieg mit einer Niederlage in der  (2n + 2)-ten Partie verspielen. Zur zweiten Ungleichung: Nach  2n + 2  gespielten Partien behält A auf jeden Fall seine Führung oder seinen Rückstand auch in der folgenden Partie; aber ein Unentschieden lässt sich in eine Führung verwandeln.  -  Generell sollte man also eine ungerade Anzahl von Spielen bevorzugen, und zwar möglichst viele bei  p > 1/2  und möglichst wenige bei  p < 1/2 .

Das wichtigste Resultat in diesem Abschnitt ist somit: Die Chancen des schwächeren Spielers, also bei  p < 1/2 , sind am größten, wenn nur ein einziges Spiel stattfindet:  N = 1 .


Zu 3.

Wir betrachten eine Serie von  N + 2 = 2n + 2  Spielen. Mit Wahrscheinlichkeit  p1  "dreht" sich das Gesamtergebnis in den letzten beiden Spielen zugunsten von A, nämlich wenn er genau  n  Siege aus den ersten  N  Spielen erzielt hat und dann die beiden letzten Spiele gewinnt. Mit Wahrscheinlichkeit  p2  "dreht" sich das Gesamtergebnis in den letzten beiden Spielen zuungunsten von A, nämlich wenn er genau  n + 1  Siege aus den ersten  N  Spielen erzielt hat und dann die beiden letzten Spiele verliert. In allen anderen Fällen, also mit Wahrscheinlichkeit  1 - p1 - p2 , gewinnt A genau dann in  N + 2  Spielen, wenn er in  N  Spielen gewinnt. Wir gehen vor wie im Monatsproblem Juli/August 2001 und berechnen  p1 - p2 :

Formel fuer p1-p2


Am Ende wurde zur Abkürzung   r= 1/1-2p  gesetzt. Für das Vorzeichen von  p1 - p2  müssen also  N  und  r - 1  verglichen werden.

p = 1/2
Hier muss natürlich die letzte Zeile der Berechnung weggelassen werden. Aus der dritten Zeile geht hervor, dass  p1 - p2 > 0 . Also wächst  wN  streng monoton mit wachsendem (geradem)  N .

p > 1/2
B  und  r  sind dann negativ. Deshalb gilt auch hier:  p1 - p2 > 0 , und  wN  wächst streng monoton mit wachsendem (geradem)  N .

p < 1/3
Dann ist  r < 3  und  p1 < p2  für alle  N = 2n . Also fällt  wN  streng monoton mit wachsendem (geradem)  N .

p = 1/3
Dann ist  r = 3  und  p1 = p2  für  N = 2 ,  p1 < p2  für  N > 2 . Also ist  w2 = w4  und ab  w4  fällt die Folge der  wN = w2n  streng monoton.

1/3 < p < 1/2
1. Fall:  r  ist keine ungerade natürliche Zahl.
Dann ist  p1 > p2  für  N < r - 1  und  p1 < p2  für  N > r - 1 . Also wächst die Folge  wN = w2n  erst streng monoton bis zu einem Maximum und fällt dann streng monoton. Das größte  N  mit  N < r - 1  ist gleich  [r] - 1 , falls  [r]  ungerade, und gleich  [r] - 2 , falls  [r]  gerade ( [.]  Gaußklammer). Da der "letzte" Anstieg in der Folge von diesem  N  nach  N + 2  erfolgt (siehe Definition  p1 - p2 ), liegt das Maximum der  wN  bei  [r] + 1  (falls  [r]  ungerade) bzw. bei  [r]  (falls  [r]  gerade).
2. Fall:  r  ist natürlich und ungerade. Für  N = r - 1  ist  p1 = p2 , also  wN = wN+2 . Für  N < r - 1  und  N > r - 1  gilt wieder  p1 > p2  bzw.  p1 < p2  wie im 1. Fall. Das Maximum der Folge der  wN  liegt somit bei  N = r - 1  und  N = r + 1 .

Das interessante Hauptergebnis ist:
Die optimale (gerade) Anzahl  N  von Spielen für den schwächeren Spieler hängt von seiner Spielstärke  p  ab. Für  p > 1/3  ist das optimale  N  nicht das minimale  N , sondern ein  N > 2  oder zwei benachbarte Werte von  N .

Zusammenfassung
Für eine gerade Anzahl  N  von Spielen und  p  1/2  gibt es kein optimales  N ; hier heißt die Devise: Je mehr Partien, desto besser. Für  p < 1/2  und  r = 1/1-2p  ist das gesuchte optimale  N , das  wN  maximiert:

Nopt  =   2                 p < 1/3
          2 und 4    
       p = 1/3
          [r]        
       p > 1/3, [r] gerade
          [r]
 +           p > 1/3, [r] ungerade, r nicht natürlich
          r
 - 1 und r + 1   p > 1/3, r natürlich und ungerade

Aus  p = 1/3  folgt  r = 3 , und aus  p < 1/3  folgt  r < 3 . Andererseits ist immer  r > 1 . Damit lässt sich die Zusammenfassung für  p < 1/2  komprimieren:

Nopt  =   [r]               [r] gerade
          [r]
 + 1           [r] ungerade, r nicht natürlich
          r
 - 1 und r + 1   r natürlich und ungerade


Bemerkung: Zwei optimale Werte für  N  kommen vor, wenn  r  positiv und ungerade ist. Beispiele gewinnt man aus  p = (r-1)/2/r , also z.B.  p = 12/25 = 0.48 .

Beispiel: Hat ein Spieler die Spielstärke  p = 0.42 , so beträgt für ihn die optimale Spieldauer  6  Partien; er gewinnt dann die Serie mit der (maximal möglichen) Wahrscheinlichkeit von  20,8 % .


Zu 4.

Das Monotonieverhalten von  wN  ergibt sich direkt aus den Überlegungen zu 2 und 3. In der Tabelle wird der Einfachheit halber bei "wachsend" und "fallend" der Zusatz "streng monoton" weggelassen.


Monotonie von  wN  p < 1/2 p = 1/2 p > 1/2
N  ungerade fallend gleich wachsend
N  gerade p < 1/3 : fallend
p = 1/3 : w2 = w4 , dann fallend
p > 1/3 : erst wachsend, dann fallend
      
     falls  r  ungerade : 2 Maxima
wachsend wachsend
N  beliebig oszillierend oszillierend oszillierend


Einige Beispiele sollen grafisch dargestellt werden (optimale Werte für  N  gerade in Rot):

Waagerechte Achse:  N
Senkrechte Achse: W'keit für Sieg von A

Grafik fuer p=.29
p = 0.29



Grafik fuer p=.4
p = 0.4



Grafik fuer p=.45
p = 0.45



Grafik fuer p=.5
p = 0.5



Grafik fuer p=.55
p = 0.55



Das Monotonieverhalten von  uN  für gerade  N = 2n  hängt nicht von  p  ab;  uN  fällt immer streng monoton. Dies zeigt sich, wenn man  uN+2/uN  ausrechnet:

Formel fuer u_N+2/u_N


Das Monotonieverhalten von  vN  ergibt sich aus den Überlegungen zu  wN . Denn der Spieler A verliert genau dann, wenn der Spieler B gewinnt; dieser Fall erfordert in der Tabelle für  wN  die Ersetzung von  p  durch  q = 1 - p  und entsprechend von  r  durch  r'=1/1-2q . Damit ergibt sich die folgende Übersicht:


Monotonie von  vN  p < 1/2 p = 1/2 p > 1/2
N  ungerade wachsend gleich fallend
N  gerade wachsend wachsend p > 2/3 : fallend
p = 2/3 : v2 = v4 , dann fallend
p < 2/3 : erst wachsend, dann fallend
      
     falls  r'  ungerade : 2 Maxima
N  beliebig oszillierend oszillierend oszillierend




Für das Grenzwertverhalten der berechneten Wahrscheinlichkeiten werden wir eine Lösung mit Hilfe eines einfachen Grenzwertsatzes angeben. Vorher jedoch soll die Approximation der Binomialverteilung durch die Normalverteilung herangezogen werden, um näherungsweise einen ersten Überblick zu gewinnen. Die Binomialverteilung  B  mit den Parametern  N, p  wird für große  N  durch die Normalverteilung  Nμ2  mit den Parametern  μ = N·p  und  σ2 = N·p(1-p)  = N·p·q  approximiert. Insbesondere gilt dann:

Approximation der Binomialverteilung durch die Normalverteilung

Daraus folgt:

w-N mit Approximation der Binomialverteilung durch die Normalverteilung

Wir betrachten nun die untere Integrationsgrenze; zur Abkürzung wird  D = (2pq)-1/2  gesetzt:

Untere Integrationsgrenze

Grenzwert von w_N


Grenzwert von u_N

Der Grenzwert für  vN  ist dann offensichtlich; man muss nur bei  wN  "kleiner" und "größer" vertauschen.

Nun soll ein exakter Beweis für diese Grenzwerte gegeben werden. Dafür geben wir zunächst einen der Grenzwertsätze der Wahrscheinlichkeitsrechnung und die Stirling'sche Formel an:

Grenzwertsatz

Xk  seien Zufallsvariable mit Erwartungswert  μ  und Standardabweichung  σ . Die Zufallsvariable  SN  sei das arithmetische Mittel  ( X1 + ... + XN )/ N . Dann gilt für  N -> ∞ :

lim p(| SN - μ |  ε ) = 0  für alle  ε > 0 .

Stirling'sche Formel

n! = (2 π n)1/2·nn·e-n·δ  mit  1  δ  e1/12n

Setzt man  Xk = 1 , falls Spieler A das  k-te Spiel gewinnt, und  Xk = 0 , falls A das  k-te Spiel verliert, so ist  μ = p , und  SN  gibt den relativen Anteil von Siegen von A in  N  Spielen an.

p < 1/2
wN = p( X1 + ... + XN > N/2 ) = p( SN > 1/2 )  p(|SN - p| > 1/2 - p ) .
Nach dem Grenzwertsatz gilt für  N -> ∞   lim p(wN) = 0 .

p > 1/2
wN = 1 - p( X1 + ... + XN ≤ N/2 ) = 1 - p( SN  1/2 )  1 - p(|SN - p|  p - 1/2 ) .
Nach dem Grenzwertsatz gilt für  N -> ∞   lim p(wN) = 1 .

p = 1/2
Für N ungerade ist  wN = 1/2  wegen der Symmetrie der Binomialverteilung bei  p = 1/2 . Für  N  gerade betrachten wir zuerst die Wahrscheinlichkeit für ein Unentschieden:

Formel fuer u_N bei p=.5

Daraus folgt für  N -> ∞  lim p(uN) = 0  und wegen der Symmetrie der Binomialverteilung  lim p(wN) = 1/2 .

Zusammengefasst gilt für  N -> ∞ :

lim p(wN) =  0    p < 1/2
          = 1/2   p = 1/2
          =  1    p > 1/2

lim p(uN) =  0

lim p(vN) =  1    p < 1/2
          = 1/2   p = 1/2
          =  0    p > 1/2




Zu 5.

Hier ist die Antwort einfach, denn der erwartete Ertrag ist in  2n + 1  Spielen der gleiche wie in  2n + 2  Spielen; die Folge der Erträge in Abhängigkeit von  N  ist monoton mit paarweise gleichen Werten. Begründung: Nur wenn A von den ersten  2n + 1  Spielen genau  n  oder  n + 1  gewonnen hat, kann sich im nächsten Spiel für ihn noch etwas ändern, nämlich dass die Gesamtserie von  2n + 2  Spielen Unentschieden ausgeht. Analog zu den Überlegungen unter 3 trete der erste Fall mit Wahrscheinlichkeit  p1  (Gewinn 1 Euro) und der zweite mit  p2  (Verlust 1 Euro) auf. Dann ist (man beachte die Gleichheit der beiden Binomialkoeffizienten):

Formel fuer p1-p2

Der erwartete Ertrag ist für  N = 2n + 1  und  N = 2n + 2 :  1·w2n+1 + (-1)·w2n+1 = 2·w2n+1 -1 . Monotonie- und Grenzwertverhalten folgen also im Wesentlichen (d.h. bis auf paarweise Gleichheit der Folgenglieder) dem Fall  N  ungerade in 2 - 4.

Der schwächere Spieler sollte also möglichst wenige, der stärkere möglichst viele Partien anstreben.


Für  p = 0.33  wird das Ergebnis  -  also der erwartete Ertrag für Spieler A  -  grafisch dargestellt:

Grafik fuer p=.45
p = 0.33


Zu 6.

In 2 - 4 wurde das Spiel aus der Sicht des Spielers A betrachtet. Dort war nur nach seiner Siegchance in einer Serie von  N  Spielen gefragt. Das bedeutet aber, dass die Gegenwahrscheinlichkeit sowohl für den Sieg seines Gegners B als auch für ein Unentschieden steht. Somit müssen wir hier lediglich die Resultate von 2 - 4 heranziehen, dort  1-p  statt  p ,  r'=1/1-2q  statt  r  und statt der berechneten Wahrscheinlichkeiten für den Gesamtsieg deren Gegenwahrscheinlichkeiten einsetzen. Damit kehrt sich vor allem die Monotonierichtung um; insbesondere sind dann bei der Oszillation für ungerade und gerade  N  die Werte für gerade  N  die höheren. Die Grenzwerte ergeben sich aus 4. Man kann dies in einer Tabelle zusammenfassen, aus der auch die optimalen  N  hervorgehen:


  p < 1/2 p = 1/2 p > 1/2
N  ungerade fallend gegen  0 gleich ( 1/2 ) wachsend gegen  1
N  gerade fallend gegen  0 fallend gegen  1/2 p > 2/3 : wachsend gegen  1
p = 2/3 : w2 = w4 , dann wachsend gegen  1
p < 2/3 : erst fallend, dann wachsend gegen  1
           falls  r'  ungerade : 2 Minima
N  beliebig oszillierend
gerade  N  günstiger
Grenzwert  0
oszillierend
gerade  N  günstiger
Grenzwert  1/2
oszillierend
gerade  N  günstiger
Grenzwert  1


Ein Beispiel soll grafisch dargestellt werden:

Grafik fuer p=.56
p = 0.56




Publiziert 2005-12-30          Stand 2005-07-03


voriges Problem   |    Liste aller Probleme mit Lösungen   |    nächstes Problem


Manfred Börgens   |    zur Leitseite