Cómo responder a este problema de probabilidad

Q. Encuentre el valor esperado de [math] X [/ math].

La probabilidad de que salgan las primeras caras en [matemática] k [/ matemática] prueba es [matemática] \ frac {1} {2 ^ k} [/ matemática], por lo que el valor esperado de [matemática] X [/ matemática ] es igual a [matemáticas] \ displaystyle \ sum_ {k = 1} ^ {\ infty} 2 ^ k \ times \ frac {1} {2 ^ k} = \ sum_ {k = 1} ^ {\ infty} 1 = \ infty [/ math]. Por lo tanto, las ganancias esperadas del juego son [math] \ infty [/ math].

P. Si el costo de jugar este juego [matemática] n [/ matemática] veces es mil dólares, entonces ¿qué tan grande debería ser [matemática] n [/ matemática]?

Aunque las ganancias esperadas del juego son [math] \ infty [/ math], parece razonable que la gente no quiera pagar mil dólares para jugarlo solo una vez. Una razón es que la probabilidad de incluso recuperar (ganar más de) mil dólares en este juego es muy pequeña y es igual a [matemáticas] \ sum_ {k = 10} ^ \ infty \ frac {1} {2 ^ k} = \ frac {1} {2 ^ 9} [/ math], es decir, necesita al menos 10 colas consecutivas para tener rendimientos positivos netos en el juego. Es correcto que haya una pequeña posibilidad de ganar una gran cantidad de dinero en este juego, y eso lleva a un valor esperado infinito, pero cuando el tomador de decisiones evalúa cualquier proposición, el factor de pequeña probabilidad generalmente supera la cantidad en consideración. Para tener su acuerdo, es necesario darle más oportunidades. Para saber cuántos, hay muchas posibilidades diferentes (y eso depende del tomador de decisiones):

  1. Supongamos que tenemos un tomador de decisiones que se preocupa por los rendimientos medios, en lugar de los rendimientos medios. Tal tomador de decisiones valorará el juego en 4. Esto se debe a que [matemáticas] \ Pr (X \ leq 4) = \ frac {1} {2} + \ frac {1} {4} = \ frac {3} { 4} \ geq \ frac {1} {2} [/ math] y [math] \ Pr (X \ geq 4) = \ frac {1} {2} \ geq \ frac {1} {2} [/ math ] Por lo tanto, se le debe ofrecer 250 juegos de este tipo por mil dólares para atraerlo a jugarlo.
  2. Consideremos otro ejemplo de un tomador de decisiones que primero encuentra el número esperado de lanzamientos hasta que el juego termina, luego encuentra la recompensa asociada con el número esperado de lanzamientos, y finalmente trata esa recompensa como el valor para el juego. En este caso, el número de intentos hasta las primeras cabezas es una variable aleatoria geométrica con el parámetro [math] p = \ frac {1} {2} [/ math], y el número esperado de intentos para obtener caras es igual a [math] 2 [/ matemáticas]. Entonces, este tomador de decisiones valorará el juego en [matemáticas] 2 ^ 2 = 4 [/ matemáticas]. Una vez más, para atraerlo a jugar este juego, se le deben ofrecer 250 juegos por mil dólares.
  3. También podemos considerar a otra persona que siente que si tiene un billón de dólares ([matemáticas] \ aprox. 2 ^ {30} [/ matemáticas]), entonces tiene todo y no necesita ni le importa ningún dinero adicional más allá de esta cantidad . Tal individuo tiene una función de valor para el dinero: [matemáticas] v (m) = \ begin {cases} m & \ text {if} m \ leq 2 ^ {30} \\ 2 ^ {30} & \ text {if } m> 2 ^ {30} \ end {cases} [/ math] o simplemente, [math] v (m) = \ min (m, 2 ^ {30}) [/ math]. Tal individuo tiene el valor esperado del juego de la siguiente manera: [math] \ mathbb {E} (v (X)) = \ sum_ {k = 1} ^ {30} 2 ^ k \ times \ frac {1} { 2 ^ k} + \ sum_ {k = 31} ^ {\ infty} 2 ^ {30} \ veces \ frac {1} {2 ^ k} = 30 + 1 = 31 [/ matemáticas]. Para atraer a esta persona a jugar por mil dólares, se le deben ofrecer 33 juegos de este tipo.

Este problema se conoce como una paradoja de San Petersburgo.

Deje que [matemáticas] X [/ matemáticas] denote las ganancias del jugador en el juego. Tenga en cuenta que el rango de [math] X [/ math] es [math] \ {2 ^ k: \ text {k es un entero positivo} \} [/ math].

Para cualquier número entero positivo [math] k [/ math], tenemos [math] \ mathbb {P} (X = 2 ^ k) = \ mathbb {P} (\ text {El juego dura k lanzamientos de una moneda}) = \ dfrac {1} {2 ^ k} [/ matemáticas]

[math] \ mathbb {E} \ left [X \ right] = \ displaystyle \ sum_ {k = 1} ^ \ infty 2 ^ k \ mathbb {P} \ left (X = 2 ^ k \ right) = \ displaystyle \ sum_ {k = 1} ^ \ infty 2 ^ k \ dfrac {1} {2 ^ k} = \ displaystyle \ sum_ {k = 1} ^ \ infty 1 = + \ infty [/ math].

En otras palabras, si uno juega este juego con un casino, ¡en promedio, ganará una cantidad infinita de dinero! ¿No es eso ridículo? La observación clave es que, en el mundo real, la cantidad de dinero es finita. es decir, delimitado por algún número fijo. Supongamos que el casino tiene [matemáticas] 1 [/ matemáticas] mil millones de dólares. Mil millones de dólares equivalen a [matemática] $ 10 ^ 9 = $ (10 ^ 3) ^ 3 \ aprox $ (2 ^ {10}) ^ 3 \ aprox $ 2 ^ {30}. [/ Matemática] Supongamos que, si el juego dura más de [math] 30 [/ math] rondas, luego se obtiene esta cantidad. Ahora el valor esperado es

[matemática] \ mathbb {E} \ left [X \ right] = \ displaystyle \ sum_ {k = 1} ^ {30} 2 ^ k \ dfrac {1} {2 ^ k} + \ displaystyle \ sum_ {k = 31} ^ \ infty 2 ^ {30} \ dfrac {1} {2 ^ k} = 30 + \ displaystyle \ sum_ {k = 1} ^ \ infty \ dfrac {1} {2 ^ k} = 30 + 1 = 31 [/ matemáticas].

Por lo tanto, en un mundo real, donde hay una cantidad finita de dinero, las ganancias esperadas no son infinitas.

Ahora, para responder (b), en un sentido indirecto, la pregunta es, ¿cuántas rondas, que es [matemáticas] n [/ matemáticas], deberíamos jugar este juego para que podamos ganar al menos [matemáticas] $ 1000 [/ matemáticas ]? ; Cuesta [matemática] $ 1000 [/ matemática] jugar el juego [matemática] n [/ matemática] rondas, y pagar razonablemente [matemática] $ 1000 [/ matemática] significa que deberíamos poder ganar al menos [matemática] $ 1000 [/ math] en esas rondas [math] n [/ math].

Dado que la cantidad recibida por el jugador está en potencias de [matemáticas] 2 [/ matemáticas], vamos a aproximar los [matemáticas] $ 1000 [/ matemáticas] por [matemáticas] $ 1024 [/ matemáticas]. Encontremos una [matemática] n [/ matemática], el número máximo de rondas hasta el cual uno debe jugar para que gane, en promedio, al menos [matemática] $ 1024 [/ matemática].

[math] \ mathbb {E} \ left [X \ right] = 1024 [/ math]

[matemáticas] \ implica \ displaystyle \ sum_ {k = 1} ^ n 2 ^ k \ mathbb {P} \ left (X = 2 ^ k \ right) = 1024 [/ math]

[matemáticas] \ implica \ displaystyle \ sum_ {k = 1} ^ n 2 ^ k \ dfrac {1} {2 ^ k} = 1024 [/ matemáticas]

[matemáticas] \ implica n = 1024 [/ matemáticas].

Parte a

Valor esperado = Ganancias x Probabilidad de ganancias

Si aparece la primera cabeza en el primer turno,

Probabilidad = 1/2, Ganancias = 2, Esperado = 1

La primera cabeza aparece en el turno k,

Probabilidad = [matemática] \ frac {1} {2 ^ k} [/ matemática], ganancias = [matemática] 2 ^ k [/ matemática], esperada = 1

Como hay infinitos casos y cada caso se espera que el ganador sea 1, las ganancias esperadas son infinitas.

Parte B

Tenga en cuenta que la palabra “razonable” sugiere alguna forma de juicio de valor / utilidad. Por ejemplo, ¿realmente le importa si gana 100 mil millones de dólares o 200 mil millones de dólares? Serías muy rico de todos modos. Por lo tanto, en algún momento 200 mil millones de dólares son efectivamente 100 mil millones de dólares. Del mismo modo, también depende de cuánto dinero tenga actualmente. Si tienes 30 mil dólares, entonces 1000 para jugar un juego que potencialmente puede beneficiarte puede parecer barato. Mientras que si solo tiene 1000 dólares y necesita pagar sus facturas, entonces el valor de esos 1000 se vuelve mucho más.

Así que, en última instancia, esta pregunta es muy subjetiva y puedes responderla como quieras. Respuesta ejemplo:

Cualquier ganancia que supere el millón de dólares es igual para mí. Lo que significa que en el caso k> 20 las ganancias solo pueden tratarse como 1 millón.

De ahí las ganancias esperadas:

[matemáticas] 19 + 10 ^ 6 (\ frac {1} {2 ^ 20} + \ frac {1} {2 ^ 21} +…) [/ matemáticas]

Que dan aproximadamente 20,9

Entonces n tendría que ser mayor que aproximadamente 47.8 para que valga la pena.

Los posibles resultados son H, TH, TTH, TTTH, etc.

H ocurrirá con 1/2 probabilidad. Entonces H nos ganará 1/2 * 2 = 1

TH ocurrirá con 1/2 * 1/2 = 1/4 probabilidad. Obtendrá una recompensa de 1/4 * 4 = 1

Por lo tanto, el valor esperado de X es 1 + 1 + 1 + 1 … = Infinito

Por la misma razón, debes jugar este juego al menos 1000 veces … ¡Vaya! Esto está mal.

EDITAR: respuesta correcta

Suponga que se necesita X número de veces. Ahora X / 2 número de veces, esperas que obtenga H de inmediato, de manera similar X / 4 número de veces, esperas TH y así sucesivamente hasta INF para que X / 2 + X / 4 + X / 8 + … .X / INF = X

Aquí hay una falacia. Suponiendo que X = 2 ^ K, la serie infinita anterior se convertirá en una serie finita de términos K. Cada uno de estos términos producirá un valor esperado de X. Por lo tanto, hay un número de términos LOG (X) que producen cada uno un valor de X. Por lo tanto, min X tal que X * LOG (X)> = 1000.

Si X = 32, obtenemos 160 como respuesta.

Si X = 256, obtenemos 2048 como respuesta.

si X = 128, obtenemos 896 como respuesta.

141 da 1006 como respuesta y ese es el menor valor en el que nos equilibramos.