Probable mente
Semana de la Matemática 2005
Alicia Dickenstein
Por qué los casinos ganan
siempre?
(sin hacer trampa)
Cómo tomar decisiones (favorables)
sobre hechos que suceden
azarosamente?
Por qué los casinos ganan siempre?
(sin hacer trampa)
Cómo tomar decisiones (favorables)
sobre hechos que suceden
azarosamente?
Teoría de probabilidades
Si tiramos una moneda no cargada
p(cara) = p(ceca) = 1/2
Si tiramos una moneda cargada:
p(cara) = 1 - p(ceca)
p(cara) p(ceca) % caras
1/2
1/2
50
1/4
3/4
25
1
0
100
p
1-p
100 p
Si tiramos dos monedas no
cargadas:
p(2 caras) =
p(2 cecas) = 1/4
p(1 cara y 1 ceca)
=
Si tiramos dos monedas no
cargadas:
p(2 caras) =
p(2 cecas) = 1/4
p(1 cara y 1 ceca)
= 1/2
Si hay 3 monedas no cargadas
…
…
p(3 caras) = 1/8
…
p(2 caras y
1 ceca)=
Si hay 3 monedas:
p(3 caras) = 1/8
…
p(2 caras y
1 ceca)= 3/8
Problema:
• Se tiene una moneda
cargada, con
probabilidad p de
salir cara y q = 1-p
de salir ceca
• p (y q) son
desconocidas
• Cómo usar esta
moneda cargada
para hacer una
apuesta justa
(pareja) entre dos
personas?
(Una) respuesta:
• Se tira 2 veces la moneda sucesivamente,
esto es considerado 1 tiro..
• Uno de los jugadores elige: primero cara y
luego ceca, el otro elige primero ceca y
luego cara.
• Se tira la moneda hasta que salgan 2
facetas distintas en un tiro (doble)
Por que es una apuesta justa?
p(cara-cara) = p. p = p2
p(ceca-ceca)= q. q = q2
p(cara-ceca)= p. q
P(ceca-cara)=q. p
• Ambos jugadores
tienen probabilidad
p.q = q.p de ganar
Notar que: p2 + q2 + 2 pq = (p+q)2 = 12 = 1
Pero…
• Cuál es el número esperado de tiros
hasta que salgan dos facetas
distintas??
Respuesta:
• En general, el número esperado E de tiradas para que
se produzca un suceso con probabilidad u de suceder,
hasta que suceda es igual a 1/u
• Porque:
• E = 1. u + (E+1)(1-u),
• y se despeja
• E= 1/u.
• Ya que: o sucede en una tirada, o estamos en el punto
de partida nuevamente, salvo que ya “pagamos una
tirada”
En nuestro caso
• La probabilidad de que salgan dos facetas
distintas en un tiro (doble) es:
• u = 2 p (1-p)
• Por lo tanto, el valor esperado del número
de tiros hasta que salga cara-ceca o cecacara es:
• E = 1/ 2 p (1-p)
Por ejemplo:
p(cara)
nro. esperado de tiros
1/2
2
¼ o 3/4
3
1/10 o 9/10
6
1/100 o 99/1000
51
1/1000 o 999/1000
501
1 o 0 (nunca sale ceca o
nunca sale cara)
?
Los favoritos en los deportes
• Supongamos que el equipo argentino es tan
bueno que tiene probabilidad de ganarle 7 de
cada 10 veces a cualquier otro equipo del
mundo, o sea la probabilidad p de que gane
cualquier partido es
• p = 7/10
• Cuál es la probabilidad de ganar 4 partidos
(octavos de final, cuartos de final, semifinal y
final)?
Respuesta:
(7/10)4 = 0, 2401
• O sea, la probabilidad de ganar cualquier
partido individual es del 70% , pero la
probabilidad de ganar los 4 es de menos
del 25% (24,01%)
p1 es la probabilidad de ganar un partido
p4 es la corresp. probabilidad de ganar los 4
p1
en %
p4
en %
0,5 =1/2
50
0,0625
6,25
0,6
60
0,1296
~ 13
0,7
70
0,2401
~ 24
0,8
80
0,40
40
0,9
90
0,6561
~ 65
~ 0,84
~ 84
0,5 = 1/2
50
Para favorecer al favorito:
• Como en la NBA por ejemplo…
• Gana el equipo que gane el mayor
numero de partidos entre 3, 5 o 7
partidos disputados entre los dos
equipos !
En porcentajes (aproximados):
Prob. de ganar
1 partido
X 100
Prob. de ganar Prob. de ganar Prob. de ganar
al menos 2 de 3 al menos 3 de 5 al menos 4 de 7
x 100
x 100
x 100
60
65
68
71
70
78
84
87
50
50
50
50
40
35
32
29
La pregunta indiscreta
• Supongamos que se quiere conocer, por
ejemplo, el porcentaje de adolescentes de
menos de 16 años que han probado
alguna droga….
La pregunta indiscreta
• Supongamos que se quiere conocer, por
ejemplo, el porcentaje de adolescentes de
menos de 16 años que han probado alguna
droga….
• Puede estimarse este valor sin violar la
privacidad de nadie?
• O sea, puede obtenerse informacion veraz de la
población en general sin tener informacion
veraz de ningun individuo en particular?
Se entrega al entrevistado una moneda (no cargada) y el
entrevistado se compromete a lanzar la moneda en privado
y de acuerdo al resultado:
• Si al tirar la moneda
sale cara, responde
• Si al tirar la moneda
sale ceca, responde
• SI,
• cualquiera sea la
respuesta verdadera
• SI o NO,
• de acuerdo a la
verdad.
Entonces, sin tener ninguna información sobre si un
individuo que respondió SI, probó la droga o no, se puede
estimar
% de respuestas SI
60
% de adolescentes que
probaron la droga
20
65
30
50
0
80
60
La fórmula es:
• p(SI) = p(SI/ salio ceca) . ½ + p(SI/ salio cara). ½ =
= p(SI/ salio ceca) ½ + 1. ½
• p(SI) se estima como
• p (SI) = nro. de respuestas SI/ nro total de entrevistados
• De donde:
• p(SI/ salio ceca) = 2. (p(SI) -1/2)
• O bien:
• % de verdaderas respuestas SI = 2 (% de respuestas SI
obtenidas – 50%).
Imaginemos un dado tetraedral.
con caras A,T, C, G
Al lanzarlo, se generan
secuencias de ADN
TAGAGACGGGGGTTTCACAATGTTGGCCA
>hg17_dna range=chr17:38464686-38473085 5'pad=0 3'pad=0 revComp=FALSE strand=?
repeatMasking=noneATCCAGAAGTCTAGTATACATCTCAAAATTCATGCATCTGGCCGGGCACAGTGGCTCACACCTGCAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATTACCTGAGGTCAGGAGTTTA
AGACCAGCCTGGCCAACATGGTAAAACCCCATCTCTACTAAAAATACAAGTATTAGCCAGGCATTGTGGCAGGTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAAAATCACTTGAACCGGGAGGCGGAGGT
TGGAGTGAGCTGAGATCGTGCTACCGCACTCCATGCACTCTAGCCTGGGCAACAGAACGAGATGCTGTCACAACAACAACAACAACAACAACAACAACAACAACAACAACAACAAATTCTCACATCTAAAACAGAGTT
CCTGGTTCCATTCCTGCTTCCTGCCTTTCCCACTCCCCCATATTCCCTACCATGCCTTCTTCATCTAATTTAATATTACTAACAAGATCTATTGTTCAAGCCAAAACCCAAGTGTCACTCCTTCAATTTCTCTTTACC
TTATCCTCCAAATTTAATCCATTAGCAAGTCCTCTCTTCAAACCCATCCCAAACCAACCTTGTTTTTAACCATCTCCACACCACCAATTACCACAAGGATAAAATCTGAATTCCTTACCACCAAATACTATGTGATCT
GGCCCTCATCTATGACCTTCTCCCATTCCTTGTGTAATCTCTGCCTCCACACATAATTTGCAAATTACTCCAGCTACACTGGCCTATTATTATTATTATTATTATTTTTGAGACGGAGTCTTGCTCTTTCGCCCAGCC
TGGAGTGCAGTGGCGCAATCTCAGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCCCAGCCTCCCAAGTAGCTGTGATTACAGGCACATGCCACCATTCCCAGCTAATTTTTTTTTGTTTTTGAG
ATGGAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCTCAGCTCACCACAACCTCCACCTCCCGGGTTGATGAAGTGATTCTCTTGTCTCAGCCTCCCGTGTAGCTGGGATTAGAGGCACGCGCCACC
ACGCTGGGCAAATTTTTGTATTTTTAGTAGAGACAGGGTTTCTACCTCAGTGATCTGTCCGCCTTGACCTCCCAAAGTGCTGGGATTACAGGAATGAGCCACCACACCCAGCCGTGCCCAGCTAATTTTTGCATTTTT
TAGTAGAGATGGGGTTTTGCCACGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGGGGATCTGCCTGCCTCGGCCTCCTAGAGTGCTGGAATTACAGGTGTGAGCCACTGTGCCCGAACCTTTTATCATTATTATT
TCTTGAGACAGGAGTCTTGCTCTGTCGTTCAGGCTGGAGTGCAGTGATGCGATCTTGGCTCACTGTAACTCCTACCTTTCGGTTCAAGTGATTCTCCTGCCTCAGCCTCTGGAGTAGCTGGGATTACAGGCACTGGGA
TTACAGGCACACACCACCACACCATGCTAGTTTTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAGTGATTTGCCTGCCTTGGCTTCCCAAAGTGCTGGGATT
ATAGGCACGAGCCACCACACACGACCAACATTGGCCTATCTTTTAAAAAATAAACCAAGCTCTGGCCGGGCACAGTGGCTCACACCTGTGATCCCAGCACTTTGGGAGGTTGAGGTGGTTGGATCACTTGAGTTCAGG
AGTTTGAGACCAGCCTGACCAACGTGGTAAAACCCCATCTCTACTAAAAATAAAAACTAGTCGGGTGTGGTAGCACGCGTGCCTGTAATACCAGCTACTCAGGAGGCCAAGGCAGGAGAATTGCTTGAACCCAGGAGA
CAGAGTTTGCAGTGAGCCAAGATTGTGCCACTGCACTCCAGCCTGGGGGATAGAGGGAGACACCATCTCAAAAAAACCAAAATACAGAAATCAAAAAACCACACTCATTATTACCTCAAGACCTTTATGTTTGCTATT
CCTCTGCCTATAAGATGCATTCCCTTCATTTTTCAAGGACAATTATTTCTTGTTATTTAGGTCTCAGCTCAATTTTTTCAGAAAGGCTTTCCCTGGCCTCCTTAAACGAAAGTAATCAACAACCTTTGACAGCTAATA
CTATTCCACTGTTCTGTATATTTCTCCATAGCATTTATTGTTATCTTAAATTCATCTTTATTGTGTATCTCCCCTCGACAGAACCTGAATCCTACCAGGGACTTAGTTAGTCTTATTTACTGTTGCATTCCTAGTGCC
CAGAACACAGTAGGCTCCCAATAAATAGCCACTGAATAAAAGTTAAAACCAACAAAAATAATCATTTAATTAATTATGAATACATCGAATTGTGCACAATAGTTTATAAAATTACTTTTTTTTTTTTTTTAAGACAGG
GTCTCATTCTGTCTCACAGGCTGGAGTGCAGTGGTGCAATCTAGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCCAGCAGCTAGGATTACAGGCACATGCCACCACGCTCGAC
TAATTTTTTTGTGTTTTTAGTAGAGACAAGGTTTCACCATGTTGACCAGGCTGGTCTCGAACTCCTGACCTCAAGTGATCCACCTGCCTTGGCCACTCAAAGTGCTGGGATTATAGGCATGAGCCACCACGCCTGGCC
TATAAAATTACTTTCACATTTCATTTTGCCTGATCTGTTGTCACAGAAGTTCTCAGATGGCTGTTCTGAAATTATTCCTCCTCCTACACTCTATCTTATTTACTTCTCACTGTTCTCAGTATCATAAAGTGCAACATC
TTTTTGAAGCAATCTGAATTATAAACAGATACATTTGCATGTATATATATGTATATATGCATATGCACACACACACTTTTTTTTTTTTAAGAGACAGGGTCTTGCTCTGTGCAAGTGCAAGAGTGCAATGGTATGATC
ATAGCTCACTGCAGCCTTGAACTCCTGGGCTCAAGTGATTCTTCTGGCTTAGCTTCCTCAGTAGCTAAGACTACAGAAGCACACTGCCATGCCCGGCTAATTAAAAAAAAATTTTGTGGAGACAGAGTCTCACTATGT
TGCCCAGGCTGGTTTCAAACTCCTGGCCTCAAGTAATCTTCCTGTCTCAGCCTCCCAAAGGGCTGAGATTATAAGTGTGAGCCACTGCATCTGGACTGCATATTAATATGAAGAGCTTTTCTTCAACAACAGTGAACA
GTTTTCTACAAAGGTATATGCAAGTGGGCCCACTTCTTGTTCTTATGAATCTTTTCTTTCCTTTTATAAAACTCCTTTTCCTTTCTCTTTTCCCCAAAGAAAGGACTGTTTCTTTTGAAATCTAGAACAAATGAGAAC
AGAGGATATCCTGGTTTGCGCTGCAAAATTTTTTTTTTTTTTAAGACGGAGTCTCGCTCTGTTGCCAGGTTGGAGTGCAGTGGCACGATCTTGGCTCATTGCAACCTCCACCTCCCGGGTTCAAGAGATTCTCCTGCC
TCAGCCTCCTGAGTAGCTGGAACTAAAGGCGCATGCCACCACGCTGAGTAATTTTTTGTATTTTAGTAGAGACAGGGTTTCACCATGTTGCCCAGGCTGATCTCGAACTCCTGAGCTCAGGCAATCTGCCTGTCTTGG
CCTCCCACAGTGTTAGGATTACAGGCATGAGCCACTGCACCCGATTTTTTTTTTCTTTTGATGGAGTTTTGCTCTTGTTGCCCAGGTTAGAGTGCAATGATGCGATCTCAGCTCACTGCAACCCCCGCCTCCCAGGTT
CAAGTGATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAATTACAGGCAAGTGCCACCAAGCCCGGCTAATTTTGTATTTTTAGTAGAAACGGGGTTTCTCCATGTTGGTCAGGCTGGTCTTGAACTCCCGACATCAGG
TGATCCAAGCGCCTCAGCCTCCCAAAGCGCTGGGATTATAGGTATGAGCCACAGTGCAGGCCTGCATAATTCTTGATGATCCTCATTATCATGGAAAATTTGTGCATTGTTAAGGAAAGTGGTGCATTGATGGAAGGA
AGCAAATACATTTTTAACTATATGACTGAATGAATATCTCTGGTTAGTTTGTAACATCAAGTACTTACCTCATTCAGCATTTTTCTTTCTTTAATAGACTGGGTCACCCCTAAAGAGATCATAGAAAAGACAGGTTAC
ATACAGCAGAAGAACGTGCTCTTTTCACGGAGATAGAGAGGTCAGCGATTCACAAAAGAGCACAGGAAGAATGACAGAGGAGAGGTCCTTCCCTCTAAAGCCACAGCCCTTTAATAAGGCTTGTAGCAGCAGTTTCCT
TCTGGAGACAGAGTTGATGTTTAATTTAAACATTATAAGTTTGCCTGCTGCACATGGATTCCTGCCGACTATTAAATAAATCCCTAGCTCATATGCTAACATTGCTAGGAGCAGATTAGGTCCTATTAGTTATAAAAG
AGACCCATTTTCCCAGCATCACCAGCTTATCTGAACAAAGTGATATTAAAGATAAAAGTAGTTTAGTATTACAATTAAAGACCTTTTGGTAACTCAGACTCAGCATCAGCAAAAACCTTAGGTGTTAAACGTTAGGTG
TAAAAATGCAATTCTGAGGTGTTAAAGGGAGGAGGGGAGAAATAGTATTATACTTACAGAAATAGCTAACTACCCATTTTCCTCCCGCAATTCCTAGAAAATATTTCAGTGTCCGTTCACACACAAACTCAGCATCTG
CAGAATGAAAAACACTCAAAGGATTAGAAGTTGAAAACAAAATCAGGAAGTGCTGTCCTAAGAAGCTAAAGAGCCTCAGTTTTTTACACTCCCAAGATCAATCTGGATTTATGATTCTAAAACCCCTGGTGACAGAAT
CAGAGGCTGAAAACACCACTAATTATAACCAGCAGGTATGGATATTTGGAAGTCTAGGGGAGGCTGA
TATGAAGTTAAGACCAGAGGAAATATCTGTCCACTCCCTCTTCTCAACACCCATCTTCTAGACGCCAAGGCTAGCTATAGATCTCCATTATAGTGTTCAAGGAATTAGGAATTATCCATGTCAATAGTTTTGATTAAT
GTGGACGGAGAACATCTATATTACTAGATGGCAATATGTGAAAGAAGAAAACAGTATTGTTGAAAACCTAAATCTGAAATGTCAATGTAATGACAAATTTTCACCCCTAGAATGTCTACCTGGGGAGTCCTAACCCTC
TAATATTCCCCTGAGAGGGATGGGAGAATACAGTGCAGAGCTTTTATATAAGTATTTCAGAAAGCAGTAGCTAAAGAATCACTTGTTTATTTCCCAGTGTTTCAAAGGCCCTTCTGAAGAACTAAGCAAACTAAGGAA
AGACCATTTAGTTTTAAACAGGAGAAATGTATTTAACTAAATCCTAAACACAGCAGGCTATCTGCAAGCAGCAGCAGCAGCAGCAGCCATGCTCCCTCACAGAATCCTTACAATTTTTGAAGTTTTTTGTTTAACTGC
TACAAAAGCCGATTTAGTAACATTTATTACACTTAAAAACTTCAGTTCATTTGTAGTTCAAAGCAAATGTATTGGCTTTGAGTTTAAAGACTGAACTACTTTAGATTTGATTTGCATTTTTTTTTTTTTTTTTTTTTG
AGATGCAGTCTTGCTCTGTCAGCCAGGCTGGAGTGCAGTGGCTGGATCTCAGCTCACGGCAAGCTCTGCCTCCTGGGTTCATGCCATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGATGCCCGCCACCAT
GCCCGGCTAATTTTTTGTATTTTTACTAGAGATGGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCTGCCCGCCTTGGCCCCCCAAAGCGCTGGGATTACAGGCCTGAGCCACCACGCTT
GGCATCTTTTTACCTTTCATTAACTTTGATGCAAACCTATAGCTTAAGGTATCTTAAACTTTAATGACATTTTTCTCTAAAATAGTAGTTTGTAATAACTTGTTCTGGCACCTGGCTCCAATGAACACTACCCTCTGA
CCCTGTGGTATAATTTTCATGAGTAAGTGGAAACCTAAGATCTTAGAAGTTCAACGGCAATGTGTCCAAGGGGTTTAGATCCTCTCCTTAAGTGCCTGTATCTCTGTGAAAAGAATCATCATAGGCTAGGCGCGATGG
CTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTAGGTGGATCACCTGAGGTCGGGAGTCCAAGACCAGCCTGACTGACATGGAAAAACCCTGTCTCTACTAAAAATACAAAATTAGGTATGGTGGTGCATTCC
TGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGGGGAGGTTGCAGCAAGCCAAGATCGTGCCATTGCACTCCAGCAGCCTGGGCAACAAGAGTGAAAAACTACACCTCAAAAACAA
AAACAAAAACAAAAGAATCATCATCAAGTGAACTGGAACACATCCAGAGAACTAATTTTGTTAGAAAGATTTTAGAGTTGAGCCACACAATCTGCATCTTCTGCGTCCTCCATGCACTCGTCTGCTTTCTGGAGCCCC
ATGAGTGAGTCTTAATCCTGTTCCAGATAACAGTTCTCTTCCGGGTAACGGTTCTTCAGATACTTGAAGACAGTGTCTTATTTCCTTAAATCTTCTCATTTCTTCTTCAAAAGACAGTATTTCAAGTTACTTTTATGT
ATCTTTACCATCTACCTCTGGATAAACACTCTCCAATTTGTCAGTGACCATGTTAAAAACCAAGCACGGTGCTTAAAACTGACATCATCTTTCAGGCAATCACTCCATTGGAGAATACAGTGGGGCTCTGGATCTGTA
CTTCACTTGCTCCAGAGCCTCTGCTTGTGTTAATACGGCCCAGTTTCAAATAAGCATTTTTAGCAGCCCTGAAATGTGTACTCAGATTTAGTTTATAGTCAACTAAAAACACCCAGAGGTCTCCTGTATTACACAAGT
TATAATTAAAACCTTAAAAGAGAAAGGTATAGGACAAATGATCTGTCTCCTCCCTTTTTTGCTTTTTCATATGTTAAGACTATCTCGGAGCTGTTATCAGACTTTTTTCCTGAAAAACTCTCAACAATACTCAAACTA
GGTGTTACATGAAGCTGGGGTCTCCAGGTTTTGCCTCACTTGTTCTTTCTTTTGTTGTTGTTGAGACAGAGTCTCACTCTGTCGCCAGGCTGGAGTGCAGTGGCAGGATCTCAGCTGACTGCAACCTCAGCCTCCAGA
GTTCAAGCAATTCTTCTGTGTCAGCCTCCCAAGTAGCTGGGATTACAGGTGCACACCACCACGCCCAGCCA
La secuencia de 42 bases
TTTAATTGAAAGAAGTTAA
TTGAATGAAAATGATC
AACTAAG
La secuencia de 42 bases
TTTAATTGAAAGAAGTTAA
TTGAATGAAAATGATC
AACTAAG
Está presente en el genoma de 10 vertebrados:
Hombre, chimpancé, ratón, rata, perro, pollo, rana, pez, cebra, pez fugu, tetraodón
En: “The Mathematics of Phylogenomics”
Lior Pachter and Bernd Sturmfels
http://arxiv.org/abs/math.ST/0409132
Ver también el libro: Algebraic Statistics for Computational Biology
Cambridge University Press, 2005
• La probabilidad (de acuerdo al modelo
de evolución de Jukes-Cantor) de que
esto haya ocurrido por azar es
aproximadamente igual a:
10 -50 = 0, 0……..01
(50 cifras decimales)
Conjetura:
Esta secuencia de 42 bases estaba en un
ancestro común a todos estos vertebrados
Muchas gracias por venir!
TAGAGACGGGGGTTTCACAATGTTGGCCA
Agradecemos a
Lior Pachter y Bernd Sturmfels
por autorizarnos a reproducir
la figura de su personaje
DiaNA
creado para su libro:
Algebraic Statistics for Computational Biology
Cambridge University Press, 2005
Descargar

click