Estadística : 02/16/17

Probabilidad Condicionada

Probabilidad Condicionada

Como la probabilidad está ligada a nuestra ignorancia sobre los resultados de la experiencia, el hecho de que ocurra un suceso, puede cambiar la probabilidad de los demás. El proceso de realizar la historia clínica, explorar y realizar pruebas complementarias ilustra este principio.

La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se denomina probabilidad condicionada y se define

Esta definición es consistente, es decir cumple los axiomas de probabilidad.

Cuando ocurre un suceso cambia el espacio muestral, por eso cambia la probabilidad. A veces es más fácil calcular la probabilidad condicionada teniendo en cuenta este cambio de espacio muestral.

Ejemplos:

1 - Una mujer es portadora de la enfermedad de Duchenne ¿Cuál es la probabilidad de que su próximo hijo tenga la enfermedad?

Según las leyes de Mendel, todos los posibles genotipos de un hijo de una madre portadora (xX) y un padre normal (XY) son xX, xY, XX, XY y tienen la misma probabilidad. El espacio muestral es W = {xX, xY, XX, XY}
el suceso A={hijo enfermo} corresponde al genotipo xY, por tanto, según la definición clásica de probabilidad
p(A) = 1/4 = 0,25

La mujer tiene el hijo y es varón ¿qué probabilidad hay de que tenga la enfermedad?

Se define el suceso B = {ser varón} = {xY, XY}
la probabilidad pedida es p(A|B) y aplicando la definición anterior
p(B) = 0,5; A Ç B = {xY}; p(A ÇB) = 0,25; p(A|B) = 0,25/0,5 = 0,5

Si sabemos que es varón, el espacio muestral ha cambiado, ahora es B. Por lo tanto se puede calcular p(A|B) aplicando la definición clásica de probabilidad al nuevo espacio muestral
p(A|B) = 1/2 = 0,5

2 - Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa. ¿Cuál es la probabilidad de que un fumador sea hipertenso?

A = {ser hipertenso} B = {ser fumador}
A Ç B = {ser hipertenso y fumador}
p(A|B) = 0,10/0,50 = 0,20

Obsérvese que los coeficientes falso-positivo y falso-negativo de las pruebas diagnósticas son probabilidades condicionadas.

En general p(A₁ Ç A₂ Ç A₃ ...) = p(A₁) p(A₂|A₁) p(A₃|A₁ Ç A₂) ...
llamado principio de las probabilidades compuestas y especialmente útil para aquellas situaciones en que las probabilidades condicionadas son más fáciles de obtener que las probabilidades de las intersecciones.

3 - Se sabe por estudios previos que el 0,1% de la población tiene problemas vasculares. Un estudio sobre individuos con problemas vasculares revela que el 20% de ellos son placas de ateroma. Si el 10% de los individuos con placas de ateroma están expuestos a muerte súbita por desprendimiento de trombos ¿qué probabilidad tiene un individuo cualquiera de estar expuesto a muerte súbita por desprendimiento de trombos de una placa de ateroma?

A₁ = {problemas vasculares}; A₂ = {placas de ateroma}; A₃ = {expuesto a muerte súbita por ....}
p(A₁) = 0,001; p(A₂|A₁) = 0,20; p(A₃|A₁ Ç A₂) = 0,1
p(A1 Ç A2 Ç A3) = 0,001 x 0,20 x 0,1 = 0,000002

Cuando se analizan fenómenos aleatorios complejos como puedan ser el lanzamiento de varios dados a la vez o la extracción de bolas de una bolsa sin reintegrarlas a la misma después de sacadas, el cálculo de probabilidades siguen principios especiales, aunque perfectamente mensurables. En estos casos se habla de experimentos aleatorios y probabilidades compuestos o condicionados.

Cuando se producen sucesos estocásticos consecutivamente de un espacio muestral, pueden darse dos tipos genéricos de situaciones:

Los sucesos son independientes entre sí, de manera que no influyen uno en el otro.

Cada suceso está condicionado por el resultado del anterior.

Cuando un suceso A influye en el resultado de un segundo suceso B, se dice que la probabilidad de éste es una probabilidad condicionada.

El suceso A no puede ser un suceso imposible, pues sería P (A) = 0.

Varianza

¿Que es la Varianza?

La varianza mide qué tan dispersos están los datos alrededor de su media. La varianza es igual a la desviación estándar al cuadrado.

La supervisión de la varianza es esencial para las industrias manufactureras y de calidad, porque con la reducción de la varianza del proceso aumenta la precisión y disminuye el número de defectos.

Ejemplo

1- una fábrica produce clavos para carpintería que tienen 50 mm de largo y un clavo cumple con las especificaciones si su longitud no difiere en más de 2 mm del valor objetivo de 50 mm. La fábrica utiliza dos tipos de máquinas para producir clavos. Ambas máquinas producen clavos con longitudes distribuidas normalmente y una longitud media de 50 mm. Sin embargo, los clavos de cada máquina tienen varianzas diferentes: la máquina A, con la distribución de línea continua en la siguiente figura, produce clavos con una varianza de 9 mm², mientras que la máquina B, con la distribución de la línea de puntos en la siguiente figura, produce clavos con una varianza de 1 mm². Las distribuciones de la longitud de los clavos para cada máquina están superpuestas, junto con los límites de especificación verticales inferior y superior:

Distribuciones de la longitud de los clavos

La longitud de los clavos de la máquina A tiene una variación mayor que la longitud de los clavos de la máquina B. Por lo tanto, cualquier clavo en particular de la máquina A tiene una mayor probabilidad de estar fuera de los límites de especificación que un clavo de la máquina B.

La varianza se representa por:

Varianza para datos agrupados

Para simplificar el cálculo de la varianza se utiliza las siguientes expresiones que son equivalentes a las anteriores.

Ejercicios de varianza

1- Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

2- Calcular la varianza de la distribución de la tabla:

Propiedades de la varianza

1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un número la varianza no varía.

3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

¿Debo usar la varianza o la desviación estándar?

Debido a que la varianza (σ²) es un valor elevado al cuadrado, sus unidades también están elevadas al cuadrado y su explicación puede resultar confusa. Comúnmente es más conveniente e intuitivo trabajar con la desviación estándar, porque ésta utiliza las mismas unidades que los datos.

Por ejemplo, si una pieza de una máquina se pesa en gramos, la desviación estándar de su peso también se calcula en gramos, mientras que su varianza se calcula en gramos².

Permutaciones y Combinaciones

Permutaciones y Combinaciones

¿Qué diferencia hay?

Normalmente usamos la palabra "combinación" descuidadamente, sin pensar en si el orden de las cosas es importante. En otras palabras:

"Mi ensalada de frutas es una combinación de manzanas, uvas y bananas": no importa en qué orden pusimos las frutas, podría ser "bananas, uvas y manzanas" o "uvas, manzanas y bananas", es la misma ensalada.
La combinación de la cerradura es 472": ahora sí importa el orden. "724" no funcionaría, ni "247". Tiene que ser exactamente 4-7-2.

Así que en matemáticas usamos un lenguaje más preciso:

Si el orden no importa, es una combinación
Si el orden sí importa es una permutación.

Con otras palabras:

Una permutación es una combinación ordenada.

Permutaciones

Hay dos tipos de permutaciones:

Se permite repetir: como la cerradura de arriba, podría ser "333".

Sin repetición: por ejemplo los tres primeros en una carrera. No puedes quedar primero y segundo a la vez.

1. Permutaciones con repetición: Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las permutaciones posibles son: n × n × ... (r veces) = n^r

(Porque hay n posibilidades para la primera elección, DESPUÉS hay n posibilidades para la segunda elección, y así.)

Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y eliges 3 de ellos:

10 × 10 × ... (3 veces) = 10³ = 1000 permutaciones

Así que la fórmula es simplemente:

2. Permutaciones sin repetición

En este caso, se reduce el número de opciones en cada paso.

Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?

Después de elegir por ejemplo la "14" no puedes elegirla otra vez.

Así que tu primera elección tiene 16 posibilidades, y tu siguiente elección tiene 15 posibilidades, después 14, 13, etc. Y el total de permutaciones sería:

16 × 15 × 14 × 13 ... = 20,922,789,888,000

Pero a lo mejor no quieres elegirlas todas, sólo 3 de ellas, así que sería solamente:

16 × 15 × 14 = 3360

Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.

¿Pero cómo lo escribimos matemáticamente?

Respuesta: usamos la "función factorial"

Así que si quieres elegir todas las bolas de billar las permutaciones serían:

16! = 20,922,789,888,000

Pero si sólo quieres elegir 3, tienes que dejar de multiplicar después de 14. ¿Cómo lo escribimos? Hay un buen truco... dividimos entre 13!...

¿Lo ves? 16! / 13! = 16 × 15 × 14

La fórmula se escribe:

Ejemplos:

Nuestro "ejemplo de elegir en orden 3 bolas de 16" sería:

16!	=	16!	=	20,922,789,888,000	= 3360

(16-3)!		13!		6,227,020,800

¿De cuántas maneras se pueden dar primer y segundo premio entre 10 personas?

10!	=	10!	=	3,628,800	= 90

(10-2)!		8!		40,320

(que es lo mismo que: 10 × 9 = 90)

Notación

En lugar de escribir toda la fórmula, la gente usa otras notaciones como:

Combinaciones

También hay dos tipos de combinaciones (recuerda que ahora el orden no importa):

Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10)

Sin repetición: como números de lotería (2,14,15,27,30,33)

1. Combinaciones con repetición: En realidad son las más difíciles de explicar, así que las dejamos para luego.

2. Combinaciones sin repetición: Así funciona la lotería. Los números se eligen de uno en uno, y si tienes los números de la suerte (da igual el orden) ¡entonces has ganado!

La manera más fácil de explicarlo es:

Imaginemos que el orden sí importa (permutaciones),
Después lo cambiamos para que el orden no importe.

Volviendo a las bolas de billar, digamos que queremos saber qué 3 bolas se eligieron, no el orden.

Ya sabemos que 3 de 16 dan 3360 permutaciones.

Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.

Por ejemplo, digamos que se tomaron las bolas 1, 2 y 3. Las posibilidades son:

Así que las permutaciones son 6 veces más posibilidades.

De hecho hay una manera fácil de saber de cuántas maneras "1 2 3" se pueden ordenar, y ya la sabemos. La respuesta es:

3! = 3 × 2 × 1 = 6

(Otro ejemplo: 4 cosas se pueden ordenar de 4! = 4 × 3 × 2 × 1 = 24 maneras distintas, ¡prueba tú mismo!)

Así que sólo tenemos que ajustar nuestra fórmula de permutaciones para reducir por las maneras de ordenar los objetos elegidos (porque no nos interesa ordenarlos):

Esta fórmula es tan importante que normalmente se la escribe con grandes paréntesis, así:

Notación

Además de los "grandes paréntesis", la gente también usa estas notaciones:

Ejemplo

Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es:

16!	=	16!	=	20,922,789,888,000	= 560

3!(16-3)!		3!×13!		6×6,227,020,800

O lo puedes hacer así:

16×15×14

3360

= 560

Es interesante darse cuenta de que la fórmula es bonita y simétrica:

Con otras palabras, elegir 3 bolas de 16 da las mismas combinaciones que elegir 13 bolas de 16.

16!	=	16!	=	16!	= 560

3!(16-3)!		13!(16-13)!		3!×13!

Triángulo de Pascal

Puedes usar el triángulo de Pascal para calcular valores. Baja a la fila "n" (la de arriba es n=0), y ve a la derecha "r" posiciones, ese valor es la respuesta. Aquí tienes un trozo de la fila 16:

1 14 91 364 ...

1 15 105 455 1365 ...

1 16 120 560 1820 4368 ...

1. Combinaciones con repetición

Digamos que tenemos cinco sabores de helado: banana, chocolate, limón, fresa y vainilla. Puedes tomar 3 paladas. ¿Cuántas variaciones hay?

Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son

{c, c, c} (3 de chocolate)

{b, l, v} (uno de banana, uno de limón y uno de vainilla)

{b, v, v} (uno de banana, dos de vainilla)

(Y para dejarlo claro: hay n=5 cosas para elegir, y eliges r=3 de ellas.
El orden no importa, ¡y sí puedes repetir!)

Bien, no puedo decirte directamente cómo se calcula, pero te voy a enseñar una técnica especial para que lo averigües tú mismo.

Imagina que el helado está en contenedores, podrías decir "sáltate el primero, después 3 paladas, después sáltate los 3 contenedores siguientes" ¡y acabarás con 3 paladas de chocolate!

Entonces es como si ordenaras a un robot que te trajera helado, pero no cambia nada, tendrás lo que quieres.

Ahora puedes escribirlo como (la flecha es saltar, el círculo es tomar)

Entonces los tres ejemplos de arriba se pueden escribir así:

OK, entonces ya no nos tenemos que preocupar por diferentes sabores, ahora tenemos un problema más simple para resolver: "de cuántas maneras puedes ordenar flechas y círculos"

Fíjate en que siempre hay 3 círculos (3 paladas de helado) y 4 flechas (tenemos que movernos 4 veces para ir del contenedor 1º al 5º).

Así que (en general) hay r + (n-1) posiciones, y queremos que r de ellas tengan círculos.

Esto es como decir "tenemos r + (n-1) bolas de billar y queremos elegir r de ellas". Es decir, es como el problema de elegir bolas de billar, pero con números un poco distintos. Lo podrías escribir así:

Es interesante pensar que podríamos habernos fijado en flechas en vez de círculos, y entonces habríamos dicho "tenemos r + (n-1) posiciones y queremos que (n-1) tengan flechas", y la respuesta sería la misma...

jueves, 16 de febrero de 2017

Probabilidad Condicionada

Varianza

Permutaciones y Combinaciones