
En el tema anterior hemos visto las ideas principales de probabilidad, algunas de las cuales vamos a aplicar en este tema. También aplicaremos algunos conceptos de los temas anteriores: del Tema 1 recordaremos las tablas de frecuencias y gráficos y de los Temas 2 y 3 la media y varianza.
En el tema anterior hemos visto la generalidad de tener un suceso y calcular probabilidades mediante conteo. En este tema y en el siguiente se va a tratar de darles nombre ya que algunos experimentos aleatorios tienen la forma adecuada para llamarlos con “nombre propio”.
¿En qué nos va a facilitar darles nombre propio? Si echas un ojo a la parte final del formulario verás que tienes unas tablas. Cuando le damos nombre propio al experimento nos va a facilitar trabajar con las tablas que nos dan las probabilidades en vez de tener que calcularla.
A lo largo de este tema te enseñaré a usar la tabla de la Binomial, en el formulario son las tablas I y II.
6.1. Introducción
Lo primero con lo que tenemos que empezar es con la definición de variable aleatoria.
En el Tema 1 habíamos definido Variable y en el Tema anterior el Experimento aleatorio:
La definición de Variable aleatoria parece una mezcla de ambos. Una variable aleatoria es un experimento que queremos estudiar, del cual conocemos los resultados posibles y la probabilidad de que ocurra cada uno de ellos.
Ya habíamos definido en el tema anterior que las probabilidades son números y también habíamos hablado de sus características. Esas características se siguen manteniendo en este tema.
A las variables aleatorias las denominamos como a las variables, primero X y si hay más Y, Z (no se suele trabajar con más variables).
La variable aleatoria la definiremos según lo que queremos estudiar del experimento realizado.
Al explicar en el tema anterior los experimentos aleatorios habíamos definido tres ejemplos:
- Si lanzamos un dado no sabemos qué cara nos va a salir, pero sabemos que nos pueden salir del 1 al 6.
- Si lanzamos una moneda, aunque no sabemos que cara va a salir, sabemos que nos saldrá cara o cruz.
- Si lanzamos un balón a canasta sabemos que podemos encestar o no encestar.
Sobre estos experimentos podemos definir distintas variables aleatorias. Por ejemplo:
- En el lanzamiento del dado: X = “Número de seises obtenidos al lanzar un dado 4 veces”, Y = “Número de pares obtenidos al lanzar el dado 10 veces”, etc.
- En el lanzamiento de la moneda: X = “Número de caras al hacer tres lanzamientos”, Y = “Euros ganados si por las caras gano 2 y por las cruces 1 al hacer 10 lanzamientos”.
- En el lanzamiento del balón: X = “Número de canastas al lanzar 5 veces”, Y = “Probabilidad de encestar tres veces en 1 minuto”.
Ten en cuenta que estos sólo son algunos ejemplos.
6.1.1. Tipos de variables aleatorias
Del mismo modo en que habíamos clasificado las variables en cualitativa, cuantitativa discreta y cuantitativa continua (en el Tema 1, parte 1), las variables aleatorias también se clasifican.
Las variables aleatorias se clasifican en dos grandes grupos: Variables aleatorias discretas y Variables aleatorias continuas.
Las v.a. discretas se definen del mismo modo que definíamos las variables cuantitativas discretas. Es decir, experimentos aleatorios en los que podemos enumerar los resultados posibles.
Y las v.a. continuas las definimos igual que las variables cuantitativas continuas, así que serán los experimentos aleatorios que tienen infinitos resultados posibles. Este tipo de variables las estudiaremos en el Tema 7.
Los resultados de las v.a. discretas las denominamos con subíndices en la letra que hayamos puesto a la variable en minúscula.
Por ejemplo, en el ejemplo de X = “Número de seises obtenidos al lanzar un dado 4 veces”, tendríamos los siguientes resultados posibles: x1 = 0, x2 = 1, x3 = 2, x4 = 3, x5 = 4. Esto quiere decir que como poco no saco ningún seis y como mucho saco seis en todos los lanzamientos.
6.1.2. Funciones de probabilidad y de distribución de una v.a.
Antes de explicar lo que son las funciones de probabilidad y de distribución primero necesito que recuerdes cómo hacíamos las tablas de frecuencias en el Tema 1, parte 2 y cómo calculábamos las frecuencias relativas y su acumulada de modo que quedaba una tabla como esta:
La columna pi nos está diciendo la probabilidad de tener 0, 1, 2… hijos. Y esto mismo lo denominamos función de probabilidad.
La función de probabilidad, que escribiremos como f(x), le da a cada uno de los posibles valores de una v.a. una probabilidad de suceder. En este ejemplo tenemos f(0), f(1), … ,f(4).
En verdad no es más que otro modo de llamar a las cosas. Lo que antes habíamos llamado como frecuencia relativa de la variable ahora es la función de probabilidad de la variable aleatoria.
En el ejemplo hemos hecho que la variable aleatoria X = “Número de hijos” tome 5 valores distintos, así que tenemos los siguientes valores para la función de probabilidad:
f(0) = 0,175 f(1) = 0,35 f(2) = 0,125 f(3) = 0,125 f(4) = 0,225
La función de probabilidad tiene que cumplir ciertas propiedades que ya te sonaran por las que propiedades de la probabilidad (ya ves que está todo muy relacionado).
- Para cualquiera de los valores de la variable aleatoria, la función tomará valores entre 0 y 1.
- La suma de la función en todos los valores da 1.
Por otro lado, la columna pai nos está diciendo la probabilidad acumulada, es decir, la probabilidad de tener 0 hijos, 1 hijo o menos, 2 hijos o menos… Y esto mismo lo denominamos función de distribución.
La función de distribución, que escribiremos como F(x), le da a cada uno de los posibles valores de una v.a. la probabilidad de que suceda él o un valor inferior. En este ejemplo tenemos f(0), f(≤1), … ,f(≤4).
Lo que antes habíamos llamado como frecuencia relativa acumulada de la variable ahora es la función de distribución de la variable aleatoria.
La función de distribución de un valor de la variable es la suma de la función de probabilidad de ese valor y de los valores anteriores, como hacíamos con las frecuencias acumuladas.
En el ejemplo de X = “Número de hijos” tenemos:
F(0) = f(0) = 0,175 F(1) = f(0) + f(1) = 0,525 F(2) = f(0) + f(1) + f(2) = 0,65
F(3) = f(0) + f(1) + f(2) + f(3) = 0,775 F(4) = f(0) + f(1) + f(2) + f(3) + f(4) = 1
- Para cualquiera de los valores de la variable aleatoria, la función tomará valores entre 0 y 1.
- Que la función sea no decreciente quiere decir que conforme voy aumentando el valor de x la función de densidad irá aumentando o quedándose constante. Y recuerda que el valor de la función de distribución del último valor de x será 1.
Veamos la representación que se puede hacer con las dos funciones:
Además de que me pidan la probabilidad de un valor y la probabilidad de un valor o menor, también me pueden pedir la probabilidad de estar entre dos números. Por ejemplo, la probabilidad de tener 1, 2 ó 3 hijos.
En este ejemplo es sencillo de calcular porque son pocos valores y solo tendríamos que hacer f(1) + f(2) + f(3). Pero si tuviésemos muchos más datos este no sería el modo bueno de hacerlo, no sería nada ágil.
El modo de hacerlo es restando funciones de distribución, teniendo bien en cuenta el valor que estoy cogiendo. Así que fíjate bien a quien estoy cogiendo con la función de distribución:
Así que si queremos hacer la probabilidad de tener 1, 2 ó 3 hijos tenemos que hacer lo siguiente:
Cogiendo F(3) tenemos la probabilidad de 0, 1, 2 y 3 hijos, de aquí nos sobra la de 0, así que la restamos.
Ejemplo
Cojamos de nuevo la urna de bolas y añadamos algunas más.
Y creemos la siguiente variable aleatoria:
X = “Número de bolas verdes que salen al realizar 3 extracciones”
Tenemos cuatro resultados posibles:
- 0 bolas verdes. Es decir todas las que he sacado son rojas (1ªR, 2ªR y 3ªR)
- 1 bola verde y el resto rojas. Ten en cuenta que la verde puede estar en cualquier posición (1ªV, 2ªR y 3ªR || 1ªR, 2ªV y 3ªR || 1ªR, 2ªR y 3ªV)
- 2 bolas verdes y la otra roja. Ten en cuenta que la roja puede estar en cualquier posición (1ªV, 2ªV y 3ªR || 1ªV, 2ªR y 3ªV || 1ªR, 2ªV y 3ªV)
- 3 bolas verdes y ninguna roja (1ªV, 2ªV y 3ªV)
Calculemos las funciones de probabilidad y distribución:
*He redondeado a 4 decimales, así que hay un poco de error de redondeo
¿Cuál es la probabilidad de sacar más de una bola verde?
La probabilidad de sacar más de una bola verde es sacar dos o tres. Lo podemos hacer sumando f(2) y f(3), pero también podemos trabajar con el complementario o contrario.
El contrario de sacar más de una bola verde es sacar una o menos, es decir F(1), así que:
6.1.3. Media y varianza de una v.a.
Al igual que hicimos en el Tema 2 y en el Tema 3, ahora también podemos calcular medias y varianzas. La forma es un poco distinta, pero tiene las mismas ideas.
Para hacer la media con los datos en tabla de frecuencias hacíamos esta fórmula:
La fórmula para la media en variables aleatorias es muy similar a la hecha con la frecuencia relativa.
Es decir, la suma de cada valor por su valor en la función de probabilidad.
La media (µ) es el valor esperado de la variable, por eso se llama también E(X) “esperanza de X”.
Y para hacer la varianza con los datos en tabla de frecuencias hacíamos esta fórmula:
La fórmula para la varianza en variables aleatorias es muy similar a la hecha con la frecuencia relativa.
Es decir, la suma del cuadrado de cada valor menos la media por su valor en la función de probabilidad.
La varianza (σ2) es el valor esperado del cuadrado de la variable menos la media.
También tenemos unas fórmulas más sencillas para calcular la varianza si desarrollamos el cuadrado que hay en la esperanza (si quieres saber el proceso pregúntame en los comentarios, no lo incluyo aquí porque no es necesario que lo sepas) y que son las que vamos a usar en los ejercicios.
Lo que sí que quiero que te des cuenta es que E(X)2 es la media al cuadrado.
Y por último, para la desviación típica no tenemos más que hacer la raíz.
Ejemplos
Vamos a hacer los dos ejemplos que hemos visto en el apartado anterior.
EJEMPLO DEL Nº DE HIJOS
Para calcular la media calculamos la columna xif(xi) y para a la varianza xi2f(xi).
EJEMPLO DE LA URNA DE BOLAS
Para calcular la media calculamos la columna xif(xi) y para a la varianza xi2f(xi).
Hasta aquí llegamos en esta primera parte del Tema 6 de distribuciones discretas. En el apartado siguiente veremos dos «nombres propios» de distribuciones discretas, la Bernoulli y Binomial, que son las que os entran en temario. También echaremos un ojo rápido a otras distribuciones discretas.
Espero que te haya quedado claro, pero si tienes alguna dudilla no tengas reparo en preguntar en los comentarios.
Y si te ha gustado y servido siempre hace ilusión leerlo también, así que comenta. 😉
Saludos y ánimo!
Muchísimas gracias Lidia, tus publicaciones son impagables .
Un saludo agradecido desde Vigo!
Nelly
Me alegro de que te sirvan Nelly. Muchas gracia por tu comentario.
Saludos y ánimo!
Lidia
Hola lidia :
No entiendo como se saca la puntuación de Pil en la primera tabla numeros de hijos (tercera columna ). Me dices que es la probabilidad acumulada pero no se si es directamente del Pi ??
NO me salen las cuentas.
Un saludo
Consu
Hola Consuelo,
La explicación sobre como sacar los cálculos de las tablas está en el Tema 1, parte 2: Organización de datos.
¡Qué te sea de ayuda!
Saludos y ánimo!
Lidia
Hola Lidia, buenas tardes.
Lo primero darte las gracias por el material subido, es de una gran ayuda para todos a los que esto se nos da fatal como a mi.
Te dejo este comentario porque no entiendo el ejemplo de la caja con las bolas de colores. ¿Podrías poner como sería el desarrollo? Es que yo lo hice y aunque no me sale con los mismos números, el resultado final me coincide.
Muchas gracias y un saludo!
Hola Pablo.
Muchas gracias por tu comentario.
¿Al ejemplo de la urna de bolas de qué apartado te refieres en tu pregunta?
Saludos y ánimo!
Lidia
Buenas, olvidé decir que era del 6.1.2.
Hola Pablo.
Había un par de cosas mal en el ejemplo (los resultados finales no) que se me habían colado. Échale un ojo ahora a ver.
Saludos y ánimo!
Lidia
Yo en este ejemplo del epígrafe 6.1.2 lo que no entiendo de dónde salen las operaciones para la función de probabilidad de cada valor. Para 0 sí, porque lo pones (f(0)=P(X=0)=P(1ªR∩2ªR∩3ªR)=P(1ªR)xP(2ªR/1ªR)xP(3ªR/1ªR∩2ªR)
pero después pones directamente las fracciones de las probabilidades y no sé de dónde sale cada una, me lio, podrías ponerlas como con el 0? Mil gracias una vez más por tu contribución.
Hola Adei!
Me alegra leer tu comentario, esto es que le estás dando uso al material del blog 😀
Te explico la duda a continuación, y recuerda, si quieres que todo quede bien clarito no dudes en contratar una clase por videollamada y nos vemos.
f(1) -> esta es la probabilidad de que salga una bola verde en al realizar tres extracciones. Tenemos que tener en cuenta de que esa bola verde puede salir en primera, segunda o tercera posición. Por ello:
f(1) = P(X=1) = P[( 1ªV ∩ 2ªR ∩ 3ªR ) ∪ ( 1ªR ∩ 2ªV ∩ 3ªR ) ∪ ( 1ªR ∩ 2ªR ∩ 3ªV )]
= P(1ªV)·P(2ªR | 1ªV)·P(3ªR | 1ªV ∩ 2ªR) + P(1ªR)·P(2ªV | 1ªR)·P(3ªR | 1ªR ∩ 2ªV) + P(1ªR)·P(2ªR | 1ªR)·P(3ªV | 1ªR ∩ 2ªR)
Con el desarrollo de este te será más sencillo sacar el de f(2) tú sola. Y la de f(3) lo podrás sacar también con el de f(0) que ya estaba desarrollado en el temario. Si no lo ves y quieres que lo veamos juntas lo hablamos.
Saludos y ánimo!
Lidia
Muchas gracias por los apuntes, gran trabajo!
Muchas gracias por tu comentario Ilenia.
Ánimo!
Buenas Patri! Enhorabuena por el Blog! Tengo un problema, y es que me cuesta mucho la asignatura y aunque la expliques por aquí, sigo teniendo unas cuantas dudas… aquí va la primera:
En el primer ejemplo que has puesto de sacar bolas verdes en tres extracciones, no me ha quedado claro el proceso para lograr los números de la columna del medio.
Gracias!
Jajaja Hola Ayshel.
Espero que el comentario sea para mi (Lidia), no se quien es Patri XD
La explicación en palabras sobre lo que preguntas, en el caso por ejemplo de f(0) «Probabilidad de entre las tres bolas que saco el número de verdes sea 0»:
– Si saco tres bolas y no quiero sacar verde, las tres tendrán que ser rojas todas, por lo que tiene que ser roja la primera (1ªR) y la segunda (2ªR) y la tercera(3ªR)
– Como la extracción es sin reposición (es decir, cuando saco una bola no la vuelvo a meter a la caja y eso hace que el número de bolas y probabilidades cambie) las probabilidades son condicionadas a lo que haya sacado la vez anterior.
– De este modo, la primera probabilidad es sencilla P(1ªR), la segunda está condicionada a lo que saco en la primera P(2ºR|1ªR) y la tercera es condicionada a lo que saco en la primera y segunda P(3ªR|1ªR y 2ªR).
Espero que te quede más claro! Si sigues teniendo problemas no tengas duda en contratar una videoclase (es más sencillo explicarlo con una pizarra que con letra jeje).
Saludos y ánimo!
Lidia