
En la parte anterior del tema vimos las ideas principales de las distribuciones discretas de probabilidad, cómo calcular las funciones de probabilidad y distribución y cómo calcular su media y su varianza.
En esta última parte del tema ya nos centramos en dos distribuciones discretas de probabilidad con “nombre propio”, la distribución Bernoulli y la Binomial.
He querido incluiros una descripción y unos ejemplos de la Bernoulli ya que en el libro no os lo explican mucho y es muy necesario saber como funciona esta distribución para entender la Binomial.
También vamos a aprender a usar las tablas que tienes al final del libro y del formulario: la tabla I de la función de probabilidad de la distribución Binomial y la tabla II de la función de distribución de la Binomial.
6.3. Distribución Bernoulli
Esta es la primera y más fácil de las distribuciones discretas.
Para que una variable aleatoria tenga una distribución Bernoulli tiene que tener dos posibilidades ACIERTO y FALLO. Diremos que la v.a. se distribuye como una Bernoulli.
No se trata de que la variable tenga 2 resultados posible como el lanzamiento de una moneda, sino que pueden agruparse para que unos pertenezcan al acierto y otros al fallo. Por ejemplo “sacar un as de una baraja de cartas”, sacar algún as es acierto y no sacar un as es fallo.
Una vez que tenemos diferenciado el acierto del fallo tenemos que calcular la probabilidad del acierto. A esta probabilidad la llamaremos p. Por eso la Bernoulli se suele escribir como Be(p), siendo p el parámetro que nos interesa en cada ejercicio.
El fallo es el suceso contrario a el acierto, así que la probabilidad del fallo es la complementaria 1-p, y se le suele llamar q. Así que p+q=1, la suma de las dos probabilidades tiene que ser 1 porque son complementarios.
El experimento se realiza una sola vez.
Su función de probabilidad se escribe así:
Tienes que tener en cuenta que tan pronto puedo decir que para mi el acierto es sacar as o decir que para mi el acierto es no sacar un as. Tendrás que estar bien atento a los enunciados de los ejercicios.
Si queremos calcular la media y la varianza de la una variable aleatoria que se distribuye como una Bernoulli podemos realizar los cálculos como te había explicado en la parte anterior del tema
, pero para las variables aleatorias con “nombre propio”, como las llamaba antes, ya están calculadas. De todos modos, en esta distribución, como es la sencilla, te voy a poner como se haría para que te hagas a la idea y veas que no salen por arte de magia. Si quiere para otra házmelo saber vía email o comentario.
Al acierto se le pone el número 1 y al fallo el número 0, de modo que:
Así que podemos calcular media y varianza como en la parte anterior del tema.
*el último paso se realiza sacando factor común de la p
Así que solo nos queda concluir con las medidas de la distribución Bernoulli:
Ejemplos
Vamos a hacer los dos ejemplos que hemos visto en el apartado anterior.
EJEMPLO DE LA URNA DE BOLAS
La v.a. que vamos a hacer es X = “Sacar bola verde”.
¿Cuál es mi acierto (1) en este ejercicio? Sacar bola verde.
¿Cuál es mi fallo (0)? No sacar bola verde, es decir, sacar bola roja.
X sigue una distribución Be(0,5556)
¿Cuál es la media de acierto? ¿Con qué desviación típica?
Un 55,56% de las veces tomaré a bola verde.
EJEMPLO DEL Nº DE HIJOS
Teniendo estos datos podemos crear distintas variables aleatorias, por ejemplo X = “Tomar una persona y ver si tiene o no más de dos hijos”.
¿Cuál es mi acierto (1) en este ejercicio? Tener más de dos hijos, es decir, tres o cuatro.
¿Cuál es mi fallo (0)? Tener dos hijos o meno, es decir, cero, uno o dos.
X sigue una distribución Be(0,35)
¿Cuál es la media de acierto? ¿Con qué desviación típica?
Un 35% de las veces tomaré a una persona con más de dos hijos.
6.4. Distribución Binomial
Una vez que ya tienes centrada la distribución Bernoulli, la Binomial simplemente consiste en la repetición de Bernoullis, en la repetición de un mismo experimento.
Una variable aleatoria tiene una distribución Binomial si consiste en la repetición de un experimento que tiene dos opciones probables ACIERTO Y FALLO. Estas repeticiones son independientes.
Por ejemplo, “lanzar una moneda un cierto número de veces”, “sacar cierto número de cartas”… La v.a. consistirá en la cuenta del número de aciertos. Tal número de caras, tantos ases, etc.
Al igual que en la distribución Bernoulli p es la probabilidad del acierto y 1 – p = q es la probabilidad del fallo. A esto hay que añadirle n, que va a ser el número de repeticiones.
Su función de distribución se escribe así:
Y al función de distribución:
Tienes que tener en cuenta que tan pronto puedo decir que para mi el acierto es sacar as o decir que para mi el acierto es no sacar un as. Tendrás que estar bien atento a los enunciados de los ejercicios.
Las fórmulas de la función de probabilidad y de distribución en verdad no las vas a usar, ya que usarás la Tabla I (p.21 y siguientes) del formulario para la de probabilidad y la Tabla II (p. 26 y siguientes) para la de distribución, pero está bien que sepas como calcular el número combinatorio:
Como te decía con la Bernoulli, las distribuciones con “nombre propio” tienen la media y varianza ya creadas, y la tienes en el formulario.
Ejemplos
Vamos a hacer los dos ejemplos que hemos visto en el apartado anterior pero modificados para que sean Binomiales.
EJEMPLO DE LA URNA DE BOLAS
La v.a. que vamos a hacer es X = “Número de bolas verdes al hacer tres extracciones con reposición, es decir, volviendo a meter la bola extraída, de la urna”.
¿Cuál es mi acierto (1) en este ejercicio? Sacar bola verde.
¿Cuál es mi fallo (0)? No sacar bola verde, es decir, sacar bola roja.
Recuerda que la probabilidad de sacar bola verde es 5/9, nuestro acierto, y de no sacar bola verde 4/9, nuestro fallo.
Nuestra primera intención tiene que ser ir a buscar a las tablas de probabilidad binomial. Analicemos qué es lo que tenemos que buscar en las tablas.
Lo primero que tenemos que hacer es buscar el número de repeticiones del ejercicio, en este caso 3 (tenemos cuatro filas correspondientes a n=3 en la tabla), y también la probabilidad en las columnas. En este ejemplo vamos a tener que hacer los cálculos, ya que esta probabilidad no sale en tablas.
X sigue una distribución Bi( 3; 0,5556 )
¿Cuál es la media de bolas verdes extraídas? ¿Con qué desviación típica?
Recuerda a qué corresponden las probabilidades halladas en la tabla. Te voy a poner algunas preguntas posibles y sus respuestas.
¿Cuál es la probabilidad de que de las tres extracciones saque las tres bolas verdes?
¿Cuál es la probabilidad de sacar menos de 3? Sacar menos de 3 es sacar 0, 1 ó 2.
¿Cuál es la probabilidad de sacar al menos 2 verdes? Decir al menos es que como poco sean 2 bolas verdes.
EJEMPLO DEL Nº DE HIJOS
Teniendo estos datos podemos crear distintas variables aleatorias, por ejemplo X = “Nº de personas con 1 hijo de entre 10”, Y = “Nº de personas con más de 1 hijo de entre 8”.
Vamos a calcular las dos.
X = “Nº de personas con 1 hijo de entre 10”
¿Cuál es mi acierto (1) en este ejercicio? Tener un hijo.
¿Cuál es mi fallo (0)? No tener dos hijos, es decir, tener 0, 2, 3 ó 4.
X sigue una distribución Bi( 10; 0,35 )
¿Cuál es la media de acierto? ¿Con qué desviación típica?
Tomando un grupo de 10 personas, en media 3,5 de ellas tendrán un hijo (por consiguiente 6,5 no tendrán hijos o tendrán más de 1, esto sale por hacer 10-3,5).
Hagamos algunas preguntas acerca de esta Bi( 10; 0,35 ).
- ¿Cuál es la probabilidad de que las 10 personas tengan 1 sólo hijo?
- ¿Cuál es la probabilidad de que menos de cuatro personas tengan 1 sólo hijo?
- ¿Cuál es la probabilidad de que más de siete personas tengan 1 sólo hijo?
Siendo que X = “Nº de personas con 1 hijo de entre 10”, los enunciados de las tres preguntas escritas como probabilidad serían: 1) P( X = 10 ), 2) P( X < 4 ) y P( X > 7 ).
Estos ejercicios los podemos buscar con la tabla de la Binomial. El ejercicio 1, como es igualdad a un número con la tabla I, y los ejercicios 2 y 3 con la tabla II.
Lo primero que tenemos que hacer es buscar el número de repeticiones del ejercicio, en este caso 10, y también la probabilidad en las columnas, en nuestro caso 0,35.
Con esto ya podemos resolver P( X = 10 ). Ya tenemos ubicado p = 0,35 y el n = 10. Lo que he recuadrados con las probabilidades de que haya 0 personas, 1 persona, 2 personas, … 10 personas con 1 sólo hijo. Así que para la pregunta 1) decimos:
Cuando en la tabla pone 0.0000 se suele poner que es próximo a 0.
Es decir, es casi imposible que todas las personas tengan exactamente un hijo.
Para las preguntas 2 y 3 necesitamos la tabla II, la función de densidad binomial.
Trabajamos del mismo modo, buscando la n que queremos, n = 10 en este ejemplo y p = 0,35. Y el correspondiente x que queremos.
En la pregunta 2) tenemos P( X < 4 ), como en la tabla es menor o igual, es lo mismo ser menor de 4 que ser menor o igual a 3, así que:
Y en la última pregunta pedíamos P( X > 7 ). Aquí tenemos que jugar un poco con las probabilidades ya que en la tabla tenemos las probabilidad de menores, se suele decir probabilidad hacia abajo.
El juego que tenemos que hacer es trabajar con el inverso. Es lo mismo la probabilidad de que haya más de 7 personas (es decir, 8, 9 y 10) que 1 menor la probabilidad de que haya 7 o menos. Así:
Y = “Nº de personas con más de 1 hijo de entre 8”
¿Cuál es mi acierto (1) en este ejercicio? Tener más de un hijo, es decir, 2, 3 ó 4.
¿Cuál es mi fallo (0)? Tener uno o menos hijos, es decir, tener 0 ó 1.
*He cambiado las probabilidades para que salgan en tablas y poder jugar con ella.
X sigue una distribución Bi( 8; 0,55 )
¿Cuál es la media de acierto? ¿Con qué desviación típica?
Tomando un grupo de 8 personas, en media 4,4 de ellas tendrán más de un hijo (por consiguiente 3,6 tendrán un hijo o ninguno, esto sale por hacer la resta 8-3,6).
Hagamos algunas preguntas acerca de esta Bi( 8; 0,55).
- ¿Cuál es la probabilidad de que las 8 personas tengan más de un hijo?
- ¿Cuál es la probabilidad de que menos de tres personas tengan más de un hijo?
- ¿Cuál es la probabilidad de que más de seis personas tengan más de un hijo?
Siendo que Y = “Nº de personas con más de 1 hijo de entre 8”, los enunciados de las tres preguntas escritas como probabilidad serían: 1) P( Y = 8 ), 2) P( Y < 3 ) y P( Y > 6 ).
Estos ejercicios los podemos buscar con la tabla de la Binomial. El ejercicio 1, como es igualdad a un número con la tabla I, y los ejercicios 2 y 3 con la tabla II.
Lo primero que tenemos que hacer es buscar el número de repeticiones del ejercicio, en este caso 8, y también la probabilidad en las columnas, en nuestro caso 0,55.
¿Cuál es el problema aquí? La máxima probabilidad que nos dan es 0,5 y nosotros queremos 0,55.
¿Este problema cómo lo solucionamos? Dándole la “vuelta a la tortilla”.
La pregunta 1 nos decía que las 8 personas tengan más de 1 hijo. Que las 8 personas tengan más de un hijo es lo mismo que el hecho de que ninguna tenga uno o cero hijos. ¿Lo ves? Si hay 8 personas con más de un hijo, ¿cuántas tienen uno o cero? ¡NINGUNA!
Pues con esto tenemos que jugar: la variable original Y = “Nº de personas con más de 1 hijo de entre 8” y la de lo contrario Y’ = “Nº de personas con 0 ó 1 hijo de entre 8”. La variable Y se comporta como Bi( 8; 0,55 ) y la Y’ como Bi( 8; 0,45).
Ya podemos resolver las preguntas.
Así que para la pregunta 1) Probabilidad de que las 8 personas tengan más de 1 hijo decimos:
Para las preguntas 2 y 3 necesitamos la tabla II, la función de densidad binomial. Trabajamos del mismo modo, buscando la n que queremos, n = 8 en este ejemplo y p = 0,55 (para Y) y p = 0,45 (para Y’). Y el correspondiente x que queremos.
En la pregunta 2) tenemos probabilidad de que haya menos de 3 personas con más de 1 hijo, con la variable Y, que es lo mismo que 2 o menos. Pero necesitamos hacerlo con Y’ (por lo de la probabilidad), así que diremos probabilidad de que haya 6 personas o más con 1 hijo o menos (esto sale de la resta 8-2).
Y en la última pregunta pedíamos P( Y > 6 ), probabilidad de que haya más de seis personas con más de un hijo, es decir, siete o más; esto es lo mismo que decir que haya una persona o menos con un hijo o ninguno.
Hasta aquí llegamos con el Tema 6 de distribuciones discretas. En el siguiente tema veremos las distribuciones continuas. Veremos la distribución Normal en profundidad ya que es una de las más usadas y sobre la que te preguntan en el examen 100%. También veremos las distribuciones Chi-cuadrado, t de Student y F de Snedecor, sobre todo para que las conozcas un poco y no vaya de nuevas cuando te aparezcan en tema próximo y en el curso que viene.
Espero que te haya quedado claro, pero si tienes alguna dudilla no tengas reparo en preguntar en los comentarios.
Y si te ha gustado y servido siempre hace ilusión leerlo también, así que comenta. 😉
Saludos y ánimo!
Hola Lidia!
Primero quería felicitarte una vez más por hacer tan amena y clara esta asignatura, Gracias!!
También quería preguntarte una duda, allá voy.
En el ejercicio de número de hijos de la Binomial, en la primera pregunta de la variable X, (¿Probabilidad de que las 10 personas tengan un solo hijo?), a la hora de buscar en la tabla, la columna de n sería 10, pero lo que no entiendo es porque la columna de x me tengo que ir a 10, en lugar de a 1.
No sé si me he explicado del todo bien, espero que me puedas ayudar. Gracias 🙂
Hola Beatriz.
Gracias por tus ánimos!! 😀
Te entiendo la pregunta. El valor de la x tiene que ser la respuesta de ¿Cuántas de esas 10 personas quiero que tengan 1 hijo? Quiero que las 10 personas tengan 1 hijo. ¿Entendido?
Si en la columna de las x te vas al 1 quiere decir que de esas 10 personas sólo quieres que 1 tenga 1 hijo.
Saludos y ánimo!
Lidia
hola Lidia !! Enhorabuena por tu blog!!
Muchas gracias por tu comentario Sime.
Saludos y ánimo!
hola gracias por tu blog, resulta de gran ayuda. Solo una pequeña duda en el primer ejemplo de la binomial, el de las bolas verdes, cuando cxalculas la probabilidad de sacar menos de 3 bolas verdes, es decir 0,1, o 2, dices que F(2)=0,417, pero si me subo a la tabla el F(2)=0,828, es que no se si no lo he entendido bien del todo o es un pequeño fallo. Gracias de antemano!
Hola Elena,
Perdona, error mío. Sí que es 0’828, ahora lo modifico. Gracias por darte cuenta.
Saludos y ánimo!
Lidia
En las 2 últimas preguntas: como sacas el Y’5? no entiendo como llegas a eso después de y’>6.
No debería ser y’ < o igual a 1 en vez de 3 ya que n es 8 y no 10? Me he perdido algo?
Hola Andrés,
Doy por hecho que estás hablando de las preguntas 2 y 3 de la Binomial, sí que de la variable Y.
De la pregunta 2, estando en el punto P( Y’> 6 ) date cuenta que en las tablas las probabilidades son de MENOR O IGUAL, así que en la tabla no podemos buscar P ( Y’> 6 ). Por ello tenemos que buscar el contrario [la teoría de los contrarios la tienes en la primera parte del Tema 5], lo contrario de ser mayor que 6 es ser 5 ó menos.
Y ciertamente en la pregunta 3 sí que es 1 y no 3, 😀 error mido, ahora lo modifico, gracias.
Espero haberte ayudado.
Saludos y ánimo!
Lidia
Lidia, me estoy volviendo loca con las dos últimas preguntas: por qué en la última no le restas a 1 y en la anterior sí? El caso es que en momentos me viene la respuesta a la cabeza pero me vuelven las dudas…
Gracias!
Hola Eva,
Tienes estar atenta de si es «menor de» o mayor de», porque en las tablas siempre tenemos la probabilidad de menor que.
Tienes que recordar el comienzo del Tema 5, con la idea de los contrarios.
Saludos y ánimo!
Lidia
Muy buenas Lydia…. a la hora de hacer los ejercicios y despues de leer tus apuntes sigue sin quedarme claro cuando utilizar la tabla 1 y la tabla 2. Si fueras tan amable de explicarmelo.
Un saludo
Hola Rosa.
Me alegro de que estés leyéndome.
La primera de las tablas, la de función de probabilidad, es para cuando tienes que calcular la probabilidad de un sólo valor y la segunda, la de función de distribución, es para cuando tienes que calcular la probabilidad de unos cuantos valores o de que sea menor o igual que un valor.
Por ejemplo, si tengo que calcular la probabilidad de tener dos hijos, EXACTAMENTE 2 HIJOS, uso la TABLA 1 y busco la probabilidad del 2. Si tengo que calcular la probabilidad de tener dos hijos o menos (otros ejemplos: dos hijos o más, más de dos hijos), es decir, la probabilidad de tener 2 HIJOS, 1 HIJO O 0 HIJOS, tengo que usar la TABLA 2 y buscar la probabilidad de menor o igual a 2.
¿Te ha quedado más claro? ¡¡Espero que sí!!
Saludos y ánimo!
Lidia
Te has explicado genial.
Tu blog me está sirviendo de mucha ayuda.
muchas gracias!!!!!!
Me alegro mucho de que te sirva. Así que ¡a por ello!
Saludos y ánimo!
Lidia
Hola lidia soy de colombia felicidades por tu bloc esta muy bueno. Te podria pexir un favor es que tengo un taller de probabilidades ya lo resolvi pero quisiera tner una opinion sobre mis respiestas que tal estaran. De verdad estoy muy preocupado tiene una nota muy importante en mi carrera me podrias ayudar en ella uso las distribuciones binomial poisson y normal podrias ayudarme por favor?
Hola Andrés,
Por favor, los comentarios de esta índole ponte en contacto conmigo vía email desde Contacto (https://estadisticalidia.com/contacto/).
Envíame la información y lo hablamos en privado.
Ánimo y saludos!
Lidia
Hola Lidia, tengo un par de preguntas por si puedes resolvérmelas.
1. En el apartado de distribución binomial, ¿qué utilidad tiene realizar la tabla con todas las probabilidades del ej de la urna de bolas? Se supone que conocienco la probabilidad del acierto y error podemos calcular la media y varianza y llegar a la conclusión,¿no?
2. A la hora de buscar probabilidades en las tablas del formulario, no entiendo cuando se utiliza la tabla de probabilidad y cuando la de distribución. ¿Depende de los datos que me den en la pregunta?
Muchisimas gracias de nuevo, esto se complica y hay muchas cosas a tener en cuenta jeje.
Un saludo.
Leonor
Hola Leonor,
Por un lado, la tabla de probabilidad y calcular la media y varianza son dos cosas distintas, es decir, son preguntas distintas. Si te preguntan, ¿cuál es la probabilidad de sacar 3 bolas? Tienes que calcular la probabilidad, no es necesario calcular la media y la varianza para ello.
La distinción que tienes que hacer entre función de probabilidad y función de distribución es si necesitas saber la de un valor o la de un rango. Si te preguntan P ( sacar dos bolas verdes ) = P ( X = 2 ) es un valor, así que buscas en la tabla de probabilidad. Pero si te preguntan P ( sacar menos de dos bolas verdes ) = P ( X < 2 ) = P ( X <= 1 ) es la probabilidad de un rango, así que buscarás en la tabla de distribución. En verdad tabla de probabilidad y de distribución son lo mismo, pero la de distribución es la suma de la de probabilidad. Quiero decir, que en la última pregunta, P ( X <= 1 ), es lo mismo ir a la distribución de probabilidad y buscar el 1 o ir a la de probabilidad y buscar la del 0 y la de 1 y sumarlas: P ( X <= 1) = P ( X = 0 ) + P ( X = 1 ). Saludos y ánimo! Lidia