
En el tema anterior hemos visto las distribuciones discretas, si no lo leíste es importante que lo leas para tener un primer acercamiento con las distribuciones de probabilidad. También aplicaremos, como en las discretas, algunos conceptos de los temas anteriores: del Tema 1 recordaremos las tablas de frecuencias y gráficos y de los Temas 2 y 3 la media y varianza.
Como ya te dije en el anterior, en este tema vamos a tratar de dar “nombre propio” a ciertos experimentos aleatorios.
¿En qué nos va a facilitar darles nombre propio? Si echas un ojo a la parte final del formulario verás que tienes unas tablas. Cuando le damos nombre propio al experimento nos va a facilitar trabajar con las tablas que nos dan las probabilidades en vez de tener que calcularla.
A lo largo de este tema te enseñaré a usar la tabla de la Normal, en el formulario son las tablas II y VI, esta distribución es la que más vas a usar. También veremos la distribución Chi-cuadrado de Pearson (tabla V), la t de Student (tabla VI), la F de Snedecor (tabla VII).
7.1. Introducción
Recordemos del tema anterior lo que eran las variables aleatorias y los tipos.
Las variables aleatorias se clasifican en dos grandes grupos: Variables aleatorias discretas y Variables aleatorias continuas.
Las discretas son las vistas en el tema anterior y en éste las variables aleatorias continuas.
Las v.a. continuas las definimos igual que las variables cuantitativas continuas, así que serán los experimentos aleatorios que tienen infinitos resultados posibles.
En el caso de las continuas tenemos que tener en cuenta que no hay probabilidad de un solo punto (la probabilidad será 0), las probabilidades en las variables aleatorias continuas se calculan por debajo de un punto, por encima o entre dos puntos. La probabilidad de un punto es 0. Así que es lo mismo poner menor/mayor que menor/mayor o igual.
Por ejemplo, la altura es una v.a. continua y no podemos calcular la probabilidad de medir 1,60 metros, pero si la de medir menos, más o estar entre 1,60 y 1,70.
Centrémonos en las distribuciones conocidas para que lo entiendas mejor.
7.2. Distribución Normal
La distribución normal también la oirás como curva normal o campana de Gauss.
En los enunciados te dirán “tal variable” que se distribuye normalmente con cierta media y cierta varianza o desviación típica. Por ejemplo, la variable X = “Rendimiento académico de los estudiantes de colegios e institutos de Zaragoza” se distribuye normalmente con media 50 puntos y desviación típica 25.
Así, cuando tienes una distribución normal tienes que tener dos datos por lo menos, la media y la desviación típica o varianza.
Una distribución Normal tiene la mayor parte de los datos agrupados alrededor de la media y luego tienes dos zonas a los lados, llamadas colas, donde hay menos datos. Esta es la forma que tiene la campana de Gauss, la forma en que se basan las normales.
7.2.1. Características y propiedades
Al igual que las distribuciones de probabilidad discretas tienen función de probabilidad y distribución, las distribuciones de probabilidad continuas tienen una función que las representa llamada densidad de probabilidad.
No es necesaria que te la aprendas la fórmula ya que en las continuas siempre vamos a trabajar con tablas (a mano se haría con integrales y te recomiendo que ni pienses en ellas).
* π es aproximadamente 3,1416, la propia calculadora te lo da, igual que el número e
La representación de esta función correspondería con el gráfico que hemos visto antes. Y si le echas un ojo verás que cumple unas cuantas características. Te voy a explicar solamente las que te interesan a ti:
- Es simétrica respecto a la media
Esto quieres decir que si lo doblara haciendo una línea en vertical desde la media sería exactamente lo mismo la parte de la derecha y la de la izquierda, coinciden.
- Toda la campana es el total
La totalidad de la campana es el 100%, que en probabilidad es el 1. Saber esto nos servirá trabajar con los complementarios como en el Tema 5. Recuerda que eso era, dado el suceso A:
- Es asintótica en el eje de abscisas
Esto quiere decir que no llega a alcanzar el 0 absoluto. Es decir, en las esquinas derecha e izquierda se va haciendo pequeño pero nunca llega a estar en el 0.
7.2.2. Tipificación y tablas
La acción de tipificar está muy relacionada con el cambio de variable, lo que te expliqué un poco en el Tema 2, parte 1 para la media y Tema 3 para la varianza y desviación típica.
Antes habíamos hablado de la variable X = “Rendimiento académico de los estudiantes de colegios e institutos de Zaragoza” ~ N( 50; 25 ). Si le hacemos una transformación lineal, seguirá siendo una Normal pero con distinta media y varianza.
Por ejemplo hago la transformación Y = 10X – 5, tendremos lo siguiente:
Así que Y se distribuye como una normal con media 495 y desviación típica 250.
Nota: si no te acuerdas de las transformaciones acude al Tema 2, parte 1 en la media y al Tema 3 en la varianza.
Así que hemos descubierto que al tener una variable normal con cierta media y cierta desviación típica, si hacemos una transformación lineal conseguimos otra variable normal con otra media y otra desviación típica.
Si miras en las tablas III y IV del formulario verás que dice Distribución Normal Tipificada. Esto quiere decir que esta tabla vale concretamente para la Normal de media 0 y desviación típica 1.
Así que la pregunta es, ¿qué transformación tengo que hacerle a una variable Normal para que sea una Normal de media 0 y desviación típica 1?
A esta transformación se le llama tipificar una variable. Y la forma es esta:
A la variable que está ya tipificada siempre se la denomina con la letra Z.
Para poder calcular las probabilidades de una Normal cualquiera siempre tendremos que tipificar para poder mirar en las tablas.
Teníamos el ejemplo de X = “Rendimiento académico de los estudiantes de colegios e institutos de Zaragoza” ~ N( 50; 25 ). Supongamos que nos preguntan ¿cuál es la probabilidad de tener un rendimiento académico menor de 40? Escribiéndolo con probabilidades será:
Y como esta probabilidad no la podemos calcular porque X no es N( 0; 1) tenemos que tipificar.
Así que, lo que en una N( 50; 25) era un 40, tipificando decimos que en la N (0; 1) es un -0’4.
Ahora que ya tenemos el valor para la N (0; 1) podemos mirar en las tablas, pero ¿cómo?
Tanto la Tabla III como la IV son de la N (0; 1) para calcular P( Z ≤ z ), es decir, la probabilidad de ser menor que el número z. La diferencia entre ambas tablas es que los valores en la z en la Tabla III son negativos y en la Tabla IV son positivos.
Miremos unos ejemplos.
Ejemplos
Empecemos con el que hemos nombrado antes con la variable X = “Rendimiento académico de los estudiantes de colegios e institutos de Zaragoza” ~ N( 50; 25 ).
Supongamos que nos preguntan ¿cuál es la probabilidad de tener un rendimiento académico menor de 40?
Buscamos el valor -0’4 en la Tabla III:
Así que la probabilidad de tener un rendimiento menor de 40 es de 0’3446.
Más preguntas distintas que vamos a resolver y con las que veremos como trabajar de distintos modos con las tablas:
- ¿Cuál es la probabilidad de tener un rendimiento menor de 73?
- ¿Cuál es la probabilidad de tener un rendimiento mayor de 30?
- ¿Cuál es la probabilidad de tener un rendimiento entre 75 y 80?
- ¿Qué rendimiento tengo si sólo me supera un 10% de alumnos?
Vamos a ir respondiendo poco a poco y paso a paso. Los pasos son: 1) escribimos con probabilidades, 2) tipificar, 3) buscar en tablas y 4) escribir la respuesta.
PREGUNTA 1
La probabilidad de tener un rendimiento menor de 73 es 0’8212. O lo que es lo mismo, el 82’12% de los alumnos tienen un rendimiento inferior a 73.
PREGUNTA 2
En las tablas tenemos la probabilidad de menor que z, así que aquí tenemos que hacer el complementario que habíamos nombrado antes:
El 78’81% de los alumnos tienen un rendimiento mayor de 30.
PREGUNTA 3
En este caso estoy preguntando la probabilidad de una banda. Para hacer esto restamos la pequeña a la zona grande. Mira este gráfico para entenderlo mejor:
La probabilidad de tener un rendimiento entre 75 y 80 es de 0’0436.
PREGUNTA 4
Hasta ahora lo que hemos visto es que me dan un número y yo saco la probabilidad. Pero también lo pueden preguntar a la vez, como en este caso, me dan la probabilidad y me preguntan el número.
Si llamamos a R el rendimiento desconocido que me preguntan:
Que R deje por encima el 10%, quiere decir que deja por debajo del 90%. Que es lo que nos interesa en tablas. ¿Qué numero deja por debajo el 0’9 de probabilidad? Como es probabilidad 0’9 será un número positivo, así que la buscamos esta probabilidad en la Tabla IV (si no coincide hay que buscar la probabilidad más próxima).
Buscando en el interior de la tabla, la probabilidad más próxima a 0’9 es 0’8997, que se corresponde con el número 1’28 (este número es z, no el valor del rendimiento). Así que:
Si esto es lo que teníamos antes, ¿quién es el 1’28?
Así que si sólo me supera un 10% de los alumnos tengo un rendimiento de 82.
7.2.3. Aproximación de la Binomial a la Normal
En el Tema 6, parte 2 te había explicado la distribución Binomial, B( n, p ). Y también habíamos trabajado con las Tablas I y II, pero el tamaño de muestra más alto el 20. ¿Qué ocurre si el tamaño de muestra de la Binomial de un ejemplo es más grande de 20?
Resulta que una Binomial se parece a una Normal cuando n es grande.
Mira la forma que tendría un gráfico de barras de una B( 20, 0’5 ) y lo que se parece a una campana de Gauss.
Así que si tenemos una distribución Binomial con n mayor de 20 hacemos la siguiente aproximación:
La Normal tiene la media y desviación típica como la calculábamos en el Binomial.
Al hacer esta aproximación hay que tener otra cosa en cuenta al ser un paso de una distribución discreta a una continua.
Recuerda que habíamos dicho que para una continua la probabilidad de un punto exacto es 0, así que lo que tenemos que hacer coger un pequeño intervalo.
- Si nos preguntan la probabilidad de x en la Binomial haremos la probabilidad de que esté entre x-0’5 y x+0’5 en la Normal.
- Si nos preguntan la probabilidad de mayor de x en la Binomial, para asegurarnos que eses valor entra hay que coger un valor un poco menor para la Normal.
- Si nos preguntan la probabilidad de menor de x en la Binomial, para asegurarnos que eses valor entra hay que coger un valor un poco mayor para la Normal.
Veamos uno de los ejemplos del Tema 6, parte 2 con mayor tamaño de muestra.
Ejemplos
La variable que vamos a hacer es X = “Nº de personas con 1 hijo de entre 30″ ~ B( 30 ; 0’35).
Así que la aproximación a la Normal (cuando habla de la normal la llamaré XN ) será:
Hagamos algunas preguntas acerca de esta Bi( 30; 0,35 ) ~ N( 10’5 ; 2’6125 ).
- ¿Cuál es la probabilidad de que 10 personas tengan 1 sólo hijo?
- ¿Cuál es la probabilidad de que menos de cuatro personas tengan 1 sólo hijo?
- ¿Cuál es la probabilidad de que más de siete personas tengan 1 sólo hijo?
PREGUNTA 1
PREGUNTA 2
PREGUNTA 3
Hasta aquí llegamos en esta primera parte del Tema 7 de distribuciones continuas. En la siguiente parte del tema vamos a ver otras tres distribuciones continuas, Chi-cuadrado, T de student y F de Snedecor, que se usan menos para el cálculo de probabilidades pero si en ciertos test (los test los verás en la segunda asignatura de estadística que tenéis en 2º, Diseños de investigación y análisis de datos).
Espero que te haya quedado claro, pero si tienes alguna dudilla no tengas reparo en preguntar en los comentarios.
Y si te ha servido y gustado siempre hace ilusión leerlo también, así que comenta. 😉
Saludos y ánimo!
Muchas gracias Lidia, te deseo una felices fiestas Navideñas, y toda la felicidad del mundo.
Besos y abrazos desde Vigo !!!
Hola Nelly,
Felices fiestas para ti también.
Saludos y mucho ánimo!
Lidia
Hola Lidia!! Muchisimas gracias por tus cursos, son muy útiles incluso para los que no estudiamos psicología pero si tenemos estadística en la carrera. Haces un trabajo genial.
Felices fiestas!!
Muchísimas gracias por tu comentario Alexandra!
Me alegro un montón de poder llegar a más personas.
¡Felices fiestas a ti también!
Saludos y ánimo!
Lidia
Gracias lidia, leo el libro y parece chino..que seria de mi sin el blog. mil gracias.
Gracias Yamileth!!
Me alegro de que te sirva 😀
Saludos y ánimo!
Lidia