
En la entrada anterior hemos visto la primera parte de las distribuciones continuas, si no lo leíste es importante que lo leas para tener un primer acercamiento con las distribuciones de probabilidad continuas. Además vimos la distribución continua más usada, la Distribución Normal.
En esta parte del tema veremos tres distribuciones continuas con “nombre propio”. Estas distribuciones las verás menos que la Normal, que tiene muchas más aplicaciones, pero en la asignatura del curso que viene la usarás para los test. Sobre todo usarás las tablas de probabilidad, así que bien atento para no liarla.
Para las distribuciones que vamos a ver en esta parte del tema usaremos la Tabla V para la Chi-cuadrado de Pearson, la Tabla VI para la t de Student y la tabla VII para la F de Snedecor.
7.3. Distribución Chi-cuadrado de Pearson
La distribución Chi-cuadrado de Pearson se escribe como χ2 y está creada por la suma de distribuciones Normales.
Es decir, si tenemos n v.a. que se distribuyen como Normales tipificadas y las sumamos conseguimos una nueva distribución que se distribuye como una Chi-cuadrado de Pearson con n grados de libertad.
Los grados de libertad no son mas que un parámetro, un número, que necesitas conocer de la distribución para calcular probabilidades.
Al igual que todas las distribuciones la Chi-cuadrado también tiene su media y desviación típica que dependen de su parámetro (grados de libertad).
7.3.1. Características y propiedades
La forma gráfica de la Chi-cuadrado depende de los grados de libertad que tenga.
Echándole un ojo al gráfico se pueden intuir algunas propiedades. Te voy a explicar solamente las que te interesan a ti:
- No es simétrica, sino que principalmente es asimétrica positiva
La distribución normal era simétrica respecto a la media y de este modo nos podía facilitar ciertos cálculos. La Chi-cuadrado no es simétrica, es asimétrica positiva, es decir, tiene cola derecha.
- Toda la gráfica es el total
La totalidad de la gráfica es el 100%, que en probabilidad es el 1. Saber esto nos servirá trabajar con los complementarios como en el Tema 5. Recuerda que eso era, dado el suceso A:
- Toma valores positivos
En el imagen puedes ver que a la izquierda está el 0 y que la gráfica se crea la derecha del 0, es decir, donde los valores son positivos.
- Para valores altos de n se aproxima a la Normal
Puedes ver en la imagen que la curva con 5 grados de libertad no se asemeja a la campana de Gauss pero la de 15 si que quiere parecerse un poco, y cuanto más alto sea el valor de los grados de libertad (cuantas más v.a. normales sumemos) más se aproximará a la distribución Normal.
Concretamente, cuando n sea mayor que 100 pasaremos directamente a trabajar con la Normal.
7.3.2. Tabla de la Chi-cuadrado
Si miras en la tabla V del formulario verás que dice Distribución Chi-cuadrado.
Como puedes ver esta tabla es diferente que la de la Normal, en la que teníamos el número en la zona exterior (la zona naranja) y dentro la probabilidad.
En la Chi-cuadrado y en la t de Student las tablas tendrán dentro el número, los grados de libertad en la primera columna y en la primera fila la probabilidad. Eso sí, al igual que en la Normal la probabilidad que pone es la probabilidad de estar por debajo del número.
Con estas distribuciones continuas se trabaja más con percentiles (recuerda que explicamos los percentiles en el Tema 2, parte 2) que con la idea de “qué probabilidad deja por debajo este número”. Ten en cuenta que en la distribución Normal lo sencillo era buscar un número y calcular su probabilidad, en estas tablas lo sencillo será buscar una probabilidad y dar el número.
Así que las preguntas suelen ser del tipo “¿qué número deja por debajo una probabilidad del 0’9?”. Sería la idea de P( X < ¿? ) = 0’9, pero ahora lo escribimos así:
Trabajemos con unos ejemplos para que quede claro.
Ejemplos
Tenemos siete variables aleatorias que se distribuyen como normales con media 0 y desviación típica 1. Creamos una nueva variable con la suma de las siete, ¿qué distribución tiene? ¿Qué media y varianza tiene?
A la nueva v.a. la voy a llamar X, y como es suma de siete N( 0; 1) se va a distribuir como una χ27, una Chi-cuadrado con 7 grados de libertad. Vamos a calcular su media y varianza:
- ¿Qué número deja por debajo una probabilidad de 0’9?
- ¿Qué número deja por encima una probabilidad de 0’05?
- ¿Cuál es la probabilidad de que X tome valores menores de 16?
- ¿Cuál es la probabilidad de que X tome valores mayores de 3?
PREGUNTA 1
En esta pregunta nos está pidiendo χ27; 0’9.
Así que nos vamos a la fila en la que g.l. es 7 y a la columna de probabilidad 0’9.
Así que tenemos el siguiente resultado:
El valor 12’017 deja por debajo de si una probabilidad de 0’9.
PREGUNTA 2
Que un número deje por encima el 0’05 quiere decir que deja por abajo el complementario, es decir 0’95 (recuerda que los complementarios suman 1). En esta pregunta nos está pidiendo χ27; 0’95.
Así que nos vamos a la fila en la que g.l. es 7 y a la columna de probabilidad 0’95 y obtenemos:
El valor 14’0671 deja por encima de si una probabilidad de 0’05.
PREGUNTA 3
Aquí nos están preguntando P( X < 16 ), es decir, el número 16 habrá que buscarlo dentro de la tabla (o un valor aproximado) pero si que hay que quedarse en la fila de los 7 grados de libertad.
El valor más próximo a 16 es 16’0128, que deja por debajo de sí una probabilidad de 0’975. Así que el número 16 dejará un poco menos de 0’975 por debajo al ser más pequeño que el 16’0128 de la tabla.
PREGUNTA 4
Aquí nos están preguntando P( X > 3 ), es decir, por complementario 1 – P( X < 3 ). El número 3 habrá que buscarlo dentro de la tabla (o un valor aproximado) pero si que hay que quedarse en la fila de los 7 grados de libertad.
El valor más próximo a 3 es 2’8331, que deja por debajo de sí una probabilidad de 0’1. Así que el número 3 dejará un poco más de 0’1 por debajo al ser más grade que el 2’8331 de la tabla. Y como nos preguntaban la probabilidad de ser mayor, dejará por encima de el algo menos de 0’9.
7.4. Distribución t de Student
La distribución t de Student se escribe simplemente como t y está creada por la división de una distribución Normal entre una Chi-cuadrado con n grados de libertad (concretamente la raíz de una Chi entre n).
Es decir, si tenemos una v.a. que se distribuye como Normal tipificada y una v.a. Chi-cuadrado y dividimos la Normal entre la raíz de la división de la Chi-cuadrado con n grados de libertad entre n conseguimos una nueva distribución que se distribuye como una t de Student con n grados de libertad.
Los grados de libertad no son mas que un parámetro, un número, que necesitas conocer de la distribución para calcular probabilidades.
Al igual que todas las distribuciones la t de Student también tiene su media y desviación típica que dependen de su parámetro (grados de libertad).
7.4.1. Características y propiedades
La forma gráfica de la t de Student es muy bastante a la campana de Gauss y cumple algunas propiedades iguales que la Normal.
Echándole un ojo al gráfico se pueden intuir algunas propiedades. Te voy a explicar solamente las que te interesan a ti:
- Es simétrica respecto a 0
Esto quieres decir que si lo doblara haciendo una línea en vertical desde el 0 sería exactamente lo mismo la parte de la derecha y la de la izquierda, coinciden.
- Toda la campana es el total
La totalidad de la campana es el 100%, que en probabilidad es el 1. Saber esto nos servirá trabajar con los complementarios como en el Tema 5. Recuerda que eso era, dado el suceso A:
Y si todo es 1, la mitad es 0’5, ¡recuérdalo! Por debajo del 0 tengo probabilidad 0’5 y por encima el 0’5 restante.
- Es asintótica en el eje de abscisas
Esto quiere decir que no llega a alcanzar el 0 absoluto. Es decir, en las esquinas derecha e izquierda se va haciendo pequeño pero nunca llega a estar en el 0.
- Para valores altos de n se aproxima a la Normal
Aunque no os lo dicen en el libro, por lo general cuando n es mayor que 100, como en la Chi, se aproxima a la Normal.
7.4.2. Tabla de la t de Student
Si miras en la tabla VI del formulario verás que dice Distribución t.
Ya habíamos dicho en la Chi-cuadrado que tanto ella como la distribución t de Student tienen la misma forma de tablas.
“En la Chi-cuadrado y en la t de Student las tablas tendrán dentro el número, los grados de libertad en la primera columna y en la primera fila la probabilidad. Eso sí, al igual que en la Normal la probabilidad que pone es la probabilidad de estar por debajo del número.”
Con estas distribuciones continuas se trabaja más con percentiles (recuerda que explicamos los percentiles en el Tema 2, parte 2) que con la idea de “qué probabilidad deja por debajo este número”. Ten en cuenta que en la distribución Normal lo sencillo era buscar un número y calcular su probabilidad, en estas tablas lo sencillo será buscar una probabilidad y dar el número.
Así que las preguntas suelen ser del tipo “¿qué número deja por debajo una probabilidad del 0’9?”. Sería la idea de P( X < ¿? ) = 0’9, pero ahora lo escribimos así:
Trabajemos con unos ejemplos para que quede claro.
Ejemplos
Tenemos una v.a. X que se distribuye como una t de Student con 14 grados de libertad, ¿qué media y varianza tiene?
- ¿Qué número deja por debajo una probabilidad de 0’9?
- ¿Qué número deja por debajo una probabilidad de 0’05?
- ¿Cuál es la probabilidad de que X tome valores menores de 2?
- ¿Cuál es la probabilidad de que X tome valores menores de -0’67?
PREGUNTA 1
En esta pregunta nos está pidiendo t14; 0’9.
Así que nos vamos a la fila en la que g.l. es 14 y a la columna de probabilidad 0’9.
Así que tenemos el siguiente resultado:
El valor 1’345 deja por debajo de si una probabilidad de 0’9.
PREGUNTA 2
En esta pregunta nos está pidiendo t14; 0’05, pero en la tabla la probabilidad más pequeña que tenemos es 0’55, así que tenemos que jugar con la idea de la simetría.
Los números negativos dejan por debajo de si probabilidades menores que 0’5 y los positivos mayores de 0’5. Así que el número t14; 0’05 es un número negativo.
Como la distribución t de Student es simétrica, el número negativo que deja por debajo 0’05 tiene su simétrico positivo que deja por encima 0’05. Que deje por encima 0’05 quiere decir que por debajo deja el 0’95.
Pero recuerda que buscamos el número negativo, así que:
El valor -1’761 deja por debajo de si una probabilidad de 0’05.
PREGUNTA 3
Aquí nos están preguntando P( X < 2 ), es decir, el número 2 habrá que buscarlo dentro de la tabla (o un valor aproximado) pero si que hay que quedarse en la fila de los 14 grados de libertad.
El valor más próximo a 2 es 2’145, que deja por debajo de sí una probabilidad de 0’975. Así que el número 2 dejará un poco menos de 0’975 por debajo al ser más pequeño que el 2’145 de la tabla.
PREGUNTA 4
Aquí nos están preguntando P( X < -0’67 ). En la tabla no aparecen números negativos, así que vamos a tener que trabajar por simetría como en la pregunta 2.
El número 0’67 lo hemos buscado dentro de la tabla (o un valor aproximado) pero recuerda que nos hemos quedado en la fila de los 14 grados de libertad.
7.5. Distribución F de Fisher o Snedecor
La distribución F de Fisher o también de Snedecor se escribe simplemente como F y está creada por la división de dos distribuciones Chi-cuadrado.
Es decir, si tenemos 2 v.a. que se distribuyen como Chi-cuadrados con n1 y n2 grados de libertad respectivamente, cada una la dividimos por sus respectivos grados de libertad y luego las dividimos conseguimos una nueva distribución que se distribuye como una F de Fisher con n1 y n2 grados de libertad.
Los grados de libertad no son mas que dos parámetros, dos números, que necesitas conocer de la distribución para calcular probabilidades.
Al igual que todas las distribuciones la F de Fisher también tiene su media y desviación típica que dependen de su parámetro (grados de libertad).
7.5.1. Características y propiedades
La forma gráfica de la F de Fisher depende de los grados de libertad que tenga.
Echándole un ojo al gráfico se pueden intuir algunas propiedades. Te voy a explicar solamente las que te interesan a ti:
- No es simétrica, sino que principalmente es asimétrica positiva
Tanto la distribución normal como la t eran simétricas respecto a la media y de este modo nos podía facilitar ciertos cálculos. La F de Fisher no es simétrica, es asimétrica positiva, es decir, tiene cola derecha.
- Toda la gráfica es el total
La totalidad de la gráfica es el 100%, que en probabilidad es el 1. Saber esto nos servirá trabajar con los complementarios como en el Tema 5. Recuerda que eso era, dado el suceso A:
- Toma valores positivos
En el imagen puedes ver que a la izquierda está el 0 y que la gráfica se crea la derecha del 0, es decir, donde los valores son positivos.
- Propiedad recíproca
La distribución F tiene un primer grado de libertad que es el de la Chi del numerador y un segundo grado de libertad que es el del denominador.
La propiedad recíproca relaciona la distribución Fn1, n2 con la Fn2, n1, es decir, cuando cambiamos el orden de numerador y denominador. Estas serían las dos que relaciona:
7.5.2. Tabla de la F de Fisher
Si miras en la tabla VII del formulario verás que dice Distribución F.
Como puedes ver esta tabla es diferente a cualquiera de las que hemos ido viendo.
De la distribución F tienes cinco páginas en el formulario, cada una de ellas se distingue por la probabilidad que dice en la zona superior (donde está puesta la estrella en la imagen de arriba). La primera página nos dice puntos que dejan un 0’9 de probabilidad por debajo, la segunda el 0’95,…. Y así hasta la quinta página que nos muestra puntos que dejan una probabilidad de 0’995 por debajo.
Una vez que estés en la página de la probabilidad que quieres tienes que seleccionar la columna del primer grado de libertad de la F y la fila del segundo grado de libertad. De modo que en el interior de las tablas siempre tienes los números correspondientes.
Recuerda que con estas distribuciones continuas se trabaja más con percentiles (recuerda que explicamos los percentiles en el Tema 2, parte 2) que con la idea de “qué probabilidad deja por debajo este número”. Ten en cuenta que en la distribución Normal lo sencillo era buscar un número y calcular su probabilidad, en estas tablas lo sencillo será buscar una probabilidad y dar el número.
Así que las preguntas suelen ser del tipo “¿qué número deja por debajo una probabilidad del 0’9?”. Sería la idea de P( X < ¿? ) = 0’9, pero ahora lo escribimos así:
Trabajemos con unos ejemplos para que quede claro.
Ejemplos
Tenemos dos variables aleatorias Chi-cuadrado, X1 y X2, que tienen 10 y 13 grados de libertad respectivamente. Creamos una nueva variable dividiendo cada Chi entre sus respectivos grados de libertad y luego entre ellas, ¿qué distribución tiene? ¿Qué media y varianza tiene?
A la nueva v.a. la voy a llamar F, y como es fracción de dos Chi se distribuye como una F10,13, una F de Fisher con 10 y 13 grados de libertad. Vamos a calcular su media y varianza:
- ¿Qué nAsí que nos vamos a la hoja que pone P( … ) = 0’90 y cruzamos la columna 10 (grados del numerador) y la fila 13 (grados del denominador).úmero deja por debajo una probabilidad de 0’9?
- ¿Qué número deja por encima una probabilidad de 0’01?
- ¿Cuál es la probabilidad de que F tome valores menores de 5?
- Calcula el percentil 2’5 para una F7,9.
PREGUNTA 1
En esta pregunta nos está pidiendo F10,13; 0’9.
Así que nos vamos a la hoja que pone P( … ) = 0’90 y cruzamos la columna 10 (grados del numerador) y la fila 13 (grados del denominador).
Así que tenemos el siguiente resultado:
En una distribución F con 10 y 13 g.l., el valor 2’138 deja por debajo de si una probabilidad de 0’9.
PREGUNTA 2
Que un número deje por encima el 0’01 quiere decir que deja por abajo el complementario, es decir 0’99 (recuerda que los complementarios suman 1). En esta pregunta nos está pidiendo F10,13; 0’99.
Así que nos vamos a la hoja que pone P( … ) = 0’99 y cruzamos la columna 10 y la fila 13.
En una distribución F con 10 y 13 g.l., el valor 4’1 deja por encima de si una probabilidad de 0’01.
PREGUNTA 3
Aquí nos están preguntando P( X < 5 ), es decir, el número 5 habrá que buscarlo dentro de las tablas (o un valor aproximado) pero si que hay que quedarse en la columna 10 y en la fila de los 13 de todas las tablas.
El valor más próximo a 5 es el 4’82 de la última tabla, que deja por debajo de sí una probabilidad de 0’995. Así que el número 5 dejará algo más de 0’995 por debajo al ser más grande que el 4’82 de la tabla.
PREGUNTA 4
Aquí nos están preguntando por una F7,9; 0’025.
El problema surge con que la probabilidad más pequeña que me da la tabla es 0’9 y en el ejercicio me piden 0’025. Como no es simétrica no podemos trabajar con complementario como podíamos hacer con la normal, pero tenemos la propiedad recíproca que nos puede ayudar:
Y ahora sí que podemos calcular F9,7; 0’975, que mirando en tablas es el valor 4’197, así que:
En una distribución F con 7 y 9 g.l., el valor 0’2383 deja por encima de si una probabilidad de 0’025.
Con esta entrada ya hemos terminado el Tema 7 de distribuciones continuas. Todo lo que dais de probabilidad llega hasta aquí. Recuerda que en la parte anterior del Tema 7 vimos la distribución Normal, la más importante y sobre la que 100% que os preguntarán en el examen, así que si no te acuerdas muy bien vuelve a leerla clicando aquí.
Espero que te haya quedado claro, pero si tienes alguna dudilla no tengas reparo en preguntarla en los comentarios. También tengo videoclases por Skype en las que podré resolver todas tus dudas cara a cara y sin moverte de casa.
En el siguiente Tema (¡Y último!) vamos a ver lo que significa hacer inferencia sobre los datos.
Si te ha gustado la entrada y te ha ayudado a entender mejor la asignatura no tengas reparo en dejármelo saber en los comentarios. 😉
Saludos y ánimo!
hola lidia, un saludo. queria preguntar algo que no entiendo, en la pregunta 4 del punto 7.4.2 el grafico creo q esta mal por el el 0.67 los dos es tan en negativo, aunq esa no es mi inquietud. despues de la solucion dices esto: recuerda que os hemos quedado en la fila de los 7 grados. esto no me cuadra. me podrias explicar?
Hola Yamileth!
Pues ambas cosas se me han colado: en la gráfica va positivo y negativo y los grados de libertad son 14 como en el ejercicio anterior.
Ánimo y gracias!!
Hola lidia, ¿qué pasa con cuando 2 variables que siguen una distribución de chi cuadrado que una tenga 20 grados de libertad y la otra 11? ¿Los grados de libertad se restan? Porque si ambas chi son variables independientes entonces, ¿si se restan estarían dependiendo o por ser independientes se las puede restar?
Hola Soraya,
Perdóname pero no entiendo tu pregunta, ¿qué relación u operación quieres hacer con ambas chi? No hemos hablado de operaciones entre chi cuadrados.
Saludos y ánimo!
Lidia
Hola, haciendo los ejemplos del último apartado, en la última pregunta: calcula el percentil para F 7,9….7 sería n1 y 9 n2 no???
Es que mirando en las tablas no concuerda con número que aparece en el problema, para mí sería 4,197. ¿Es así o me equivoco?
Muchas gracias
Hola Leonor,
Sí, perdona, miré los gl al revés, que según donde mires las tablas están en distinto orden los grados.
Ahora lo cambio.
Gracias, un saludo y ánimo!
Lidia