
Con esta entrada terminamos el segundo tema. Si no leíste la anterior entrada, Tema 2, parte 1: Medidas de tendencia central, te recomiendo que lo hagas ya que las medidas de posición son una ampliación de la mediana.
La mediana nos dividía los datos en dos partes iguales, con 50% por debajo de ese valor y 50% por encima, es decir, estando los datos ordenados de menor a mayor era el valor central. Las medidas de posición son la misma idea pero dividiendo los datos de distinta forma, por ejemplo el 20% de los datos por debajo y el 80 por encima.
Ten muy en cuenta que siempre hablamos del porcentaje que queda por encima de ese número hasta el máximo o del que queda por debajo hasta el mínimo.
Al igual que la mediana, las medidas de posición sólo las utilizamos con variables cuantitativas.
A las medidas de posición les ponemos tres nombres según la división que hagan en nuestros datos:
- Los cuartiles: dividen los datos en cuatro partes iguales.
- Los deciles: dividen los datos en diez partes iguales.
- Los percentiles: dividen los datos en cien partes iguales.
Vamos a verlos de uno en uno y te los explico más en detalle.
2.5. Cuartiles
Como hemos dicho, los cuartiles (cuartil 1 Q1, cuartil 2 Q2 y cuartil 3 Q3) nos dividen los datos en cuatro partes iguales. Así que si todos tus datos son el 100%, cada una de las cuatro partes iguales tiene un 25% de los datos.
La idea es esta:
Como te he dicho antes, nos fijamos siempre en cuánto dejan por abajo y cuanto dejan por arriba. Así que:
- El cuartil 1 deja por debajo el 25% y por encima el 75% (tres veces 25)
- El cuartil 2 deja por debajo el 50% y por encima el 50% (se corresponde con la mediana)
- El cuartil 3 deja por debajo el 75% y por encima el 25%
Esta es la idea que tienes que tener bien clara en la cabeza antes de pasar a trabajar con los datos y la fórmula.
En la práctica te preguntarían, por ejemplo, “¿Qué dato deja por debajo de él el 75% de los datos?” y tendrías que responderle con el cuartil 3.
Pasemos a la fórmula para calcular cuartiles. Es la misma fórmula para los cuartiles, deciles y percentiles que para la mediana, la diferencia es la posición. Esta es la fórmula para la mediana
y la posición de la mediana es n/2, este dato es el que se va a ir modificando.
La fórmula se trabaja con el porcentaje k que el cuartil deja por debajo.
Recordemos qué es cada cosa:
- li: límite inferior exacto del intervalo crítico.
- n: número total de datos.
- k: porcentaje por debajo.
- na(i-1): frecuencia absoluta acumulada del intervalo anterior.
- ni: frecuencia absoluta del intervalo crítico.
- ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos.
Igual que hacíamos para calcular la mediana en el tema anterior, primero tenemos que fijar el intervalo crítico. Para ello calculamos la posición nk/100 y la buscamos en las frecuencias absolutas acumuladas.
Vayamos con los ejemplos a calcular los tres cuartiles.
Ejemplo del Nº de hijos
El Q1 deje por debajo el 25%, así que k=25. La posición que buscamos será:
El Q2 deje por debajo el 50%, así que k=50 (si ya has calculado antes la mediana no tienes que volver a calcularlo, recuerda que es lo mismo Md = Q2) La posición que buscamos será:
El Q3 deje por debajo el 75%, así que k=75. La posición que buscamos será:
Y, ¿cómo se interpreta esto?
Decir este resultado en palabras sería así:
- El 25% de las personas tienen menos de 0’7143 hijos, la idea complementaria sería que el 75% de las personas tiene más de 0’7143 hijos.
- El 50% de las personas tienen menos de 1’4286 hijos.
- El 75% de las personas tienen menos de 3’3 hijos, la idea complementaria sería que el 25% de las personas tiene más de 3’3 hijos.
Ejemplo del Rendimiento
El Q1 deje por debajo el 25%, así que k=25. La posición que buscamos será:
El Q2 deje por debajo el 50%, así que k=50 (si ya has calculado antes la mediana no tienes que volver a calcularlo, recuerda que es lo mismo Md = Q2) La posición que buscamos será:
El Q3 deje por debajo el 75%, así que k=75. La posición que buscamos será:
Vamos a interpretar los resultados:
- El 25% de los alumnos tienen un rendimiento inferior a 28’7692, la idea complementaria sería que el 75% los alumnos tienen un rendimiento superior a 28’7692.
- El 50% de los alumnos tienen un rendimiento inferior a 50’9918.
- El 75% de los alumnos tienen un rendimiento inferior a 72’9074, la idea complementaria sería que el 25% los alumnos tienen un rendimiento superior a 72’9074.
2.6. Deciles
Los deciles (decil 1 D1, decil 2 D2, …, decil 9 D9) nos dividen los datos en diez partes iguales. Así que si todos tus datos son el 100%, cada una de las cuatro partes iguales tiene un 10% de los datos.
La idea es esta:
Como nos fijamos siempre en cuánto dejan por abajo y cuanto dejan por arriba:
- El decil 1 deja por debajo el 10% y por encima el 90% (nueve veces 10)
- El decil 2 deja por debajo el 20% y por encima el 80%
- …
- El decil 5 deja por debajo el 50% y por encima el 50% (se corresponde con la mediana y con el cuartil 2)
- …
- El decil 8 deja por debajo el 80% y por encima el 20%
- El decil 9 deja por debajo el 90% y por encima el 10%
Si en la práctica te preguntan, por ejemplo, “¿Qué dato deja por debajo de él el 60% de los datos?” y tendrías que responderle con el decil 6.
Recordamos que la fórmula se trabaja con el porcentaje k que el decil deja por debajo.
Recordemos qué es cada cosa:
- li: límite inferior exacto del intervalo crítico.
- n: número total de datos.
- k: porcentaje por debajo.
- na(i-1): frecuencia absoluta acumulada del intervalo anterior.
- ni: frecuencia absoluta del intervalo crítico.
- ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos.
Igual que con la mediana y los cuartiles, primero tenemos que fijar el intervalo crítico. Para ello calculamos la posición nk/100 y la buscamos en las frecuencias absolutas acumuladas.
Vamos a calcular algunos deciles para los ejemplos, no todos que sino se hará muy largo. Recuerda que el decil 5 es lo mismo que el cuartil 2 y la mediana.
Ejemplo del Nº de hijos
El D1 deje por debajo el 10%, así que k=10. La posición que buscamos será:
El D4 deje por debajo el 40%, así que k=40. La posición que buscamos será:
El D8 deje por debajo el 80%, así que k=80. La posición que buscamos será:
Interpretemos estos resultados:
- El 10% de las personas tienen menos de 0’0714 hijos, la idea complementaria sería que el 90% de las personas tiene más de 0’0714 hijos.
- El 40% de las personas tienen menos de 1’1429 hijos, la idea complementaria sería que el 60% de las personas tiene más de 1’1429 hijos.
- El 80% de las personas tienen menos de 3’6111 hijos, la idea complementaria sería que el 20% de las personas tiene más de 3’6111 hijos.
Ejemplo del Rendimiento
El D2 deje por debajo el 20%, así que k=20. La posición que buscamos será:
El D6 deje por debajo el 60%, así que k=60.La posición que buscamos será:
El D9 deje por debajo el 90%, así que k=90. La posición que buscamos será:
Vamos a interpretar los resultados:
- El 20% de los alumnos tienen un rendimiento inferior a 23’9615, la idea complementaria sería que el 80% los alumnos tienen un rendimiento superior a 23’9615.
- El 60% de los alumnos tienen un rendimiento inferior a 59’1885, la idea complementaria sería que el 40% los alumnos tienen un rendimiento superior a 59’1885.
- El 90% de los alumnos tienen un rendimiento inferior a 88’5952, la idea complementaria sería que el 10% los alumnos tienen un rendimiento superior a 88’5952.
2.7. Percentiles
Los percentiles nos dividen los datos en cien partes iguales. Así que podemos calcular cualquier porcentaje que queramos, el 88%, el 65%…
En los cuartiles ya te hemos ido hablando de percentiles al referirnos a el porcentaje que queda por debajo de ese valor. Y hemos visto correspondencias entre cuartiles, deciles y percentiles.
La fórmula vuelve a ser la misma. Recuerda que k es el porcentaje que queda por debajo.
Recordemos qué es cada cosa:
- li: límite inferior exacto del intervalo crítico.
- n: número total de datos.
- k: porcentaje por debajo.
- na(i-1): frecuencia absoluta acumulada del intervalo anterior.
- ni: frecuencia absoluta del intervalo crítico.
- ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos.
Calculemos, por ejemplo, los percentiles 12 y 79 para el ejemplo del número de hijos y los percentiles 28 y 95 para el ejemplo del rendimiento.
Ejemplo del Nº de hijos
El P12 deje por debajo el 12%, así que k=12. La posición que buscamos será:
El D79 deje por debajo el 79%, así que k=79. La posición que buscamos será:
Interpretemos estos resultados:
- El 12% de las personas tienen menos de 0’1875 hijos, la idea complementaria sería que el 88% de las personas tiene más de 0’1875 hijos.
- El 79% de las personas tienen menos de 3’567 hijos, la idea complementaria sería que el 21% de las personas tiene más de 3’567 hijos.
Ejemplo del Rendimiento
El P28 deje por debajo el 28%, así que k=28. La posición que buscamos será:
El P95 deje por debajo el 95%, así que k=95. La posición que buscamos será:
Vamos a interpretar los resultados:
- El 28% de los alumnos tienen un rendimiento inferior a 31’6538, la idea complementaria sería que el 72% los alumnos tienen un rendimiento superior a 31’6538.
- El 95% de los alumnos tienen un rendimiento inferior a 94’5476, la idea complementaria sería que el 5% los alumnos tienen un rendimiento superior a 94’5476.
2.8. Buscar el porcentaje
Los cuartiles, deciles y percentiles se basan en que te preguntan un porcentaje y el resultado es un valor de la variable, pero también puede ser al revés. Te pueden preguntar ¿qué porcentaje queda por debajo/encima de cierto valor?
Es decir, vamos a buscar el porcentaje que queda por encima o por debajo de un número. ¿Cómo responderías a “qué porcentaje de alumnos tiene un rendimiento inferior/superior a 60”?
La fórmula la tienes en el formulario, así que no tienes que memorizarla ni mucho menos. Pero ten claro que no sale por arte de magia, sale de despejar k de la fórmula anterior. Tras despejar la fórmula que queda es esta:
Recordemos qué es cada cosa:
- Pk: número por el que preguntan su porcentaje o percentil.
- li: límite inferior exacto del intervalo crítico.
- ni: frecuencia absoluta del intervalo crítico.
- ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos.
- na(i-1): frecuencia absoluta acumulada del intervalo anterior.
- n: número total de datos.
Antes de hacer la fórmula tienes que fijar el intervalo crítico buscando el número en los intervalos.
Ten muy en cuenta que el porcentaje que dará como resultado es el porcentaje por debajo, si te preguntan “por encima del valor” tendrás que hacer el porcentaje complementario como hacíamos en los ejemplos anteriores. Si te preguntaban por encima y el resultado en la fórmula ha sido 20 tendrás que decir 80%.
Veámoslo con un par de preguntas en el ejemplo del rendimiento.
1) ¿Qué porcentaje de alumnos tiene un rendimiento inferior a 30 puntos?
2) ¿Qué porcentaje de alumnos tiene un rendimiento superior a 85 puntos?
1) Inferior a 30
Hay un 26’286% de alumnos por debajo de un rendimiento de 30.
2) Superior a 85
Como nos preguntan superior tenemos que calcular el complementario:
Hay un 13’02% de alumnos por encima de un rendimiento de 85.
Mira un ejemplo aplicado a la nota de corte de selectividad, aplicación.
¡Ya hemos terminado el segundo tema!
Como aplicación de este tema pondré un ejemplo que todos conocemos pero que no creo que hayas pensado que era estadística: las notas de corte.
Tanto si te ha gustado como si tenéis alguna duda dímelo en los comentario. No te cortes.
Continúa entendiendo la Estadística en Tema 3: Medidas de variabilidad y asimetría.
Hola
Aún no está el tema tres verdad?
Me gusta mucho como está todo explicado, ya me he estudiado los temas uno y dos, espero poder seguir muy pronto con el resto de temas, son geniales tus explicaciones.
Gracias por tu ayuda!!
Jejejejeje
Solo necesito un poquito de paciencia, pero ya estoy trabajando en el tercer tema. Y seguirá el resto!
Saludos!
Lidia, me parece muy ameno como lo explicas todo, es de gran ayuda. Muchas gracias y seguiremos pendientes a medida que vayas publicando más temas ,poco a poco ,que ya es bastante esfuerzo. Saludos
Hola Lucía,
Muchas gracias por tu comentario. Quiero intentar ir publicando al menos una entraba a la semana.
Saludos.
Hola!!! Muchas gracias de antemano por todos los temas y lo bien explicados que están.
Voy por la segunda parte del tema 2, pero sigo sin entender de donde sale el valor de li (límite inferior exacto del intervalo critico) en todas las fórmulas de este tema.
Muchas gracias de nuevo!!!! Saludos
Hola Leonor,
La explicación de los límites exactos la tienes en el Tema 1, parte 2, apartado 1.5.
La «fórmula» sería: límite inferior exacto = límite inferior aparente – 0’5. En nuestro caso es 0’5 lo que restamos porque los límites aparentes son número enteros, si tuvieran 1 decimal restaríamos 0’05.
Fíjate en el apartado 1) del último ejemplo. Los límites aparentes que cogemos en este apartado son 21-40, el límite inferior es el 21. Así que el li (límite inferior exacto) es 21-0’5=20’5.
¿Lo entiendes ahora?
¡Ánimo!
Ahhhh visto así es mucho más fácil!!!
Muchas graciaaasss
De nada 🙂
hola Lidia :
Cuando calculas el P79 ,escoges el intervalo critico con valor de 31 . No entiendo porqué no coges el de 40 si al calcular la posición da como resultado 31.6.
Me lo puedes explicar ??
Gracias .
Hola Consu.
Errata mía, ahora la modifico. Si fuera 31 sí que cogeríamos el que he puesto, pero siendo 31’6 hay que coger el siguiente.
Saludos y gracias
Pues no sabes que alegría me das .
Eso quiere decir que lo voy entendiendo bién.
Gracias Lidia
De nada!!!
Si ves alguna otra cosa que te parezca raro dímelo, que se me ha podido escapar algún número o alguna cosa.
Saludos 😀
Hola Lidia!
Creo que has repetido la fórmula en el cálculo de los percentiles en lugar de escribir la que queda de despejar la K. Mira a ver si es una errata al copiarla ( creo que sí porque no está despejada) o si es que hay algo que no entiendo…
Gracias por lo que haces, es clarísimo.
Hola Gloria,
Sí, se me ha colado la imagen, ahora la cambio.
Muchas gracias por darte cuenta. Cualquier otra cosa me dices.
Saludos,
Lidia
Hola Lidia! Tengo una duda. Tengo unos apuntes que incluye el resolver percentiles con datos que no estén agrupados por intervalos y no lo explica del todo claro,por tanto me faltó entender esa parte. Busqué por internet y me salen fórmulas que aplicándolas no me sale el resultado que pone en los apuntes. Sabrías tu de alguna web donde explique claramente el calculo del percentil a partir de datos no agrupados en intervalos?
Por otro lado, también te escribo para darte las gracias por la ayuda desinteresada y tan buena que ofreces, la verdad que no se me da mal la Estadística y lo voy entendiendo con paciencia, pero leer tu web me sirve como un gran repaso y para comprender del todo alguna cosilla que me podía sonar un poco «rara» en los apuntes o el libro. Así da gusto, de verdad ^^
Nada ya resolví la duda , muchas gracias =)
Hola Anna,
Muchas gracias por el comentario.
¿Con datos no agrupados te refieres a no estar en intervalo o no estar en tabla?
Si te refieres a que no estén en intervalo (es decir, una variable cuantitativa discreta), es igual que resolver la mediana, lo tienes en el Tema 2, parte 1. Date cuenta que en verdad es la misma fórmula.
Saludos y ánimo!!
Lidia
Hola Lidia. En los ejemplos de las tablas de N* de hijos y de Rendimiento de la parte de los cuartiles, como se calcula ai (que es?), que esclavos última columna de las tablas. No me kedo muy claro
Hola Tita,
La explicación de ai la tienes en el apartado de los cuartiles cuando explico la fórmula. Justo debajo de la fórmula está explicada cada cosa. Concretamente para ai digo esto:
ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos.
En el ejemplo del número de hijos es 1 en todos los intervalos solo entra un valor en cada intervalo. En el del Rendimiento, por ejemplo el primer intervalo 0-20, a1 es 21 de hacer la resta de los límites exactos (10,5-(-0,5)), o también contando cuantos entran: 0, 1, 2, … , 20.
Espero que lo hayas entendido sino dímelo.
Saludos y ánimo!
Lidia
Hola lidia antes que nada agradecerte la labor que haces es impresionante se entiende todo muy bien y ayudas a negados de los numero como yo a poder seguir hacia delante jjeje.
A lo qeu voy hay una cosa que no termino de entender, en el apartado de los cuartiles no se como se calcula ese 0,5 y el 2,5( li) no se de donde salen y despues de donde sale el 7 y el 26 de resta, lo qeu le esta restando a la K que hemos calculado, operdon por tantas preguntas pero me perdi mucho en esa formula gracias.
vale ya despues de 1 hora consegui averiguarlo gracias jeje
Hola Desiree,
Siento no habértelo podido resolver a tiempo, pero me alegro de que lo hayas conseguido entender por ti misma también.
Saludos y ánimo!
Lidia
Holaaaaa!!!! Me estas salvando con estas super explicaciones!!!!
Tengo una duda, y aunque seguro que es una tontería, no consigo sacarlo por más vueltas que le doy. A la hora de calcular ai en el ejemplo del rendimiento, en el límite de 0-20, porque ai es 21???? si es sumar 0,5, sería 0-20,5, entonces ai sería 20,5, no??? No se porqué es 21.
Muchas gracias de antemano por la labor que estas haciendo y por resolverme esta dudilla.
Hola Soraya!
Me alegro de que te estén sirviendo las explicaciones.
La compañera Tita preguntó tu misma duda unos comentarios más arriba (4 de diciembre). Se restan los límites exactos. Los límites exactos del intervalo 0-20 son -0’5-20’5 (restar 0’5 al inferior y sumar 0’5 al superior).
Saludos y ánimo!
Lidia
jo ,muchas gracias. No caí en los números negativos jeje
Jejeje.
Mucho ánimo!!
Lidia
Hola, buenas tardes. Gracias por explicar este tema, me ayudo mucho con mi exposición.
Tengo un problema que deseo referenciar esta pagina en la bibliografia de mi trabajo pero no puedo, ya que no tiene fecha de publicación , ni el nombre del autor, por favor asi sea un blog escriban sus datos, porque asi la información que brindan se vuelve mas confiable y veridica.
Hola Génesis,
¡Me alegra haberte ayudado!
Mi nombre es Lidia Lipe (ya lo he actualizado en el apartado «Sobre mí»). Y las fechas de publicación se encuentran bajo la cabecera de los temas.
Un saludo y ánimo!
Lidia