
En esta entrada voy a explicarte las tres medidas que se usan para marcar la centralidad de tus datos, media, mediana y moda.
Si tus datos son cualitativos solo vas a poder calcular la moda. Date cuenta que las cualitativas son palabras, ¡no puedes sumar palabras!
También tienes que saber que las medidas se corresponden con un solo valor o palabra, así que en las variables cuantitativas continuas necesitamos algo más que los intervalos, las marcas de clase. Las marcas de clase son los puntos medios de los intervalos. Por ejemplo, la marca de clase de un intervalo 0-5 es 2’5 [(0+5)/2] y la de un intervalo 1-7 es 4 [(1+7)/2] Crearemos una nueva columna al lado de los intervalos para las marcas de clase y la llamaremos Xi.
Vamos a seguir con los tres ejemplos de la entrada anterior, espero que no los hayas perdido 😀
Vamos a comenzar por la más sencilla de todas, la moda.
2.1. Moda
La moda (la denotamos como Mo) no es ni más ni menos el valor que más se repite, el que “está de moda”.
En las tablas de frecuencias, sea del tipo que sea tu variable, tienes que fijarte en la columna de las frecuencias absolutas (ni) y buscar el valor más alto. El valor al que corresponda esa máxima frecuencia absoluta es la moda.
Veámoslo en los ejemplos:
La frecuencia más alta de la variable estudios es 23, así que la moda son los estudios obligatorios. La de la variable número de hijos es 14, por lo que la moda es 1 hijo. La más alta en la variable rendimiento es 122, se corresponde con el intervalo 41-60, por lo que la moda es 50’5.
2.2. Media
Recuerda: la media sólo la utilizamos con variables cuantitativas. Y la denotamos por .
Para calcular la media sí que es necesario realizar unos cálculos:
El símbolo es un sumatorio. Principalmente sería
y sumaríamos desde i=1 hasta n, es decir, x1 + x2 + x3 + … +xn.. Estamos sumando todos los valores que nos hayan dado los individuos. Por lo general se simplifica y no se escriben el inicio y el fin.
Piensa en el ejemplo del Rendimiento. Si tuvieses los 500 datos suelto sería eterno ponernos a sumar uno a uno, por eso usamos la segunda fórmula de la media para calcular desde la tabla de frecuencias.
En el numerador de la segunda forma lo que hacemos es multiplicar cada valor de la variable por la frecuencia absoluta, es decir, por el número de veces que se repite el valor. Con esta idea es como nos enseñaron las multiplicaciones; en vez de sumar 10 veces 5 (5+5+5+…), por ejemplo, multiplicamos 5 por 10.
Si tienes buen uso de la calculadora puedes calcular la media directamente. Más adelante en algún vídeo os enseñaré cómo hacerlo, pero de momento lo vamos a hacer de un modo más sencillo pero más lento.
El primer paso es crear una nueva columna en la tabla de frecuencias (vamos a usar las tablas del número de hijos y el rendimiento) que será el producto xini para cada fila. Luego sumamos la columna y tenemos el numerador de la fórmula de la media. Vamos a verlo:
Y para finalizar solo nos queda dividir la suma entre n.
Para la variable Nº de hijos:
Para la variable Rendimiento:
Propiedades de la media
- La media es muy sensible a los datos extremos (también se les llaman datos raros o datos atípicos)
Un dato atípico sería, por ejemplo, en la variable de número de hijos, si alguien te ha dicho 10 hijos tendrás ese dato como atípico. Piensa en tener en tus manos un diagrama de barras o un histograma, y colocándolo sobre un dedo buscas tener un punto de equilibrio. Ese punto sería la media. Si tienes una barra alejada del resto, como ese 10 hijos, eses punto ya no te vale y tienes que desplazarlo hacia el dato extremo.
- Transformaciones lineales de la variable
Ponte en el caso de haber hecho un estudio sobre temperatura en grados centígrados y has tenido una media de 30°C. Si quieres hablar en tus datos en grados Fahrenheit, ¿tendrías que aplicar a todos los datos la fórmula lineal* del cambio y volver a calcular la media?
¡No es necesario!
La misma transformación que le vayas a hacer a los datos (siempre que sean productos, divisiones, sumas o restas; estas son transformaciones lineales) se la puedes aplicar directamente a la media.
Las transformaciones lineales las verás escritas en los ejercicios y en los exámenes con la fórmula general:
En la fórmula a y b son número cualesquiera, X la vieja variable e Y la nueva variable. En el ejemplo, X son los °C, Y los °F, a es 9/5 y b 32.
Así que la nueva media será:
Esto como mucho te lo preguntarán en una pregunta de teoría, así que tampoco le des muchas vueltas, pero es importante que por lo menos te suene.
*Fórmula para pasar de Centígrados a Fahrenheit:
2.3. Mediana
No ha podido ser mejor momento el de escribir la entrada de la mediana. Hoy mismo acabo de escribir un comentario a una duda que expresaba una chica en un grupo de Facebook de la asignatura respecto a una pregunta de examen:
La respuesta correcta es la mediana, tanto para las distribuciones asimétricas como para las que tengan datos extremos.
Recuerda: la mediana sólo la utilizamos con variables cuantitativas. Y la denotamos por Md.
La mediana es el valor central de los datos puestos en orden. Si tenemos estos cinco datos, 1, 3, 10, 12, 20, la mediana es el valor 10 porque ocupa la posición del centro. Si tenemos seis datos, 1, 3, 6, 10, 12, 20, la mediana están entre el 6 y el 10, así que la mediana es la media de estos dos, 8.
Para calcular la mediana existe una fórmula, pero antes de usarla tienes que fijar el intervalo crítico, el intervalo o fila que contiene la mediana. Para ello calculamos la posición n/2 y la buscamos en las frecuencias absolutas acumuladas.
Posición de la mediana para la variable Nº de hijos: 20.
Posición de la mediana para la variable Rendimiento: 250.
Date cuenta de que las frecuencias acumuladas marca las posiciones. Es decir, en la variable Nº de hijos el valor 0 hijos ocupa desde la posición 1 hasta la 7, el valor 1 hijo ocupa de la 8 a la 21 y así las demás.
Una vez que ya sabes tu intervalo crítico pasamos a la fórmula:
Veamos qué es cada cosa:
- li: límite inferior exacto del intervalo crítico.
- na(i-1): frecuencia absoluta acumulada del intervalo anterior.
- ni: frecuencia absoluta del intervalo crítico.
- ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos.
Ten en cuenta que el valor que salga tiene que estar dentro de los límites del intervalo crítico.
Calculémoslo en los dos ejemplos.
Ejemplo del Nº de hijos
Ejemplo del Rendimiento
2.4. Conclusiones
Gracias a las tres medidas de tendencia central puedes conocer algo más que la centralidad.
- Si las tres medidas son similares quiere decir que tus datos son bastante simétricos y sin atípicos.
- Si la media es menor que la mediana hay asimetría negativa.
- Si la media es mayor que la mediana hay asimetría positiva.
Espero que gracias a esta entrada hayas comprendido mejor las medidas de centralización.
Cualquier duda ya sabes, a los comentarios o al correo personal. Y si te ha gustado y te ha ayudado dímelo también en los comentarios.
Continúa entendiendo la Estadística en Tema 2, parte2: Medidas de posición.
Hola Lidia, me parecen muy buenas tus explicaciones, sobre todo para alguien como yo que vi algo de estadistica hace ya algunos años. Es fantástico poder contar contigo y más aún con la fama que tiene esta asignatura. Muchacha muchas gracias!
Hola Gema!
Muchísimas gracias por tu comentario. Me alegro de que sirva, y así me anima más a seguir escribiendo.
¡Adelante!
Me ha parecido buenísima tu explicación. Muy clara y concreta .
Gracias por tu trabajo .
Muchas gracias por los ánimos Consu.
¡Un saludo!
Lidia! Después de haber estudiado el tema 2 y creer que lo había entendido, me puse a hacer los ejercicios, tanto los del libro como los que están colgados en la página de facebook y me desesperé pues no sabía cómo tenía que aplicar los datos.
Después de leer tu entrada del blog lo he comprendido y puedo hacer los ejercicios!! GRacias mil veces. Ya sé dónde tengo que acudir cuando no entienda…
Muy claro y cada concepto explicado, eres una profesora genial!
Sigue con todos los temas por favor!!!
Hola Gloria!
Muchísimas gracias por tu comentario, me alegro de que sirva.
Para que no te pierdas ningún tema te recomiendo que te suscribas, así cada vez que publique un nuevo tema te mandaré Newletter al correo.
¡Ánimo!
Hola, quiero agradecerte el esfuerzo, la verdad me esta ayudando mucho a comprender la asignatura aunque no es tan fácil asimilarlo todo.
tengo una duda en el ultimo ejercicio usas el símbolo ai, es igual que usar I como esta en el libro?
Hola!
Me alegro de que te ayude el material!
sí, ai es lo mismo que usan como I. Lo he puesto así (suele ser más común también) para que sea más fácil relacionarlo con su significado, amplitud del intervalo i.
Saludos y ánimo!
Lidia
Gracias Lidia por tu trabajo.
¡De gran ayuda!
Hola Eva,
Muchas gracias por tú comentario y mucho ánimo!!!
Muchas gracias por todas las explicaciones. Estoy empezando, pero la verdad que tus explicaciones me están ayudando mucho. gracias por tu esfuerzo!!!
Hola Saioa,
Me alegro de que te sirva!!
Saludos y ánimo!!
Lidia
Geniales tus explicaciones, Lidia.
No tengo más que agradecer. 🙂
Un saludo.
Me alegro que te sirvan!! Seguiré subiendo temas, pero esta semana voy un poco retrasada.
Saludos y ánimo!
Lidia
Lidia eres una gran ayuda. Yo que soy de letras para mi tu blog es muy claro y facil de entender.
Me preocupa los proximos temas, la utilizacion de la calculadora cientifica, que no tengo ni idea. Mira haber si tienes tiempo para hacer una tutoria al respecto.
Muchas gracias por todo.
Muchas gracias por tu comentario M.Antonia!!
Iré subiendo temas igual de explicados (si estas suscrita te llegará un email avisando de la publicación para que no te la pierdas).
Lo de la calculadora lo apunto. A ver como lo hacemos porque la mía está «caduca», que tiene unos 15 años!!! Jejeje 😀
Saludos y ánimo!!
Lidia
me he perdido totalmente en la mediana no he entendido lo del intervalo critico y no se calcularla me podrias ayudar :(? gracias x todo
Hola Sheila,
El intervalo crítico es la fila de la tabla de frecuencias en la que está la posición que buscas (en el caso de la mediana n/2). Primero calculas la posición y luego la busca en la columna de la frecuencia acumulada, ese mismo valor o superior.
Si te sigue dando problemas te recomiendo que cojas una clase. Tienes información en el apartado de Ayuda personalizada.
Saludos y ánimo!
Lidia
Hola lidia, lo primero felicitarte por las explicaciones porque así se entiende todo mucho mejor, pero decirte que me ha salido una duda respecto a la mediana y es que no entiendo de dónde salen los valores de a sub i. Gracias .
Hola María,
Lo primero es que en el apartado de la mediana se me ha colado un 2 en la tabla del número de hijos (ya está modificado).
Tras la fórmula explico «ai: amplitud del intervalo crítico. Número de datos que entran en los límites aparentes. Es la resta de límites exactos».
Para calcular la amplitud tienes que diferenciar primero si la variable es discreta o continua. Si es discreta, como el número de hijos, ai siempre es 1, ya que en cada fila sólo «entra» un valor de la variable (1 hijo, 2 hijos…). Si es continua, como en el rendimiento, ya si que hay que calcular un poco más.
Una opción es hacerlo a «dedillo»: el primer intervalo de rendimiento es 0-20, así que los valores enteros que entran son 0, 1, 2, …, 20, te salen 21 valores; el segundo intervalo de rendimiento es 21-40, así que los valores enteros que entran son 21, 22, 23, …, 40, te salen 20 valores, etc.
La otra opción es hacer la resta de los límites exactos: los límites exactos del primer intervalo de rendimiento son -0’5-20’5, así que restamos 20’5-(-0’5)=21; los límites exactos del segundo intervalo del rendimiento son 20’5-40’5, así que restamos 40’5-20’5=20, etc.
¡Espero que te sirva! Si tienes algún otro problema coméntamelo.
Saludos y ánimo!
Lidia
Excelente pagina, realmente muy bien explicado, me ayudo mucho a repasar el tema, éxitos!
Me alegra mucho leer tu comentario!
Saludos y mucho ánimo!!
Lidia
Hola Lidia! Muchas gracias, por cada explicacion.
Me asalta una duda, en el ejercicio de la mediana, cuando se va a calcular nd= frecuencia absoluta acumulada por debajo del intervalo ciritico, me podias explicar por que se coloca en el ejercicio del rendimiento nd=186 en ves de 416 que es el que se encuentra por debajo del intervalo, tengo que ordenar esa columna de menor a mayor?
Gracias!!!
Hola Julieta,
Decir «por debajo del intervalo crítico» no quiere decir físicamente por debajo, sino valores menores. Es decir, si el intervalo crítico es 41-60, estar por debajo de este intervalo es tener valores menores.
De este modo, el intervalo inferior es 21-40 y el superior 61-80.
Espero te sea de ayuda.
Saludos y ánimo!
Lidia
Hola! Empiezo en la uned este año y queria saber si por casualidad sabias si tu blog me vale para estudiarla? Por el tema de que creo que han cambiado libros y eso, estudie el primer tema por aquí y me sirvió de mucho! Muchas gracias por tu labor.
Hola Jeanine,
Acabo de recibir el nuevo libro, y algunas cosas más explica, pero en general con estudiar estos apuntes tendrás más que suficiente para entender y aprobar la asignatura.
De todos modos, estoy empezando a trabajar en la adaptación de los apuntes y poco a poco iré publicando los nuevos temas. Suscríbete y cuando publique recibirás un email de aviso.
Saludos y ánimo!
Lidia
Hola Lidia, he comenzado a estudiar la asignatura por segunda vez y he decidido usar solo tus apuntes y explicaciones. ¿Consideras que es suficiente? ¿Sabes si hay alguna página donde pueda encontrar ejercicios para repasar?
Gracias por tu trabajo en esta web.
Un saludo.
Hola Leonor,
Muchas gracias por tu comentario.
Con los apuntes de la web te será suficiente. Estoy adaptando los apuntes al nuevo libro, pero no hay muchos cambios.
Mi recomendación en ejercicios es que hagas los ejercicios de los exámenes, no sólo respondas a la pregunta que hagan, sino qué, por ejemplo, cojas una tabla de frecuencias y hagas todos los cálculos que puedas.
Si necesitar ayuda con algo, no dudes en contactarme y concretamos una clase si es necesario.
Saludos y ánimo!
Lidia
Genial, muchas gracias de nuevo Lidia!!
Buenos días Lidia.
Muchas gracias por el gran trabajo que te tomas para ayudarnos a todos.
Voy a empezar a mirarme el tema 1 con tus apuntes ya que, aunque el libro explica bastante bien, siempre es mejor ir comparando para esquematizar conceptos que al final esto no va sólo de calcular fórmulas.
Estoy ansiosa porque vayas subiendo el resto de temas ya que la próxima semana vamos a empezar con el tema 3 en las tutorías presenciales :-s
Mil gracias!!
Hola Ana,
Me ha encantado leer tu comentario 🙂
Aunque hayan cambiado el libro, el temario es muy similar. Así que mientras voy adaptando los apuntes ve adelantando también con los que ya hay.
Saludos y ánimo!
Lidia
Buenas tardes.
Gracias por tu respuesta.
Puedo descargar los apuntes de los otros temas o no los subes hasta que los tengas corregidos?
Saludos.
Hola Ana,
Voy adaptando los apuntes al nuevo libro y los iré subiendo al blog.
Saludos y ánimo!
Lidia
Hola Lidia,
¡Vaya hallazgo encontrar tu web! ¡Me has alegrado el día, la semana y el mes! 😀
Tu Blog es genial, explicas de una forma sencilla que engancha. Muchísimas gracias por tu ayuda, de verdad.
Hoy he estudiado el tema 1 pero veo que aún no has subido más temas revisados de acuerdo al nuevo libro. ¿Hay forma de obtener los apuntes antiguos en pdf para ir tirando hasta que subas los nuevos? Me gusta estudiar sobre papel, donde poder hacer anotaciones.
Un abrazo fuerte y de nuevo millones de gracias!
Hola AnaR!
Me ha encantado leer tus mensaje. Da muchos ánimos a seguir preparando material.
Siento decirte que los apuntes anteriores no los tengo en PDF 🙁 Sigo trabajando en los nuevos, pero no tengo mucho tiempo y van un poco lentos.
Si necesitas un poco de ayuda no dudes en contactar conmigo y hacemos las clases que necesites.
Muchas gracias de nuevo.
Saludos y ánimo!
Lidia
Hola Lidia. Gracias por el contenido. Tengo una duda ¿CUÁL ES EL INTERVALO CRÍTICO SI HAY MÁS DE UNA MODA?
Hola Cristina,
Si la distribución es bimodal, tiene dos modas, tendrá dos intervalos críticos también.
Saludos y ánimo!
Lidia