
En la entrada anterior vimos los conceptos básicos. Vamos a continuar con uno de los ejemplos que vimos, estudiar el rendimiento académico de los estudiantes de colegios e institutos de Zaragoza.
Además de este ejemplo vamos a trabajar con otros dos más para ver las distintas opciones según el tipo de variable.
- Variable cualitativa: Nivel de estudios alcanzado
- Variable cuantitativa discreta: Número de hijos
- Variable cuantitativa continua: Resultado test de rendimiento académico
Una vez que ya sepas cuál es tu objeto de estudio, pasarás la encuesta o realizarás la medición a los individuos de tu muestra. En el caso del ejemplo, pasarás el test a los 500 estudiantes de la muestra.
Teniendo todos los resultados de tu test es imposible conocer o hablar de los resultados que han dado, por lo que el siguiente paso que vas a hacer es agrupar los resultados en una tabla de frecuencias.
1.5. Conteos y frecuencias
Con todos tus datos en la mano tendrás que fijarte en qué te han contestado y empezar a contar cuántos te han respondido cada cosa (no te preocupes esto tampoco lo tendrás que hacer). Este conteo se llama frecuencia absoluta ( ni ).
La suma de las frecuencias absolutas te tiene que dar el número total de individuos, n.
Aquí te pongo las frecuencias de las tres variables que hemos nombrado. Seguiremos trabajando con ellas a lo largo de los temas, así que ¡no las pierdas!
Cuando la variable es cuantitativa continua tenemos que fijarnos bien en los intervalos. Los intervalos están formados por el límite inferior y el límite superior (Li-Ls). El límite inferior es el valor mínimo que pueden tomar los datos que estén en ese intervalo, y el límite superior el máximo.
Los límites que tienes en la tabla anterior en la columna “Rendimiento” son los límites aparentes o virtuales. Lo que ocurre con estos límites es que hay un salto entre los intervalos. ¿Qué pasaría si alguien sacase un 20,5 en el test? Para arreglar esto creamos los límites exactos o reales.
Los límites exactos restan y suman, respectivamente para limite inferior y superior, una cifra decimal al número. Es decir, si tengo límite aparente superior 20 (como en el primer intervalo del ejemplo), el límite exacto superior 20,5. Si tuviese un límite aparente superior de 20,3, el límite exacto superior sería 20,35. Añado el 5 como un decimal más.
La tabla de frecuencias del rendimiento quedaría así:
Las frecuencias absolutas no sirven para saber a si la mitad de los individuos tienen 0 hijos, por ejemplo. Para saber los porcentajes que hay en cada grupo usamos las frecuencias relativas ( pi ).
Las frecuencias relativas ( pi ) y los porcentajes ( Pi ) vienen a ser lo mismo, pero el primero en tanto por uno y el segundo en tanto por ciento. Al estar más acostumbrado a usar porcentajes te resultará más entendible el porcentaje, pero no te olvides que es la frecuencia relativa multiplicada por 100.
Estas fórmulas que ves no son más que la regla de tres:
Unas reglas que te servirán para ver si te has equivocado en algún cálculo son:
- La suma de ni tiene que dar n
- La suma de pi tiene que dar 1 o próximo a 1 (por el error de redondeo)
- La suma de Pi tiene que dar 100% o próximo (por el error de redondeo)
Estas tres frecuencias (absoluta, relativa y porcentaje) se pueden calcular para los tres tipos de variables (cualitativas, cuantitativas discreta y cuantitativas continuas), pero las frecuencias acumuladas no.
La frecuencia acumulada consiste en sumar frecuencias de las anteriores respuestas, en acumular hacia los valores más pequeños de la variable. Por ejemplo, la frecuencia absoluta acumulada del intervalo 20-40 del rendimiento es 82+104, la del 40-60 es 82+104+122, etc.
También puede ser acumulado del mayor al menor, esto depende de cómo te den ordenados los valores en la tabla. Pero la idea es la misma.
Tenemos tres frecuencias acumuladas: frecuencia absoluta acumulada ( nai ), frecuencia relativa acumulada ( pai ) y porcentaje acumulado ( Pai ). Cada uno acumula con sus respectivas frecuencias simples.
Como lo que hacemos es sumar distintas respuestas de la variable esto tiene que tener sentido. Si tenemos una variable que es color de pelo no tiene sentido sumar los rubios y los morenos, por ejemplo. Por ello, las frecuencias acumuladas se pueden hacer de variables cualitativas ordinales y cuantitativas.
Te pongo el ejemplo con una de las tablas, con las otras es igual.
Para comprobar que está bien acumulado sólo tienes que darte cuenta de que la última fila se corresponda con la suma de las frecuencias simples.
Si, por ejemplo, quieres saber qué porcentaje de alumnos han sacado un rendimiento menor a 60, tienes que irte a la tabla de los porcentajes acumulados (Pai) y mirar la fila correspondiente al intervalo 40-60: el 61,6% de los alumnos tienen un rendimiento inferior a 60.
1.6. Un gráfico para cada tipo de variable
Las frecuencias te sirven para conocer numéricamente tu variable, pero el mejor modo de visualizarla es con un gráfico.
Existen muchos tipos de gráficos distintos , los que tú vas a estudiar son el diagrama de barras, el diagrama de sectores (también llamado gráfico de pastel), el histograma y el polígono de frecuencias.
Según que tipo de variable tengas harás un gráfico u otro. Esta tabla te ayudará a clasificarlos:
También hay gráficos conjuntos para dos variables, pero los veremos en el Tema 4: Análisis conjunto de dos variables.
Antes de empezar a describir los gráficos tienes que recordar que los gráficos tienen ciertas características:
- Eje de abscisas o eje X: es la línea horizontal, en la que pondremos los valores de nuestra variable.
- Eje de ordenadas o eje Y: es la línea vertical, en la que pondremos las frecuencias.
- Origen: punto de corte de los ejes. En matemáticas se corresponde con las coordenadas (0,0) pero no en Estadística. Solamente será el valor 0 para el eje de ordenadas.
Diagrama de barras
Como te he dicho con el cuadro anterior, el diagrama de barras se puede usar para las variables cualitativas y para las variables cuantitativas discretas.
Este gráfico consiste en poner unas barras sobre cada uno de los valores de la variable que lleguen hasta su frecuencia.
Vayamos por pasos con el ejemplo del número de hijos:
1º) Dibuja los ejes.
Escribe los valores de la variable en el eje horizontal (aunque uno de los valores sea el 0 no hay que ponerlo en el origen).
Fíjate en la frecuencia mínima y en la máxima de la tabla de frecuencias para poner las marcas en el eje vertical.
2º) Dibuja las barras.
Sobre cada uno de los valores de la variable haz una barra que llegue hasta la frecuencia absoluta del valor.
En este ejemplo hemos puesto la frecuencia absoluta, pero puedes poner cualquiera de las frecuencias vistas en el apartado anterior.
Ya tienes el diagrama de barras.
Cuanto más alta es la barra mayor cantidad de individuos hay en ese valor (mayor frecuencia).
Diagrama de Sectores
El diagrama de sectores, aunque sí lo dais en teoría, no vas a tener que crearlo a mano en ningún momento, ya que para hacerlo te haría falta un transportador de ángulos.
Aun así, el diagrama de sectores es muy utilizado, con lo que te vendrá bien conocerlo.
Vamos a continuar con el ejemplo de número de hijos. Recuerda que este gráfico lo pues usar con variables cualitativas y con cuantitativas discretas.
1º) Cálculo de los grados.
Del mismo modo que has calculado el porcentaje en la tabla de frecuencias con la idea de la regla de tres tienes que calcular los grados. Si el tamaño de la muestra son los 360° del círculo, ¿cuántos grados tendrá ni?
2º) Dibujar las porciones.
Una vez que ya tienes los grados correspondientes tienes que ir creando las “porciones de tarta” (por esto este gráfico también se le llama gráfico de pastel).
Cuanto más alta es la porción mayor cantidad de individuos hay en ese valor (mayor frecuencia).
Histograma
El histograma es un gráfico muy similar al diagrama de barras, pero las barras van a estar juntas. Estarán juntas porque el histograma se usa únicamente en variables cuantitativas continuas.
En este gráfico pondremos un rectángulo sobre intervalo con los límites exactos que sea tan alto como su frecuencia.
Vayamos por pasos con el ejemplo del rendimiento:
1º) Dibuja los ejes.
Escribe los límites exactos de los intervalos en el eje horizontal.
Fíjate en la frecuencia mínima y en la máxima de la tabla de frecuencias para poner las marcas en el eje vertical.
2º) Dibuja las barras.
Sobre cada uno de los intervalos haz una barra que llegue hasta la frecuencia absoluta de dicho intervalo.
En este ejemplo hemos puesto la frecuencia absoluta, pero puedes poner cualquiera de las frecuencias vistas en el apartado anterior.
Ya tienes el histograma.
Polígono de frecuencias
El polígono de frecuencias se usa con variables cuantitativas, tanto discretas como continuas y con variables cualitativas.
Para crear un polígono de frecuencias tienes que haber creado previamente un diagrama de barras o un histograma ya que lo que vas a hacer es crear una línea de unión entre las alturas de las barras. Como este:
Los puntos rojos que he puesto no son necesarios, sólo los he puesto para que veas desde donde tiene que salir la línea.
Esto mismo se hace también con el histograma.
1.7. Visualizar y comprender
Los gráficos nos ayudan a ver de forma general nuestros datos.
Puedes ver donde se encuentra el centro de los datos, lo que llaman la tendencia central. Si pusiésemos la gráfica sobre una regla, buscar el punto de equilibrio será, más o menos, donde se encuentre la media.
Además de la media podemos ver la variabilidad o apuntamiento. La variabilidad es el cuanto se mueven mis datos, si están muy dispersos o si están agrupados.
Podemos ver la asimetría. Para mirara si tus datos son simétricos tienes que “cortar” el gráfico por la mitad y mirar si la zona derecha es igual que la izquierda, como si fuera un espejo. Si esto no ocurre quiere decir que tus datos son asimétricos.
Existen dos tipos de asimetría: asimetría positiva, en la que la cola estará a la derecha, y asimetría negativa, la cola estará a la izquierda. La idea de derecha/izquierda te será más fácil de recordarla si piensas que en el eje x los números positivos están a la derecha y los negativos a la izquierda.
¿Qué información nos da saber que hay una asimetría?
Por ejemplo, una asimetría negativa nos dice que tenemos muchos valores altos y tiene algunos valores pequeños que crean esa cola a la izquierda.
Con esta entrada terminamos el primer tema. Si te perdiste la primera parte del tema no pierdas el tiempo y a por ella.
Espero que te haya resultado de ayuda. Y si tienes dudas no tengas problema en preguntar en los comentarios.
Continúa entendiendo la Estadística en Tema 2, parte 1: Medidas de tendencia central.
Hola Lidia!
Enhorabuena por esta entrada! Se ve super ordenada y muy clara. Se agradecen estas explicaciones paso a paso, sobre todo porque el trabajo de generar las imágenes lleva mucho trabajo detrás.
Enhorabuena y sigue adelante con el blog, sé que l@s estudiantes de psicología de la UNED te lo agradecerán para superar las asignaturas de estadística.
Un saludo
Hola Borja,
Muchísimas gracias por tu comentario. La verdad es que las imágenes es lo que más me va costando.
Seguiré haciendo entradas y espero que les sirva de ayuda a mucha gente.
De nuevo gracias y un saludo
Me encantan tus explicaciones. Muy buen trabajo.
Muchas gracias!!!
Mil gracias por los ánimos!!
Suben la moral y las ganas de seguir haciendo cositas.
En la tabla en la que relacionas representaciones gráficas y variables aparece un «sí» en verde en el polígono de frecuencias respecto a variables cualitativas…en la explicación hablas sólo de variables cuantitativas (discretas y continuas). Eso es lo que figura también en nuestro manual…es un error? no se puede hacer entonces polígono de frecuencias con variables cualitativas?
Gracias de antemano por la aclaración y enhorabuena por el blog, es de gran ayuda
Hola Ádega,
Disculpa, error mío. Ya lo he modificado.
El polígono de frecuencias va asociado tanto a diagrama de barras como histograma, así que se usa tanto en cualitativa como en cuantitativa. Digo se usa, pero muy pocas veces; aunque en parte práctica de vuestros exámenes lo ponen más de una vez (sobre todo con datos referidos a años), pero tienes que tratarlo igual que un gráfico de barras.
Saludos y ánimo!
Lidia
Hola Lidia, repasando el tema 1 no me queda muy claro como se obtiene el punto medio, serias tan amable de aclararmelo? Muchas gracias
Hola Gema.
Supongo que por punto medio te refieres al del intervalo, a la marca de clase. La explicación está al comienzo del Tema 2.
Lo explico en el T2 porque es ahí donde es necesario usarlo para poder calcular medidas.
Míralo y confírmame que lo entiendes.
Saludos y ánimo!
Lidia
Siii, muchas gracias!
¡¡De nada!!
Saludos y ánimo!
Muchísima gracias por esta gran explicación. Súper claros los conceptos. Leí el libro y cosas no me quedaban claras. Pero con tu explicación puedo pasar al tema 2 tranquila. Gracias
Hola Loly!
Me alegro un montón de que te sirvan las explicaciones. Espero que te sigan sirviendo el resto de temas 😀 seguiré subiendo el resto.
Pero si tienes alguna duda no tengas problema en preguntar en los comentarios.
Saludos y ánimo!
Lidia
Miles de gracias por ayudarnos de esta manera tan facil y visual, yo al menos en mis clases no entiendo absolutamente nada asi que si apruebo sera gracias a ti.Una vez más gracias!
Hola Sheila.
Me alegro un montón de que te sirva. Y si vas entendiendo todo seguro que apruebas.
Gracias por tu comentario.
Saludos y ánimo!
Lidia
Muchas gracias Lidia, me has despejado muchísimas dudas y lo veo ahora todo más claro.Soy de letras y me está costando bastante trabajo coger el hilo a la asignatura pero gracias a ti he avanzado un montón,estoy muy agradecida.
Te quería plantear una duda.En el libro hablan también de la variable cuasicuantitativa pero no veo que hables de ella. Consideras que no debemos hacerle mucho caso,no sale en examen? Gracias y buen trabajo
Hola Silvia,
Me alegra mucho tu comentario, y que queden bien claritas esas dudas que tenías.
Ciertamente considero que no deberíais hacerle ningún caso a lo que en el libro llaman variables cuasicuantitativas. Es un término algo lioso que, por extraño que pueda parecer, nunca se ha aparecido a lo largo de la carrera de estadística; ¡¡la primera vez que lo leí fue en vuestro libro!!
Saludos y ánimo!
Lidia
Muchísimas gracias por tantísimo esfuerzo, lo bien que esta todo explicado. Como estudiante de la Uned te lo agradezco muchiiiiiiiiiiiisimo!!! No tiene nada que ver tus explicaciones con las del libro ( no me entero de nada) ni con las de otros profes de la Uned. Para la gente como yo que se nos dan fatal los números esta asignatura es un poco difícil de entender y más si no te lo explican bien.
Qué suerte haberte encontrado por casualidad! igual hasta consigo aprobarla de un vez, ojalá!!
Mil gracias!!
Un saludo
Hola Sara.
Me pone muyyyy contenta leer tu comentario, y saber que el esfuerzo merece la pena.
Si necesitas cualquier cosa no dudes en ponerte en contacto conmigo.
Saludos y mucho ánimo!
Lidia