
1.1. INTRODUCCIÓN
1.1.1. ¿ESTADÍSTICA? ¿QUÉ ES ESO? MUCHO MÁS QUE UN SOLO USO
Si estás atento, en tu vida diaria podrás distinguir muchas apariciones del “gran fantasma” que es la estadística. Está en todas partes aunque no lo veamos. La predicción del tiempo, es estadística; el precio que hay que ponerle a los alimentos, también es estadística. Y también en el deporte más de una vez habrás oído hablar de porcentaje de tiros encestados.
No te preocupes, lo que vas a ver este curso es menos complicado que predecir el tiempo. Aunque si estás leyéndome es que te está dando problemas entenderla, pero ya verás que una vez lo vayas entendiendo paso a paso todo irá rodado, así que ¡SIGUE LEYENDO!
Además de medias, varianzas y probabilidades, que verás este curso, la estadística va más allá de todo esto (verás más aplicación al campo de la Psicología en el curso que viene). La estadística también se usa para ver si un medicamento contra la depresión, por ejemplo, ayuda o no a los pacientes. Y este es un campo muy importante.
La parte de estadística que vas a ver este año es Estadística descriptiva y Probabilidad.
La Estadística descriptiva trata de describir los datos para ayudarte a conocerlos. Verás que podemos saber un montón sobre ellos. Y es todo lo que vas a ir viendo este curso: medias, varianzas, gráficos…
Y en Probabilidad empezarás viendo la probabilidad de encestar y acabarás sabiendo como son las alturas en tu ciudad o los tiempos de paso del autobús que te lleva a casa.
El curso que viene, en la asignatura de Diseños de investigación y análisis de datos, verás Estadística inferencial (también iré preparando el blog para esta asignatura). Este campo de la estadística es la que busca comparar, y aprenderás a responder a preguntas del tipo:
- ¿La media de los resultados de cierto test aplicado puede ser 30, por ejemplo?
- ¿Hay diferencia entre chicos y chicas en la calificación de un test sobre comprensión verbal?
- ¿Cierto nuevo fármaco funciona mejor contra la depresión que el usado general?
Verás que esta parte es mucho más aplicable a temas de Psicología y seguro que te parecerá mucho más entretenido.
Espero que gracias a la introducción hayas entendido un poquito mejor todo el mundo de la estadística. Ahora ya nos metemos de lleno en la teoría. ¡Adelante!
1.1.2. DISTINGUIR ENTRE POBLACIÓN Y MUESTRA
Ponte en el caso de que quieres estudiar el rendimiento académico de los estudiantes de colegios e institutos de Zaragoza. Supongamos que son 100.000 los estudiantes que hay. ¿Te pondrías a medir el rendimiento de todos los estudiantes de la ciudad? Verdad que no. Pues ahí tienes la población: los 100.000 estudiantes en Zaragoza.
Como sería demasiado difícil que les hicieses un test para medir el rendimiento de todos los estudiantes, lo que vas a hacer es tomar un muestra. Es decir, vas a seleccionar a cierto número de estudiantes a los que les harás el test, por ejemplo 500.
La muestra no puedes tomarla como quieras, tiene que ser representativa. No puedes tomar una muestra de 500 chicas cuando también hay chicos en la ciudad y tampoco puedes tomar a todos los menores de 10 años porque hay estudiantes con más años. La muestra tiene que tener las mismas características que la población.
Es un trabajo difícil la toma de muestras, yo llevé dos asignaturas en la carrera sobre muestreo, pero tranquilo que esté trabajo no lo vas a tener que hacer tú. A ti ya te dan los datitos recogidos o inventados. Pero es importante que entiendas bien de donde viene todo para poder comprender mejor lo que vas haciendo.
Como la muestra que vas a tener es representativa, los resultados que tengas podrás extrapolarlos a la población.
Aunque hablemos de cosas iguales en muestra y población, como puede ser la media o el tamaño de muestra, en la práctica se usan distintas letras para distinguir lo que pertenece a cada sitio. Este cuadro te vendrá muy bien para distinguirlos:
1.2. VARIABLES: MEDICIÓN Y CLASIFICACIÓN
Siguiendo con el ejemplo anterior, en el que queríamos estudiar el rendimiento académico de los 100.000 alumnos de Zaragoza, el rendimiento académico sería la variable.
Te recomiendo que nada más empezar un ejercicio lo primero que hagas sea escribir la variable de estudio, en este ejemplo pondrías: X = ”Rendimiento académico de los estudiantes de colegios e institutos de Zaragoza”. Ponemos X porque así se denominan las variables, primero X y si hay más Y, Z (no se suele trabajar con más variables).
Tener claro lo que estás estudiando te ayudará a entender los ejercicios y saber si tus resultados son coherentes o no lo son, lo que podría indicar que están mal hechos. Si estás con la variable altura de personas y te sale una media de 10,8 cm. está claro que has hecho algo mal y tienes que repasar dónde has fallado.
Tras tener tu variable, es necesario saber cómo vas a medir dicha variable, es decir, cómo vas a tomar los valores que la definen. En ciertos casos es sencillo, como por ejemplo en la variable altura de personasvas a necesitar un metro para realizar la medición. Pero en otras ocasiones no es tan sencillo, cómo en nuestro ejemplo X = ”Rendimiento académico de los estudiantes de colegios e institutos de Zaragoza”. En este tipo de variables hay que decidir cómo se va a medir, por ejemplo la nota de cierto examen.
Tras ello, lo segundo más importante es clasificar la variable. Según de qué tipo sea podrás calcular unas cosas u otras, por lo que clasificarla es fundamental.
1.2.1. CLASIFICACIÓN
Existen 4 escalas de medida y 3 grandes tipos de variables.
Este apartado de las escalas de medida he de decir que la primera vez que lo vi fue dando clases a una alumna de Psicología. Creo que el mejor modo de entenderlas y clasificarlas es con un cuadro resumen y con ejemplos, así que aquí lo tenéis:
Cada escala suma las condiciones de las escalas anteriores.Es decir, la escala ordinal también cumple las características de la nominal, la escala de intervalo cumple las de la ordinal y la nominal, y la escala de razón las de todas las anteriores.
Este cuadro tendrás que memorizarlo, es muy típico de preguntas teóricas en los exámenes.
- La escala Nominal tiene variables de tipo cualitativas o categóricas
- La escala Ordinal tiene variables de tipo cuasicuantitativas
- Las escalas de Intervalo y Razón tienen variables de tipo cuantitativo.
1.2.1.1. VARIABLES QUE EXPRESAN CUALIDADES
Una variable que expresa CUALIdad puede ser de tipo CUALItativa o CUASICUANTItativa, dependiendo de si esa cualidad no tiene orden (cualitativa) o si tiene orden y se puede sustituir por números (cuasicuantitativa). Además, la respuesta a este tipo de variables son palabras. Por ejemplo, la variable color de pelo es cualitativa y la variable nivel de estudios es cuasicuantitativa.
Para diferenciar entre una variable cualitativa dicotómica o politómica tienes que fijarte en el número de respuestas que te pueden dar. Si sólo te pueden dar dos respuestas, por ejemplo la variable sexo o una que sea de respuesta si/no, es una variable cualitativa dicotómica. Si por el contrario pueden darte más de dos valores es una variable cualitativa politómica, será el caso de la variable color de pelo. Las dicotómicas no las vas a usar mucho este curso, pero al que viene las usarás para hacer diferencias entre sexos o entre tomar o no un medicamento, por ejemplo.
Las variables cuasicuantitativas tienes que distinguirlas por su orden preestablecido. La variable de ejemplo que hemos dicho, nivel de estudios, tiene el orden ya preestablecido, Educación Primaria, Educación Secundaria, Bachillerato, Grado Universitario, Postgrado Universitario, Doctorado… Y podrías sustituir los valores por nivel 1, nivel 2, nivel 3…
1.2.1.2. VARIABLES QUE EXPRESAN CANTIDAD
Una variable que expresa CANTIdad es una variable CUANTItativa. Además, la respuesta a las variables cuantitativas es un número. Por ejemplo, resultado del test de rendimiento o número de hijos.
Para diferenciar entre variables cuantitativa discreta o continua también has de fijarte en el número de las posibles respuesta. Si toma pocos valores y puedes decir los valores que te van a dar, como es el caso de número de hijos o número de coches en la familia, es una cuantitativa discreta. Si por el contrario toma muchos valores y son diversos será una cuantitativa continua, por ejemplo la altura o la puntuación de un test de 100 preguntas.
Otra cosa que te facilitará diferenciar entre discreta y continua es si piensas en enumerar los resultados posibles, date cuenta que las discretas toman pocos valores y las continuas muchos.
También tienes que saber que una misma variable puede cambiar de discreta a continua según en qué población te estés fijando. No es lo mismo estudiar las edades en una ciudad (en este caso será continua) que en un instituto (será discreta).
Espero que esta entrada te haya ayudado a entender estos conceptos básicos de la Estadística. Si crees que puede ayudar a alguien más compártela en tus redes sociales. Si te ha quedado alguna duda no tengas problema en preguntarme en los comentarios.
En la siguiente entrada, Tema 1, parte 2: Organización de datos, encontrarás la segunda parte del tema.
Hola lidia, pensaba que la diferencia entre discretas y continuas era que las discretas por ejemplo son números sin decimales como número de hijos 1,2,3 y continuas con decimales por ejemplo el peso 70,4 o la altura 1,75 y tú comentas que puede pasar de discretas a continuas dependiendo de la población y en este caso como lo entiendo siempre serían discretas en una población ya que si hay 1000 0 55000 personas,siempre son números sin decimales y no 1000 personas con 3 por ejemplo.Muchas gracias,espero tú respuesta.
Hola Jose,
Ponte por ejemplo en el caso de la variable aleatoria Edad. Si es «Edad de los alumnos de un instituto», las respuesta estarán entre 12 y 18. Pero si por el contrario es «Edad de los habitantes de cierta ciudad». En este caso las edades irían desde 0 hasta … 100? por ejemplo. Tenemos tanta variedad de respuestas que en este caso la variable no puede considerarse discreta y la trabajaríamos por intervalos.
Cualquier duda me dices. También tienes la posibilidad de contratar una clase para resolver dudas.
Saludos y ánimo!
Lidia
Hola lidia, gracias por la explicación.
Un Saludo