Jardín, diciembre 2022
Distribuciones T Student y Stanine
Teoría de las muestras pequeñas
Se supone que una variable xi ya se ha muestreado, con una muestra grande y que es aceptada como una muestra universal. De esta muestra conocemos la media.
Ahora bien, alguien
hace una muestra pequeña N<30 y quiere verificar los resultados de su
muestra pequeña están
acordes con la muestra general, en un porcentaje 90%, 95% o 99%.
Ejemplo explicativo:
El ministerio de educación ha hecho un estudio y lo ha aceptado, el cual afirma que, en todas escuelas rurales, los niños de 6 a10 años aprenden a leer 120 palabras por minuto. Una maestra rural hace una muestra pequeña en su escuela, de 20 niños entre 6 y 10 años, y obtiene como resultados promedio 118 palabras por minuto, con una desviación estándar de 4 palabras por minuto. Se pregunta si estos resultados tienen un margen de error inferior al 5% respecto de la media nacional.
La muestra pequeña tiene un número de valores N. El análisis matemático de la distribución T Student utiliza el valor N-1 y a este valor lo llama “grados de libertad”. La distribución T Student tiene la siguiente formulación matemática, en la cual no profundizaremos y es sólo por cultura general.
Figura 1 Definición de
función de densidad de T Student y de grados de libertad.
Se ha establecido que la distribución T Student:
a) Tiene media igual a 0
b) Su forma es similar a la campana de la distribución
estándar
c) Mientras más grande sea el número de grados de libertad, más
se acerca y aproxima a la distribución estándar.
d) La muestra pequeña no debe tener N>30 y K (grados de
libertad) mayor a 29, porque ya prácticamente coincide con la distribución
estándar.
Grados de libertad
∑ (xi -μ) = 0, para n de i de 1 a n
Si por ejemplo n = 4 y x1
- u = 8; x2 - μ = - 6, x4 - μ = -4 y x3 - μ =
a
∑
(xi -μ) = 0 para i de 1 a n
Si por ejemplo n = 4 y x1
- u = 8; x2 - μ = - 6, x4 - μ = -4 y x3 - μ =
a
x1 - μ + x2
- μ +x3 - μ + x4 - μ = 8 - 6 - 4 +a = 0 y a = 2 Así, como
hay tres variables totalmente libres y la suma xi - μ = 0 , la variable
faltante, sólo puede tomar el valor 2. En este caso decimos que la distribución
tiene tres grados de libertad.
(xi - Ejemplo 1
Calibración de una pesa
Un laboratorio fabrica un instrumento de medición, que vende, como si pesara 50 gramos. Cada cierto tiempo hace pequeños muestreos para verificar que su producto pese realmente, 50 gramos.
Toma una pequeña
muestra de 20 ensayos y ve que el promedio de esta pequeña muestra es 52,5 con
una desviación estándar de 4.
El laboratorio va a
vender este instrumento y dice que pesa 50 gramos, pero que existe un margen de
error del 5%, (2,5% por encima y 2,5% por debajo). Estos porcentajes por encima
y por debajo se llaman colas.
Antes de ponerlo en venta al público, quiere saber si esta garantía (2,5% por encima y 2,5% por debajo) es correcta o no y el margen de error tiene respaldo estadístico.
Para convertir x promedia en la variable t se utiliza la fórmula
t= (xN– μ) /(s/√N) (1)
En cada ejemplo hay que tener una media universal de comparación: μ= media universal; hay que tener también, una media xN de la pequeña muestra y un s =desviación estándar de la pequeña muestra; N= número de valores tomados en la muestra, K = grados de libertad = N-1.
Con la fórmula (1) calculamos t t = (52,5-50)7(4/√20) = 2,7951
Vamos a las tablas t de dos colas con K = 19 y el margen de error por cola =2,5% =0,025
Obtenemos el número 2,093
Si el t obtenido de la muestra (2,7951), no está en el intervalo [-2,093, 2,093] hay que revisar el proceso constructivo, que es lo que realmente dio el estudio.
Ejemplo 2
Para el caso de lo que llamamos ejemplo explicativo, del aprendizaje a leer en escuelas rurales.:
Media universal μ= 120 palabras por minuto = ppm
Media de la muestra
pequeña: xN= 118 ppm
N= 20
Grados de libertad K =
19 (N-1)
Desviación estándar de
la muestra pequeña s=4
Para la fórmula (1)
t = (118 – 120) / (4/√20) = -2,24
¿Qué hacemos con este dato? Hay tablas para distribución t de 1 y 2 colas
Tablas para t Student (dos colas)
Figura 2 (Tablas para T
Student de dos colas)
Entramos con K = 19 y repartimos el error que no queremos aceptar (5%) en dos, 2,5% en la cola de la izquierda y 2,5% en la cola de la derecha y obtenemos el valor 2,093
Si este valor lo ponemos en un eje t, a la izquierda y a la derecha de 0, la interpretación es la siguiente:
Si el t calculado, cae
en el intervalo [-2,093, 2,093] podemos asegurar que en esa escuela se cumple
la media nacional, con un margen de error del 5%. Si el t calculado está a la
izquierda o a la derecha del intervalo [-2,093, 2,093], no podremos asegurar lo
anterior. En este caso, con t = -2.24, a la izquierda de -2,093, la maestra
debe revisar si hay un elemento extraordinario, afectando el proceso de
aprendizaje. Hay que hacer correctivos.
Ejemplo 3
Los neumólogos han establecido que un empleado, masculino o femenino, entre 25 y 55 años, que tiene vida sedentaria, tiene una capacidad máxima promedio de respiración de 1150000 cm3 por minuto.
El gerente de un banco hace una muestra pequeña, de 25 empleados (al azar hombres y mujeres, entre 25y 55 años) y encuentra que esa pequeña muestra tiene en promedio, una capacidad respiratoria máxima de 110000 cm3 p m, con una desviación estandar de 13000 cm3 p m.
Con esos resultados de la pequeña muestra, quiere saber si sus empleados están dentro de la media universal de capacidad respiratoria, con un margen de error del 5% (2,5% por debajo y 2,5% por debajo)
Media universal μ= 115000 cm3 p m, N=25, K (grados de libertad) = 24, media de la pequeña muestra x= 110000 cm3 p m, desviación estandar de la pequeña muestra s=13000 m3 p m.
Queremos saber si 110000 m3 p m es un buen indicador que los empleados del banco tienen una capacidad respiratoria adecuada, con un margen de error de 2,5% por debajo y 2,5% por encima.
Calculamos t t= (110000-115000) / (13000/√24) = -1,88
Entramos a la tabla de dos colas con K = 24 y %/cola = 0,025 y encontramos el valor 2,064
Como t= -1.88 está dentro del intervalo cerrado [-2,064, 2,064] y podemos concluir que el personal adulto de empleados del banco tiene una capacidad respiratoria adecuada, dentro del promedio mundial, con un margen de error de ±2,5%
Distribución Stanine (estándar nine)
En general, se aplica principalmente, para analizar los resultados de exámenes, una variable que se distribuye normalmente. Sirve para analizar si el resultado del examen es aceptable, si el examen estuvo adecuado y además, permite hacer una radiografía del rendimiento y esfuerzo de los estudiantes que presentaron ese examen o de las notas definitivas al final del año.
Las calificaciones o resultados, de acuerdo con las costumbres de diferentes institutos y a veces, de las mismas naciones, normalmente se acomodan entre pésimo y excelente, en resultados numéricos, en intervalos así, donde la calificación tiene decimales.
[0, 5]
[0, 10]
[0, 100]
[0, 1000]
La premisa de que, si el diseño del examen es adecuado, entonces las notas resultantes se distribuyen normalmente, es de aceptación casi universal.
La distribución Stanine
(Estándar nine) es una forma de acomodar las calificaciones en números enteros
de 1 a 9, para lo cual debemos convertir las calificaciones con decimales, que
tenemos, a valores entre el 1 y el 9.
Las calificaciones
Stanine tienen las siguientes características:
Hecha la distribución normal de las calificaciones x, conocemos su media μ y su desviación estándar s. Tenemos un listado de calificaciones, en cualquiera de los intervalos mencionados, cada una con sus respectivos decimales.
Tomamos el número N de exámenes o resultados y encontramos los siguientes porcentajes de ese N.
% de N |
% entre |
N número de
calificaciones en cada intervalo |
Se asigna Stanine
(sin decimales) al intervalo encontrado |
Valor de z, sobre el
cual se asigna el Stanine |
Hasta que z llega la
influencia del Stanine |
4 |
(0, 4) |
|
1 |
-2,0 |
< =-1,75 |
7 |
[4, 11) |
|
2 |
-1,5 |
[-1.75, -1.25) |
12 |
[11, 23) |
|
3 |
-1,0 |
[-1,25, -0,75) |
17 |
[23, 40) |
|
4 |
-0,5 |
[-0,75, -0,25) |
20 |
[40, 60) |
|
5 |
0 |
[-0,25, 0,25) |
17 |
[60, 77) |
|
6 |
0,5 |
[0,25, 0,75) |
12 |
[77, 89) |
|
7 |
1,0 |
[0,75, 1,25) |
7 |
[89, 96) |
|
8 |
1,5 |
(1,25, 1,75) |
4 |
[96, 100) |
|
9 |
2,0 |
>=1,75 |
Tabla 1
Para facilitar el trabajo anterior, siempre debemos copiar la lista en Excel y luego la ordenamos de menor a mayor. A las que cayeron en el 4% inferior, les asignamos la nota 1.
A las que cayeron entre
el 4 y el 11%, se les asigna el Stanine 2 y así sucesivamente.
Si el examen fue adecuado, la tabla anterior nos permite hacer un análisis para presentar a los mismos estudiantes, a sus padres y a las directivas del colegio o universidad, si así lo requirieran.
Opiniones sobre el Stanine
Calificación Stanine |
Opinión y análisis |
1 |
Pésimo desempeño,
requiere conversación con alumno y padres |
2 |
Un desempeño malo,
requiere conversación con alumno y padres |
3 |
Desempeño malo,
podría mejorar con un poco más de esfuerzo |
4 |
Desempeño inferior,
podría mejorar con un poco más de esfuerzo |
5 |
Desempeño intermedio,
algunos pasaron y otros reprobaron. Estos últimos con un poco mas de estudio
y atención en clase podrían haber ganado |
6 |
Desempeño aceptable,
pasó el examen, pero puede mejorar |
7 |
Desempeño aceptable,
pasó el examen, pero puede mejorar |
8 |
Desempeño bueno, con
un poco más de estudio, pudiera ser excelente |
9 |
Excelente,
felicitaciones. |
Tabla 2
Ejemplo 4
score= x |
|
1 |
49 |
2 |
48 |
3 |
43 |
4 |
27 |
5 |
38 |
6 |
37 |
7 |
35 |
8 |
21 |
9 |
31 |
10 |
31 |
11 |
29 |
12 |
39 |
13 |
27 |
14 |
26 |
15 |
23 |
16 |
32 |
17 |
20 |
18 |
19 |
19 |
43 |
20 |
27 |
21 |
46 |
22 |
44 |
23 |
34 |
24 |
21 |
25 |
37 |
26 |
35 |
27 |
29 |
28 |
39 |
29 |
30 |
30 |
30 |
31 |
23 |
32 |
31 |
33 |
25 |
34 |
24 |
35 |
41 |
36 |
27 |
37 |
16 |
38 |
20 |
39 |
33 |
40 |
20 |
Tabla 3
Son calificaciones o resultados en el intervalo [0, 50] en forma desorganizada.
Muestra N = 40
4% de 40 = 1,6 = 2
7% de 40 = 2,8 = 3
12% de 40 = 4,8 = 5
17% de 40 = 6,8 =7
20% de 40 = 8
17% de 40 = 7
12% de 40 = 5
7% de 40 = 3
4% = 2
Por las aproximaciones por exceso nos da N = 42y son sólo 40. Podíamos según el caso, a criterio, colocar sólo 1 para los 4% de las colas.
La lista organizada, con su calificación Stanine, de acuerdo con los datos anteriores.
|
score= x |
Stanine |
1 |
16 |
1 |
2 |
19 |
2 |
3 |
20 |
2 |
4 |
20 |
2 |
5 |
20 |
3 |
6 |
21 |
3 |
7 |
21 |
3 |
8 |
23 |
3 |
9 |
23 |
3 |
10 |
24 |
4 |
11 |
25 |
4 |
12 |
26 |
4 |
13 |
27 |
4 |
14 |
27 |
4 |
15 |
27 |
4 |
16 |
27 |
4 |
17 |
29 |
5 |
18 |
29 |
5 |
19 |
30 |
5 |
20 |
30 |
5 |
21 |
31 |
5 |
22 |
31 |
5 |
23 |
31 |
5 |
24 |
32 |
5 |
25 |
33 |
6 |
26 |
34 |
6 |
27 |
35 |
6 |
28 |
35 |
6 |
29 |
37 |
6 |
30 |
37 |
6 |
31 |
38 |
6 |
32 |
39 |
7 |
33 |
39 |
7 |
34 |
41 |
7 |
35 |
43 |
7 |
36 |
43 |
7 |
37 |
44 |
8 |
38 |
46 |
8 |
39 |
48 |
8 |
40 |
49 |
9 |
Tabla 4 Lista
organizada de menor a mayor y asignación del Stanine.
El profesor está listo, sin necesidad de utilizar fórmulas matemáticas, ni estadísticas, para presentar un informe a los alumnos, padres y directivas y hasta para decidir si repite el examen o no.
Pero la distribución Stanine, también da para problemas matemáticos. Supongamos:
Los resultados de un examen estandarizado, arrojan una media de 500 y una desviación estándar de 100.
Cuáles son los resultados de la muestra estandarizada, en la escala Stanine.
Recordemos que, la distribución estándar z, tiene tablas, que evitan la integración.
z = (x – μ) /s; (2) μ= media de la muestra; (3); s = √ ((x – μ)2/N) (4) desviación estándar de x
f(z) = (1/√(2p)) e^(-x2/2) (5)
Figura 3 Stanine vs
distribución normal z
Stanine |
z |
intervalo de z |
x =100z+500 |
% que sacó nota x en cada intervalo |
|
1 |
-2 |
x<-1,75 |
Menor de325 |
4 |
sacó menos de 325 |
2 |
-1,5 |
[-1,75,-1,25) |
375 |
7 |
sacó entre 325 y 375 |
3 |
-1 |
[-1,25,-0,75) |
425 |
12 |
sacó entre 375 y 425 |
4 |
-0,5 |
[-0,75,-0,25) |
475 |
17 |
sacó entre 425 y 475 |
5 |
0 |
[-0,25,-0,25) |
525 |
20 |
sacó entre 475 y 525 |
6 |
0,5 |
[0,25, 0,75) |
575 |
17 |
sacó entre 525 y 575 |
7 |
1 |
[0,75, 1,25) |
625 |
12 |
sacó entre 575 y 625 |
8 |
1,5 |
[1,25, 1,75) |
675 |
7 |
sacó entre 625 y 675 |
9 |
2 |
x >= 1,75 |
Mayor a 675 |
4 |
Saco más de 675 |
Tabla 5
Si el resultado de un examen, cuyo score es entre 0 y 5 (con decimales), cuya media fue 3,4 y la desviación estándar fue igual a 0,5 se pregunta:
Si el alumno Juan sacó una nota Stanine de 7, ¿Qué nota real sacó en su examen?
Para un Stanine 7, la z debe estar en el intervalo [0,75, 1,25)
x=0,5 z+3,5 Por la fórmula (2)
z = 0,75 x= 3,875
z = 1,25 x= 4,125 Juan sacó una nota en entre 3,9 y
4.1
Si el alumno Carlos sacó una nota Stanine de 4, ¿Qué nota real sacó en su examen?
Para Stanine 4, la z debe estar en el intervalo [-0,75, -0,25)
z= -0,75 x=3,125
z= -0,25 x =3,375 Carlos sacó una nota en entre 3,13 y 3,40
Juan Fernando Sanín E