domingo, 15 de enero de 2023

DistribucionesT Student y Stanine

 

Jardín, diciembre 2022


Distribuciones T Student y Stanine

Teoría de las muestras pequeñas

Se supone que una variable xi ya se ha muestreado, con una muestra grande y que es aceptada como una muestra universal. De esta muestra conocemos la media.

Ahora bien, alguien hace una muestra pequeña N<30 y quiere verificar los resultados de su

muestra pequeña están acordes con la muestra general, en un porcentaje 90%, 95% o 99%.

Ejemplo explicativo:

El ministerio de educación ha hecho un estudio y lo ha aceptado, el cual afirma que, en todas escuelas rurales, los niños de 6 a10 años aprenden a leer 120 palabras por minuto. Una maestra rural hace una muestra pequeña en su escuela, de 20 niños entre 6 y 10 años, y obtiene como resultados promedio 118 palabras por minuto, con una desviación estándar de 4 palabras por minuto. Se pregunta si estos resultados tienen un margen de error inferior al 5% respecto de la media nacional.

La muestra pequeña tiene un número de valores N. El análisis matemático de la distribución T Student utiliza el valor N-1 y a este valor lo llama “grados de libertad”. La distribución T Student tiene la siguiente formulación matemática, en la cual no profundizaremos y es sólo por cultura general.


Figura 1 Definición de función de densidad de T Student y de grados de libertad.

Se ha establecido que la distribución T Student:

a)    Tiene media igual a 0

b)    Su forma es similar a la campana de la distribución estándar

c)    Mientras más grande sea el número de grados de libertad, más se acerca y aproxima a la distribución estándar.

d)    La muestra pequeña no debe tener N>30 y K (grados de libertad) mayor a 29, porque ya prácticamente coincide con la distribución estándar.

Grados de libertad

∑ (xi -μ) = 0,           para n de  i de 1 a n

Si por ejemplo n = 4 y x1 - u = 8; x2 - μ = - 6, x4 - μ = -4 y x3 - μ = a

∑ (xi -μ) = 0 para i de 1 a n

Si por ejemplo n = 4 y x1 - u = 8; x2 - μ = - 6, x4 - μ = -4 y x3 - μ = a

x1 - μ + x2 - μ +x3 - μ + x4 - μ = 8 - 6 - 4 +a = 0 y a = 2 Así, como hay tres variables totalmente libres y la suma xi - μ = 0 , la variable faltante, sólo puede tomar el valor 2. En este caso decimos que la distribución tiene tres grados de libertad.

 

 (xi - Ejemplo 1

Calibración de una pesa

Un laboratorio fabrica un instrumento de medición, que vende, como si pesara 50 gramos. Cada cierto tiempo hace pequeños muestreos para verificar que su producto pese realmente, 50 gramos.

Toma una pequeña muestra de 20 ensayos y ve que el promedio de esta pequeña muestra es 52,5 con una desviación estándar de 4.

El laboratorio va a vender este instrumento y dice que pesa 50 gramos, pero que existe un margen de error del 5%, (2,5% por encima y 2,5% por debajo). Estos porcentajes por encima y por debajo se llaman colas.

Antes de ponerlo en venta al público, quiere saber si esta garantía (2,5% por encima y 2,5% por debajo) es correcta o no y el margen de error tiene respaldo estadístico.

Para convertir x promedia en la variable t se utiliza la fórmula

t= (xN– μ) /(s/√N)                                                       (1)

En cada ejemplo hay que tener una media universal de comparación: μ= media universal; hay que tener también, una media xN de la pequeña muestra y un s =desviación estándar de la pequeña muestra; N= número de valores tomados en la muestra, K = grados de libertad = N-1.

Con la fórmula (1) calculamos t                  t = (52,5-50)7(4/√20) = 2,7951

Vamos a las tablas t de dos colas con K = 19 y el margen de error por cola =2,5% =0,025

Obtenemos el número 2,093

Si el t obtenido de la muestra (2,7951), no está en el intervalo [-2,093, 2,093] hay que revisar el proceso constructivo, que es lo que realmente dio el estudio.

Ejemplo 2

Para el caso de lo que llamamos ejemplo explicativo, del aprendizaje a leer en escuelas rurales.:

Media universal μ= 120 palabras por minuto = ppm

Media de la muestra pequeña: xN= 118 ppm

N= 20

Grados de libertad K = 19    (N-1)

Desviación estándar de la muestra pequeña s=4

Para la fórmula (1)

t = (118 – 120) / (4/√20) = -2,24

¿Qué hacemos con este dato? Hay tablas para distribución t de 1 y 2 colas

Tablas para t Student (dos colas)



 

Figura 2 (Tablas para T Student de dos colas)

Entramos con K = 19 y repartimos el error que no queremos aceptar (5%) en dos, 2,5% en la cola de la izquierda y 2,5% en la cola de la derecha y obtenemos el valor 2,093

Si este valor lo ponemos en un eje t, a la izquierda y a la derecha de 0, la interpretación es la siguiente:

Si el t calculado, cae en el intervalo [-2,093, 2,093] podemos asegurar que en esa escuela se cumple la media nacional, con un margen de error del 5%. Si el t calculado está a la izquierda o a la derecha del intervalo [-2,093, 2,093], no podremos asegurar lo anterior. En este caso, con t = -2.24, a la izquierda de -2,093, la maestra debe revisar si hay un elemento extraordinario, afectando el proceso de aprendizaje. Hay que hacer correctivos.

Ejemplo 3

Los neumólogos han establecido que un empleado, masculino o femenino, entre 25 y 55 años, que tiene vida sedentaria, tiene una capacidad máxima promedio de respiración de 1150000 cm3 por minuto.

El gerente de un banco hace una muestra pequeña, de 25 empleados (al azar hombres y mujeres, entre 25y 55 años) y encuentra que esa pequeña muestra tiene en promedio, una capacidad respiratoria máxima de 110000 cm3 p m, con una desviación estandar de 13000 cm3 p m.

Con esos resultados de la pequeña muestra, quiere saber si sus empleados están dentro de la media universal de capacidad respiratoria, con un margen de error del 5% (2,5% por debajo y 2,5% por debajo)

Media universal μ= 115000 cm3 p m, N=25, K (grados de libertad) = 24, media de la pequeña muestra x= 110000 cm3 p m, desviación estandar de la pequeña muestra s=13000 m3 p m.

Queremos saber si 110000 m3 p m es un buen indicador que los empleados del banco tienen una capacidad respiratoria adecuada, con un margen de error de 2,5% por debajo y 2,5% por encima.

Calculamos t                           t= (110000-115000) / (13000/√24) = -1,88

Entramos a la tabla de dos colas con K = 24 y %/cola = 0,025 y encontramos el valor 2,064

Como t= -1.88 está dentro del intervalo cerrado [-2,064, 2,064] y podemos concluir que el personal adulto de empleados del banco tiene una capacidad respiratoria adecuada, dentro del promedio mundial, con un margen de error de ±2,5%

Distribución Stanine (estándar nine)

En general, se aplica principalmente, para analizar los resultados de exámenes, una variable que se distribuye normalmente. Sirve para analizar si el resultado del examen es aceptable, si el examen estuvo adecuado y además, permite hacer una radiografía del rendimiento y esfuerzo de los estudiantes que presentaron ese examen o de las notas definitivas al final del año.

Las calificaciones o resultados, de acuerdo con las costumbres de diferentes institutos y a veces, de las mismas naciones, normalmente se acomodan entre pésimo y excelente, en resultados numéricos, en intervalos así, donde la calificación tiene decimales.

[0, 5]

[0, 10]

[0, 100]

[0, 1000]

La premisa de que, si el diseño del examen es adecuado, entonces las notas resultantes se distribuyen normalmente, es de aceptación casi universal.

La distribución Stanine (Estándar nine) es una forma de acomodar las calificaciones en números enteros de 1 a 9, para lo cual debemos convertir las calificaciones con decimales, que tenemos, a valores entre el 1 y el 9.

Las calificaciones Stanine tienen las siguientes características:

Hecha la distribución normal de las calificaciones x, conocemos su media μ y su desviación estándar s. Tenemos un listado de calificaciones, en cualquiera de los intervalos mencionados, cada una con sus respectivos decimales.

Tomamos el número N de exámenes o resultados y encontramos los siguientes porcentajes de ese N.

 

% de N

% entre

N número de calificaciones en cada intervalo

Se asigna Stanine (sin decimales) al intervalo encontrado

Valor de z, sobre el cual se asigna el Stanine

Hasta que z llega la influencia del Stanine

4

(0, 4)

 

1

-2,0

< =-1,75

7

[4, 11)

 

2

-1,5

[-1.75, -1.25)

12

[11, 23)

 

3

-1,0

[-1,25, -0,75)

17

[23, 40)

 

4

-0,5

[-0,75, -0,25)

20

[40, 60)

 

5

0

[-0,25, 0,25)

17

[60, 77)

 

6

0,5

[0,25, 0,75)

12

[77, 89)

 

7

1,0

[0,75, 1,25)

7

[89, 96)

 

8

1,5

(1,25, 1,75)

4

[96, 100)

 

9

2,0

>=1,75

Tabla 1

Para facilitar el trabajo anterior, siempre debemos copiar la lista en Excel y luego la ordenamos de menor a mayor. A las que cayeron en el 4% inferior, les asignamos la nota 1.

A las que cayeron entre el 4 y el 11%, se les asigna el Stanine 2 y así sucesivamente.

Si el examen fue adecuado, la tabla anterior nos permite hacer un análisis para presentar a los mismos estudiantes, a sus padres y a las directivas del colegio o universidad, si así lo requirieran.

Opiniones sobre el Stanine

 

Calificación Stanine

Opinión y análisis

1

Pésimo desempeño, requiere conversación con alumno y padres

2

Un desempeño malo, requiere conversación con alumno y padres

3

Desempeño malo, podría mejorar con un poco más de esfuerzo

4

Desempeño inferior, podría mejorar con un poco más de esfuerzo

5

Desempeño intermedio, algunos pasaron y otros reprobaron. Estos últimos con un poco mas de estudio y atención en clase podrían haber ganado

6

Desempeño aceptable, pasó el examen, pero puede mejorar

7

Desempeño aceptable, pasó el examen, pero puede mejorar

8

Desempeño bueno, con un poco más de estudio, pudiera ser excelente

9

Excelente, felicitaciones.

Tabla 2

Ejemplo 4

score= x

1

49

2

48

3

43

4

27

5

38

6

37

7

35

8

21

9

31

10

31

11

29

12

39

13

27

14

26

15

23

16

32

17

20

18

19

19

43

20

27

21

46

22

44

23

34

24

21

25

37

26

35

27

29

28

39

29

30

30

30

31

23

32

31

33

25

34

24

35

41

36

27

37

16

38

20

39

33

40

20

Tabla 3

Son calificaciones o resultados en el intervalo [0, 50] en forma desorganizada.

Muestra N = 40

4% de 40   = 1,6 = 2

7% de 40 = 2,8 = 3

12% de 40 = 4,8 = 5

17% de 40 = 6,8 =7

20% de 40 = 8

17% de 40 = 7

12% de 40 = 5

7% de 40 = 3

4% = 2

Por las aproximaciones por exceso nos da N = 42y son sólo 40. Podíamos según el caso, a criterio, colocar sólo 1 para los 4% de las colas.

La lista organizada, con su calificación Stanine, de acuerdo con los datos anteriores.

 

 

score= x

Stanine

1

16

1

2

19

2

3

20

2

4

20

2

5

20

3

6

21

3

7

21

3

8

23

3

9

23

3

10

24

4

11

25

4

12

26

4

13

27

4

14

27

4

15

27

4

16

27

4

17

29

5

18

29

5

19

30

5

20

30

5

21

31

5

22

31

5

23

31

5

24

32

5

25

33

6

26

34

6

27

35

6

28

35

6

29

37

6

30

37

6

31

38

6

32

39

7

33

39

7

34

41

7

35

43

7

36

43

7

37

44

8

38

46

8

39

48

8

40

49

9

 

Tabla 4 Lista organizada de menor a mayor y asignación del Stanine.

El profesor está listo, sin necesidad de utilizar fórmulas matemáticas, ni estadísticas, para presentar un informe a los alumnos, padres y directivas y hasta para decidir si repite el examen o no.

Pero la distribución Stanine, también da para problemas matemáticos. Supongamos:

Los resultados de un examen estandarizado, arrojan una media de 500 y una desviación estándar de 100.

Cuáles son los resultados de la muestra estandarizada, en la escala Stanine.

Recordemos que, la distribución estándar z, tiene tablas, que evitan la integración.

z = (x – μ) /s; (2)    μ= media de la muestra;   (3);   s = √ ((x – μ)2/N)     (4)     desviación estándar de x

f(z) = (1/√(2p)) e^(-x2/2)                                                             (5)


 


Figura 3 Stanine vs distribución normal z

 

Stanine

z

intervalo de z

x =100z+500

% que sacó nota x en cada intervalo

 

1

-2

x<-1,75

Menor de325

4

sacó menos de 325

2

-1,5

[-1,75,-1,25)

375

7

 sacó entre 325 y 375

3

-1

[-1,25,-0,75)

425

12

 sacó entre 375 y 425

4

-0,5

[-0,75,-0,25)

475

17

 sacó entre 425 y 475

5

0

[-0,25,-0,25)

525

20

sacó entre 475 y 525

6

0,5

[0,25, 0,75)

575

17

sacó entre 525 y 575

7

1

[0,75, 1,25)

625

12

 sacó entre 575 y 625

8

1,5

[1,25, 1,75)

675

7

sacó entre 625 y 675

9

2

x >= 1,75

Mayor a 675 

4

Saco más de 675

Tabla 5

Si el resultado de un examen, cuyo score es entre 0 y 5 (con decimales), cuya media fue 3,4 y la desviación estándar fue igual a 0,5 se pregunta:

Si el alumno Juan sacó una nota Stanine de 7, ¿Qué nota real sacó en su examen?

Para un Stanine 7, la z debe estar en el intervalo [0,75, 1,25)

                                                                                          

x=0,5 z+3,5                            Por la fórmula (2)

z = 0,75              x= 3,875

z = 1,25              x= 4,125           Juan sacó una nota en entre 3,9 y 4.1

Si el alumno Carlos sacó una nota Stanine de 4, ¿Qué nota real sacó en su examen?

Para Stanine 4, la z debe estar en el intervalo [-0,75, -0,25)

z= -0,75              x=3,125

z= -0,25              x =3,375           Carlos sacó una nota en entre 3,13 y 3,40

 

 

Juan Fernando Sanín E

juanfernando.sanin@gmail.com