










Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Rectificación del libro uned de estadística
Tipo: Apuntes
1 / 18
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
El punto 1.4.6. es una primera introducción a la decisión estadística que se desarrolla en el tema 12 (pdf). En sentido estricto y técnico, sólo la H 0 es la que se rechaza o no se rechaza. La decisión estadística se realiza comparando la probabilidad asociada al estadístico de contraste con el valor fijado del nivel de significación. La comparación de los valores de los estadísticos de contraste (empírico y crítica) es una derivación de lo anterior y, en consecuencia, no es necesario conocer el valor crítico, sino ambas probabilidades.
Tanto en la impresión original (2009) como en la reimpresión de 2012, se ha detectado la siguiente errata en la Tabla 2.1. Escalas de medida (página 38) y al final de la página 40 …
…ahí aparece la ‘temperatura’ como una variable con nivel de medida ‘de razón’; lo cual es incorrecto…
…lo correcto es decir que la ‘temperatura’ es una variable con nivel de medida ‘de intervalo’, dado que sus escalas de medida están construidas internamente con intervalos iguales pero siendo el punto cero de cada una de ellas un punto arbitrario (de hecho, el cero en la escala Kelvin es distinto al cero en la escala Celsius o en la escala Fahrenheit).
Tanto en la impresión original (2009) como en la reimpresión de 2012, en el capítulo 2, página 29, apartado 2.5.1., en el 3º párrafo, donde dice...
"Aunque algunos autores suelen recurrir al término 'atributo' cuando se identifica con lo cualitativo y 'variable' cuando se trata de lo cuantitativo, en la gran mayoría de los manuales se tiende a englobar todo bajo el epígrafe de variables, en el primer caso se les denomina categóricas, atributivas o cualitativas, bien sean discretas o continuas "
...es más correcto y completo decir:
"Aunque algunos autores suelen recurrir al término 'atributo' cuando se identifica con lo cualitativo y 'variable' cuando se trata de lo cuantitativo, en la gran mayoría de los manuales se tiende a englobar todo bajo el epígrafe de variables. En el primer caso se les denomina categóricas, atributivas o cualitativas; en el segundo caso se les denomina cuantitativas, bien sean discretas o continuas "
2
p = 0,
0,
0,
0,
60 70 80 100 110 120
Tanto en la impresión original (2009) como en la reimpresión de 2012 se ha detectado en la página 134 , en el recuadro inferior, donde dice: “…Lo que se interpreta como que el tiempo…”
Debería decir: “…Lo que se interpreta como que ambas variables comparten un 49% de su varianza”.
(No se puede decir, en el contexto de la correlación, varianza de una variable explicada por la otra, sino que hay que hablar de varianza compartida. En una correlación nunca podemos hablar de relaciones causa-efecto, sino de variación concomitante).
En la página 142 , penúltimo párrafo, donde dice: “…una relación entre las variables nivel socioeconómico y elección de estudios de tipo medio”
Debería decir: “…una relación entre las variables nivel socioeconómico y elección de estudios de tipo bajo”
En la página 145 , para una mejor interpretación del coeficiente rbp , se puede eliminar el valor absoluto del numerador. Así quedaría rbp = -0,20 y la interpretación sería: correlación de intensidad muy baja negativa: al valor bajo en la dicotómica q=0=hombres , se asocia (con muy poca intensidad) un nivel más alto en la variable cuantitativa.
En la página 149 , en el cálculo de , y falta incluir el símbolo Σ (sumatorio) en el
numerador. Así, donde pone debería poner. Análogamente para
y
En el ejemplo 8.1 (páginas 153 y 154) se obtiene erróneamente un rxy = 0,96.
El rxy correcto es 0,923 cuyo cálculo se detalla a continuación:
X Y X^2 Y^2 XY* 12 13 144 169 156 18 17 324 289 306 15 15 225 225 225 11 10 121 100 110 9 10 81 100 90 17 16 289 256 272 13 15 169 225 195 8 9 64 81 72 18 17 324 289 306 12 12 144 144 144 7 6 49 36 42 11 10 121 100 110 15 16 225 256 240 20 14 400 196 280 14 14 196 196 196 8 8 64 64 64 10 11 100 121 110 17 16 289 256 272 14 13 196 169 182 11 12 121 144 132 7 8 49 64 56 17 15 289 225 255 12 12 144 144 144 12 13 144 169 156 18 19 324 361 342 15 16 225 256 240 13 13 169 169 169 8 7 64 49 56 11 13 121 169 143 18 17 324 289 306 10 10 100 100 100 17 16 289 256 272 8 9 64 81 72 12 13 144 169 156 14 15 196 225 210 16 17 256 289 272 8 9 64 81 72 11 10 121 100 110 18 19 324 361 342 12 12 144 144 144 Σ = 517 Σ = 5 17 Σ = 7201 Σ = 7117 Σ = 7121
En la página 167, punto 8.3.6.3. El resultado del cálculo de “E”: donde dice 52,50, debe decir 0,
Pág. 196
2
2
Este estadístico se distribuye según la distribución χ^2 para un valor igual al de filas menos 1 cuando y son conocidas, y con -3 en caso de ser estimadas. Vale la pena recordar aquí que χ^2 es un modelo estadístico.
Pág. 197. Cuadro 9.
I fo Li zi p(zi) pi fe (fo - fe) (fo- fe)^2 (fo- fe)^2 / fe 0,0055 15,48 15,48 239,54 15, 10 74 10,5 2,54 0.9945 0.0157 44,18 29,82 889,23 20, 9 175 9,5 2,026 0.9788 0.0443 124,66 50,34 2534,12 20, 8 219 8,5 1,51 0.9345 0.0956 269,02 50,02 2502,00 9, 7 340 7,5 0,99 0.8389 0,1563 439,83 99,83 9966,03 22, 6 528 6,5 0,475 0.6808 0.1968 553,79 25,79 665,12 1, 5 750 5,5 - 0,04 0.4840 0,1963 552,39 197,61 39049,71 70, 4 370 4,5 - 0,56 0.2877 0,1454 409,16 39,16 15 33,51 3, 3 210 3,5 - 1,07 0.1423 0,0864 243,13 33,13 1097,6 4, 2 96 2,5 - 1,59 0.0559 0.0385 108,34 12,34 152,27 1, 1 43 1,5 - 2,11 0.0174 0,0132 37,14 5,86 34,34 0, 0 9 0,5 - 2,625 0.0043 0,0043 12,10 3,10 9,61 0, N = 2814 2814 171,
Página 197, último párrafo:
“El caso de la primera fila es diferente…”
Pág. 198
χ^2 = [(fo - fe)^2 / fe] = 171,
Si nuestro valor empírico (171,17) fuera igual o mayor que el de las tablas para los g.l. correspondientes, rechazaríamos H 0 y afirmaríamos que nuestros datos empíricos no son compatibles con el modelo de la curva normal de probabilidades con una probabilidad de tomar una decisión errónea ≤ α. Pues bien, las tablas de ji cuadrado, para un nivel de confianza del 99 % (α = 0,01), y (11- 1) g.l. nos dan un valor de 23,209. Para 11 – 3 g.l., el valor es de 20,090.
La figura 10.3 recoge la equivalencia de una serie de puntuaciones normalizadas. Vale la pena señalar que las normas o baremos utilizados en PISA toman como media = 500 y s =
Pág. 216
Estaninas y pentas
En los EE.UU se utiliza frecuentemente una escala de diez rangos, creados a partir de 9 puntos – estanina = contracción de standard nine- cuya media es de 5 y su desviación típica de 2. En nuestro país se utiliza con cierta frecuencia una escala de cinco rangos, denominada pentas, que permite dividir la serie en cinco grandes bloques, cuyos límites en puntuaciones z se aprecian en la Tabla 10.3. La escala de pentas tiene como media 3 y como desviación típica 1.
Pág. 218
Para el cálculo del tamaño de la muestra contamos con dos fórmulas diferentes, según que el tamaño de la población de origen sea infinita (10.3) o finita (10.4):
(…)
Donde N es el tamaño de la población, n el de la muestra; z es el valor que corresponde al nivel de confianza elegido (número de desviaciones típicas precisas para que la curva normal deje en su interior el 95, 99, 99,9 % etc.) y p y q el correspondiente a la proporción de la característica en la población. E representa el error de estimación admitido por el investigador. Tanto z como E están elevados al cuadrado.
Pág. 220
El muestreo sistemático es una modalidad del anterior que nos permite fijar el primero de los sujetos de la muestra y, a partir de él, seleccionar sistemáticamente el resto sumándole un valor constante, en concreto el denominado coeficiente de elevación, esto es, el cociente entre el tamaño de la población y el de la muestra. Por ejemplo, en nuestro primer caso, tal coeficiente sería: 108000 / 1849 = 58,41. Pues bien: seleccionado al azar el primer caso, seguiríamos eligiendo en las tablas de 58 en 58, hasta llegar a los 1849 que integran la muestra.
Pág. 221
Así, en el caso de las dos muestras anteriores, para poblaciones de 108.000 y 35.600 casos respectivamente, los errores muestrales, para el caso de que p = q = 50 en el primer caso, y de que p = 35 y q = 65 en el segundo, tendríamos:
(…)
Así, asumiendo que en una muestra de 1.849 adultos, de una población de 108.000 que no obtuvieron el graduado en Educación Secundaria Obligatoria, distribuida normalmente, el 46 % fueron mujeres, podemos crear un intervalo de confianza, para una probabilidad del 99 %, sumando y restando a ese 46 % el valor del error muestral, esto es:
46 3 = 43 y 49.
Pág. 222
Ahora sí podemos afirmar que, en toda la población, con una probabilidad del 0.99 (nivel de confianza del 99 %) el número de sujetos que no obtuvieron el graduado es superior entre los varones que entre las mujeres.
Página 219:
La primera fórmula dice: N = (2,58… debe decir n = (2,58…
ocasiones, en el 99% de esas muestras, la media en inteligencia de los adolescentes de la Comunidad de Madrid se encontraría entre los valores 104,18 y 105,82.”
Pág. 230, título 11.4.1.
Donde dice,
11.4.1. Estimación del parámetro media aritmética para muestras pequeñas
Debe decir:
11.4.1. Estimación del parámetro media aritmética (σ desconocido y para muestras pequeñas).
Pág. 232, segundo párrafo.
Donde dice,
“En definitiva, I.C. = 105 5,71, con lo que obtenemos ambos límites confidenciales, inferior y superior: L.C.I = 99,29 y L.C.S = 110,71. En conclusión, podemos decir con un nivel de confianza del 99 % que la media en inteligencia de los adolescentes de la Comunidad de Madrid se encuentra entre los valores 99,29 y 110,71. Como vemos, hemos perdido un gran nivel de precisión al disminuir el tamaño de la muestra, de modo que ahora la horquilla del intervalo de confianza es superior a 11 puntos.”
Debe decir:
“En definitiva, I.C. = 105 5,71, con lo que obtenemos ambos límites confidenciales, inferior y superior: L.C.I = 99,29 y L.C.S = 110,71. En conclusión, podríamos afirmar que el intervalo de confianza del 99% alrededor de la medida de la muestra cae entre los valores de 99,29 y 110,71. También podemos decir que si utilizásemos este mismo procedimiento de estimación en cientos o miles de muestras, con un nivel de confianza del 99 %, en el 99% de esas muestras, la media en inteligencia de los adolescentes de la Comunidad de Madrid se encontraría entre los límites confidenciales establecidos (y la nuestra podría ser, o no, una de ellas). Sería un error decir que tenemos una probabilidad de 0.99 de que el valor del parámetro se encontrará entre esos límites confidenciales. Como vemos en nuestro ejemplo, hemos perdido un gran nivel de precisión al disminuir el tamaño de la muestra, de modo que ahora la horquilla del intervalo de confianza es superior a 11 puntos.”
Pág. 232, última fórmula.
En el numerador de la fórmula del error típico de la proporción falta la raíz cuadrada.
Donde dice N- 1
p·q
Debe decir N- 1
p·q
Pág. 232, último párrafo.
Donde dice:
“El intervalo de confianza se establecerá igual que en la media aritmética, pero partiendo de una proporción. En el típico caso del muestreo electoral, donde podemos obtener un estadístico de, por ejemplo, p= 0,36, es decir, la media es 0,36, o también, que el 36% de la muestra va a votar al partido X. Luego, calculamos los límites confidenciales para decir que la horquilla de votantes a ese partido se encuentra entre el 34% y el 38%.”
Debe decir
“El intervalo de confianza se establecerá igual que en la media aritmética, pero partiendo de una proporción. Este es el típico caso del muestreo electoral. Supongamos una intención de voto del 36% para el partido X ( p = 0,36) en una muestra de 300 sujetos, es decir, la media es 0,36. El numerador sería la raíz cuadrada de 0,640,36 (esto es, 0,48). Por tanto, el error típico sería 0,028. Tomando un α = 0,01 α/2 = 0,005 z(α/2) = 2,57; calculamos los límites confidenciales para decir que la horquilla de votantes a ese partido se encuentra en el intervalo IC = 0,36 ± EM = 0,36 ± 2,57 0,028 = 0,36 ± 0,07; es decir entre el 29% y el 43% de intención de voto.
Pág. 233, en el primer párrafo ( Tanto en la impresión original (2009) como en la reimpresión de 2012).
Donde dice:
“Por tanto, el error típico sería de 0.028”.
Debe decir:
“Por tanto, el error típico sería de 0.028 multiplicado por el correspondiente valor de t o z”.
Pág. 235, en el segundo párrafo.
Donde dice:
“Aplicando la fórmula, obtenemos que el error típico será de (1-0,35^2 )/19 = 0,29 y la z (^) (/2) sabemos que es 1,96, luego el error muestral es igual a 0,56.
En consecuencia, la correlación en la población estará entre los límites -0,21 y 0,91. Efectivamente, como pensará el estudiante, es un enorme intervalo de confianza, desde una correlación negativa baja hasta una correlación positiva y muy alta. ¿Por qué sucede…”
Debe decir:
“Aplicando la fórmula, obtenemos que el error típico será de (1-0,35^2 )/19 = 0,20 y la z (^) (/2) sabemos que es 1,96, luego el error muestral es igual a 0,39.