









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos básicos de estadística, incluyendo la teoría de conjuntos y estadística descriptiva. Se explican los conceptos de unión, intersección, diferencia y complemento de conjuntos, así como la definición y objetivos de la estadística. Además, se abordan las variables cuantitativas y cualitativas, la población y el muestreo, y se introducen las distribuciones de frecuencias acumuladas y relativas. Se calculan ejemplos de medidas de tendencia central como media, moda y cuartiles.
Tipo: Apuntes
1 / 17
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Página
1 Introducción
1.1 Conceptos básicos y operaciones elementales en la teoría de conjuntos
Un conjunto es la agrupación, clase, o colección de objetos o en su defecto de elementos que pertenecen y responden a la misma categoría o grupo de cosas, por eso se los puede agrupar en el mismo conjunto.
A= {0, 1, 2, 3, 4, 5}, B = {0, 2, 4} y C = {5, 6, 8}
A U C = {0, 1, 2, 3, 4, 6, 8}
B U C = {0, 2, 4, 5, 6, 8}
A= {0, 1, 2, 3, 4, 5}, B = {3, 5, 7} y C = {2, 4}
A∩ C = {2, 4}
B ∩ C = {Ø}
A = {a, b, c, d, e}, B = {a, e} y C = {d, f, g}
A - C = {a, b, c, e}
B - C = {a, e}
Complemento de conjuntos se denota: c
U = {m, a, r, t, e} y A = {t, e}
A' = {m, a, r}
Diagrama de Venn
Página
1.2 Estadística (definición y objetivos)
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Un estudio estadístico consta de las siguientes fases:
Recogida de datos. Organización y representación de datos. Análisis de datos. Obtención de conclusiones.
El objetivo básico de la estadística es hacer inferencia acerca de una población con base a la información contenida en una muestra. Es la obtención de conclusiones basadas en los datos experimentales.
Tipos de estadística
La Estadística descriptiva registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas de centralización y de dispersión), que describen el conjunto estudiado. La Estadística inferencial estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.
1.3 Variables (definición, identificación y clasificación: aleatoria, continua, discreta)
Una variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.
Variables cualitativa .- son caracteristicas o cualidades que no pueden ser medidas con numeros.
Variable cualitativa nominal .- son no numéricos y no admiten un criterio de orden. Ejemplo: estado civil ; soltero , casado, divorciado, viudo. Variable cualitativa ordinal .- no numéricos pero existe un criterio de orden: medallas de una competencia deportiva: oro, plata, bronce.
Variables cuantitativas.- características o cualidades que se expresa con números
Variable discreta .- toma valores aislados, no admite valores intermedios, es decir, solo números enteros. Ejemplo: # de hermano, 1, 2, 3 Variable continua .- pueden formar valores comprendidos entre 2 números. Ejemplo: estatura, 1.68, 1.69, 1.
Página
2. Probabilidad 2.1 Conceptos básicos de probabilidad (experimento, espacio muestral, punto muestral y evento)
Experimento .- es cualquier fenómeno indeterminístico. Espacio muestra : es el conjunto de todos los resultados (maneras de ocurrir) posibles de un experimento. Se denota con la letra S Punto Muestral .- cada uno de los resultados posibles de un experimento aleatorio. Evento : Es cualquier subconjunto obtenido del espacio muestra Sucesos mutuamente excluyentes : sucesos o eventos que no pueden ocurrir simultáneamente. Sucesos complementarios : dos sucesos o eventos mutuamente excluyentes cuya unión es el espacio muestral Sucesos independientes : sucesos o eventos que no tienen relación entre sí; la ocurrencia de uno no afecta la ocurrencia del otro Sucesos dependientes : sucesos o eventos que sí tienen relación entre sí; la ocurrencia de uno sí afecta la ocurrencia del otro.
Ejemplo: Se lanza un dado.
Encontrar el espacio muestral. o Solución : S = {1, 2, 3, 4, 5, 6} Enumerar los puntos muéstrales. o Solución : Hay seis puntos muéstrales: {1}, {2}, {3}, {4}, {5} y {6}. Poner dos ejemplos de eventos. o Solución : evento A = {resultado es impar} = {1, 3, 5}; evento B = {resultado es mayor que 2} = {3, 4, 5, 6} ¿Son mutuamente excluyentes los siguientes eventos? A = {resultado menor o igual a 4}, B = {resultado es primo}. o Solución : A = {1, 2, 3, 4} y B = {2, 3, 5} sí tienen dos puntos en común, 2 y 3. Por lo tanto, no son mutuamente excluyentes. ¿Cuál suceso es complementario a M = {2, 6}? o Solución : {1, 3, 4, 5}. ¿Son dependientes o independientes los siguientes eventos? A = {obtener un 2 en el primer lanzamiento}, B = {obtener un 4 en el segundo lanzamiento}. o Solución : Son independientes, porque obtener o no un 2 en el primer lanzamiento no afecta el resultado del segundo lanzamiento.
Página
2.2 Enfoques de la probabilidad (subjetivo, frecuencia relativa, clásico)
Subjetivo
Se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia relativa de presentación de eventos pasados o puede tratarse simplemente de una creencia meditada.
Frecuencia relativa (o aposteriori) En el método de frecuencia relativa se utilizan datos pasados obtenidos en observaciones empíricas. Se tiene en cuenta la frecuencia con que ha ocurrido un suceso en el pasado y se estima la posibilidad de que vuelva a ocurrir a partir de estos datos históricos
Número de resultados esperados ocurridos en el pasado Número total de experimentos adelantados
Supongamos que durante el último natural hubo 50 nacimientos en un Hospital de la Localidad. 32 de los recién nacidos fueron niñas. El enfoque de frecuencia relativa revela que la probabilidad de que el recién nacido siguiente (o cualquier recién nacido tomado al azar) sea una niña viene
determinada por: 3250 = .64= 64%
Clásico (o a priori) Los resultados de un experimento son igualmente viables, es decir, tienen teóricamente las mismas posibilidades de ocurrir. En este caso la probabilidad de ocurrencia de un evento será:
Número de resultados en los que se presenta el evento Número total de resultados posibles
Por ejemplo , la probabilidad de que en una baraja francesa de 52 cartas salga el cinco de trébol es
de 521.
2.3 Fenómenos deterministas y fenómenos aleatorios
Fenómenos deterministas
Son los hechos o sucesos que ocurren con seguridad. En ellos se conoce de antemano, con certeza, el resultado. Ejemplo:
Después de las 6:00 son las 7:00. Después del día sigue la noche. Ir a la escuela todos los días. Alimentarse al mediodía.
Página
3.2 Distribuciones de frecuencias: acumuladas y relativas acumuladas (clases: intervalos, limites, limites reales, marca)
Las distribuciones de frecuencia son una forma de organizar un conjunto de datos es clasificarlos en categorías o clases y luego contar cuántas observaciones que dan dentro de cada categoría.
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento Ni=
𝐹𝑖 𝑁
Ejemplo
Durante el mes de julio (31 días) , en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27 , 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34 , 33, 33, 29, 29.
2 7 1 1 0. 032 0. 032 2 8 2 3 0. 065 0. 097 2 9 6 9 0. 194 0. 290 3 0 7 1 6 0. 226 0. 516 3 1 8 2 4 0. 258 0. 774 3 2 3 2 7 0. 097 0. 871 3 3 3 3 0 0. 097 0. 968 3 4 1 3 1 0. 032 1 N= 3 1 1
Página
Límite de clase .-Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Ejemplo Construcción de una tabla de datos agrupados 3 , 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48 , 15, 32, 13.
48 - 3 = 45, incrementamos el número hasta 50. 5010 = 5 (10 Intervalos). Es conveniente que el número de intervalos oscile entre 6 y 15.
[0, 5) 2. 5 1 1 0. 025 0. 025 [5, 10) 7. 5 1 2 0. 025 0. 050 [10, 15) 1 2 .5 3 5 0. 075 0. 125 [15, 20) 1 7 .5 3 8 0. 075 0. 200 [20, 25) 2 2 .5 3 1 1 0. 075 0. 275 [25, 30) 2 7 .5 6 1 7 0. 150 0. 425 [30, 35) 3 2 .5 7 2 4 0. 175 0. 600 [35, 40) 3 7 .5 1 0 3 4 0. 250 0. 850 [40, 45) 4 2 .5 4 3 8 0. 100 0. 950 [45, 50) 4 7 .5 2 4 0 0. 050 1 4 0 1
Límites de clases
Marca de clase
Amplitud
Página
Calculo del segundo cuartil 65 ∗ 2 4 = 32.
Calculo del tercer cuartil 65 ∗ 3 4 = 48.
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
Cálculo del primer decil 65 ∗ 1 10 = 6.
Calculo del tercer decil 65 ∗ 3 10 = 19.
Calculo del noveno decil 65 ∗ 9 10
clases fi Fi [50, 60) 8 8 [60, 70) 1 0 1 8 [70, 80) 1 6 3 4 [80, 90) 1 4 4 8 [90, 100) 1 0 5 8 [100, 110) 5 6 3 [110, 120) 2 6 5 6 5
donde se encuentra la mediana.
absolutas.
anterior a la clase mediana.
Página
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
Calculo del percentil 35 65 ∗ 35 100 = 22.
Calculo del percentil 60 65 ∗ 60 100 = 39
3.4 Representaciones graficas (histogramas, polígonos, ojivas, barras, circular y de caja)
Un histograma es una representación gráfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores representados.
clases fi Fi [50, 60) 8 8 [60, 70) 1 0 1 8 [70, 80) 1 6 3 4 [80, 90) 1 4 4 8 [90, 100) 1 0 5 8 [100, 110) 5 6 3 [110, 120) 2 6 5 6 5
donde se encuentra la mediana.
absolutas.
anterior a la clase mediana.
Página
0
20
40
60
80
[50,
[60,
[70,
[80,
[90,
[100,
[110,
Fi
La ojiva son en realidad polígonos que utilizan las frecuencias acumuladas con la salvedad de que las ordenadas no se levanten sobre el punto medio de la clase, sino sobre el límite inferior o superior según se haya acumulado. Existen 2 gráficas ojivas: más que y menos que (ascendente o descendente).
La grafica circular o pastel se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas
Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente
Alumnos Ángulo Balo nces to 1 2 144° Natación 3 3 6 ° Fútbo l 9 108° S in de po rte 6 7 2 ° To tal 3 0 360°
[5 0, 60) 55 8 8 [6 0, 70) 65 10 18 [7 0, 80) 75 16 34 [8 0, 90) 85 14 48 [9 0, 100) 95 10 58 [1 00, 110) 105 5 63 [1 10, 120) 115 2 65 65
Página
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.
Grupo s anguíneo
fi
A 6 B 4 AB 1 0 9 2 0
Un diagrama de caja o diagrama de caja y bigotes o box plot , son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente. Ejemplo
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q1 = (24 + 25) / 2 = 24, Q2, el Segundo Cuartil es la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33, Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta Q2= (39 + 39) / 2 = 39
Página
(Extra) 4 medidas de dispersión
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Son: rango o recorrido, desviación media, desviación media para datos agrupados, varianza, desviación típica.
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
La desviación media es la media aritmética de los valores absolutos de las desviaciones
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. a varianza se representa por signo .La varianza será siempre un valor positivo o cero; Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
Página
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
La desviación típica es la raíz cuadrada de la varianza. La desviación típica se representa por σ. La desviación típica será siempre un valor positivo o cero; Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
http://www.ditutor.com/index.html