Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Estadística: Conceptos básicos, teoría de conjuntos y estadística descriptiva, Apuntes de Historia

Conceptos básicos de estadística, incluyendo la teoría de conjuntos y estadística descriptiva. Se explican los conceptos de unión, intersección, diferencia y complemento de conjuntos, así como la definición y objetivos de la estadística. Además, se abordan las variables cuantitativas y cualitativas, la población y el muestreo, y se introducen las distribuciones de frecuencias acumuladas y relativas. Se calculan ejemplos de medidas de tendencia central como media, moda y cuartiles.

Tipo: Apuntes

2020/2021

Subido el 15/06/2021

asesorias-educativas-integrales-pro
asesorias-educativas-integrales-pro 🇲🇽

5 documentos

1 / 17

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística
E
Página1
1 Introducción
1.1 Conceptos básicos y operaciones elementales en la teoría de conjuntos
Un conjunto es la agrupación, clase, o colección de objetos o en su defecto de elementos que
pertenecen y responden a la misma categoría o grupo de cosas, por eso se los puede agrupar en el
mismo conjunto.
Unión de conjuntos se denota: U.
A= {0, 1, 2, 3, 4, 5}, B = {0, 2, 4} y C = {5, 6, 8}
A U C = {0, 1, 2, 3, 4, 6, 8}
B U C = {0, 2, 4, 5, 6, 8}
Intersección de conjuntos se denota:
A= {0, 1, 2, 3, 4, 5}, B = {3, 5, 7} y C = {2, 4}
A C = {2, 4}
B C = {Ø}
Diferencia de conjuntos se denota: A - B
A = {a, b, c, d, e}, B = {a, e} y C = {d, f, g}
A - C = {a, b, c, e}
B - C = {a, e}
Complemento de conjuntos se denota: c
U = {m, a, r, t, e} y A = {t, e}
A' = {m, a, r}
Diagrama de Venn
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Estadística: Conceptos básicos, teoría de conjuntos y estadística descriptiva y más Apuntes en PDF de Historia solo en Docsity!

Página

1 Introducción

1.1 Conceptos básicos y operaciones elementales en la teoría de conjuntos

Un conjunto es la agrupación, clase, o colección de objetos o en su defecto de elementos que pertenecen y responden a la misma categoría o grupo de cosas, por eso se los puede agrupar en el mismo conjunto.

 Unión de conjuntos se denota: U.

A= {0, 1, 2, 3, 4, 5}, B = {0, 2, 4} y C = {5, 6, 8}

A U C = {0, 1, 2, 3, 4, 6, 8}

B U C = {0, 2, 4, 5, 6, 8}

 Intersección de conjuntos se denota: ∩

A= {0, 1, 2, 3, 4, 5}, B = {3, 5, 7} y C = {2, 4}

A∩ C = {2, 4}

B ∩ C = {Ø}

 Diferencia de conjuntos se denota: A - B

A = {a, b, c, d, e}, B = {a, e} y C = {d, f, g}

A - C = {a, b, c, e}

B - C = {a, e}

Complemento de conjuntos se denota: c

U = {m, a, r, t, e} y A = {t, e}

A' = {m, a, r}

Diagrama de Venn

Página

1.2 Estadística (definición y objetivos)

La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.

Un estudio estadístico consta de las siguientes fases:

 Recogida de datos.  Organización y representación de datos.  Análisis de datos.  Obtención de conclusiones.

El objetivo básico de la estadística es hacer inferencia acerca de una población con base a la información contenida en una muestra. Es la obtención de conclusiones basadas en los datos experimentales.

Tipos de estadística

 La Estadística descriptiva registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas de centralización y de dispersión), que describen el conjunto estudiado.  La Estadística inferencial estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

1.3 Variables (definición, identificación y clasificación: aleatoria, continua, discreta)

Una variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Variables cualitativa .- son caracteristicas o cualidades que no pueden ser medidas con numeros.

Variable cualitativa nominal .- son no numéricos y no admiten un criterio de orden. Ejemplo: estado civil ; soltero , casado, divorciado, viudo.  Variable cualitativa ordinal .- no numéricos pero existe un criterio de orden: medallas de una competencia deportiva: oro, plata, bronce.

Variables cuantitativas.- características o cualidades que se expresa con números

Variable discreta .- toma valores aislados, no admite valores intermedios, es decir, solo números enteros. Ejemplo: # de hermano, 1, 2, 3  Variable continua .- pueden formar valores comprendidos entre 2 números. Ejemplo: estatura, 1.68, 1.69, 1.

Página

2. Probabilidad 2.1 Conceptos básicos de probabilidad (experimento, espacio muestral, punto muestral y evento)

Experimento .- es cualquier fenómeno indeterminístico.  Espacio muestra : es el conjunto de todos los resultados (maneras de ocurrir) posibles de un experimento. Se denota con la letra SPunto Muestral .- cada uno de los resultados posibles de un experimento aleatorio.  Evento : Es cualquier subconjunto obtenido del espacio muestra  Sucesos mutuamente excluyentes : sucesos o eventos que no pueden ocurrir simultáneamente.  Sucesos complementarios : dos sucesos o eventos mutuamente excluyentes cuya unión es el espacio muestral  Sucesos independientes : sucesos o eventos que no tienen relación entre sí; la ocurrencia de uno no afecta la ocurrencia del otro  Sucesos dependientes : sucesos o eventos que sí tienen relación entre sí; la ocurrencia de uno sí afecta la ocurrencia del otro.

Ejemplo: Se lanza un dado.

 Encontrar el espacio muestral. o Solución : S = {1, 2, 3, 4, 5, 6}  Enumerar los puntos muéstrales. o Solución : Hay seis puntos muéstrales: {1}, {2}, {3}, {4}, {5} y {6}.  Poner dos ejemplos de eventos. o Solución : evento A = {resultado es impar} = {1, 3, 5}; evento B = {resultado es mayor que 2} = {3, 4, 5, 6}  ¿Son mutuamente excluyentes los siguientes eventos? A = {resultado menor o igual a 4}, B = {resultado es primo}. o Solución : A = {1, 2, 3, 4} y B = {2, 3, 5} sí tienen dos puntos en común, 2 y 3. Por lo tanto, no son mutuamente excluyentes.  ¿Cuál suceso es complementario a M = {2, 6}? o Solución : {1, 3, 4, 5}.  ¿Son dependientes o independientes los siguientes eventos? A = {obtener un 2 en el primer lanzamiento}, B = {obtener un 4 en el segundo lanzamiento}. o Solución : Son independientes, porque obtener o no un 2 en el primer lanzamiento no afecta el resultado del segundo lanzamiento.

Página

2.2 Enfoques de la probabilidad (subjetivo, frecuencia relativa, clásico)

Subjetivo

Se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia relativa de presentación de eventos pasados o puede tratarse simplemente de una creencia meditada.

Frecuencia relativa (o aposteriori) En el método de frecuencia relativa se utilizan datos pasados obtenidos en observaciones empíricas. Se tiene en cuenta la frecuencia con que ha ocurrido un suceso en el pasado y se estima la posibilidad de que vuelva a ocurrir a partir de estos datos históricos

Número de resultados esperados ocurridos en el pasado Número total de experimentos adelantados

Supongamos que durante el último natural hubo 50 nacimientos en un Hospital de la Localidad. 32 de los recién nacidos fueron niñas. El enfoque de frecuencia relativa revela que la probabilidad de que el recién nacido siguiente (o cualquier recién nacido tomado al azar) sea una niña viene

determinada por: 3250 = .64= 64%

Clásico (o a priori) Los resultados de un experimento son igualmente viables, es decir, tienen teóricamente las mismas posibilidades de ocurrir. En este caso la probabilidad de ocurrencia de un evento será:

Número de resultados en los que se presenta el evento Número total de resultados posibles

Por ejemplo , la probabilidad de que en una baraja francesa de 52 cartas salga el cinco de trébol es

de 521.

2.3 Fenómenos deterministas y fenómenos aleatorios

Fenómenos deterministas

Son los hechos o sucesos que ocurren con seguridad. En ellos se conoce de antemano, con certeza, el resultado. Ejemplo:

 Después de las 6:00 son las 7:00.  Después del día sigue la noche.  Ir a la escuela todos los días.  Alimentarse al mediodía.

Página

3.2 Distribuciones de frecuencias: acumuladas y relativas acumuladas (clases: intervalos, limites, limites reales, marca)

Las distribuciones de frecuencia son una forma de organizar un conjunto de datos es clasificarlos en categorías o clases y luego contar cuántas observaciones que dan dentro de cada categoría.

 La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa

por N.

 La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

 La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor

y el número total de datos. Se puede expresar en tantos por ciento y se representa por ni.

 La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento Ni=

𝐹𝑖 𝑁

Ejemplo

Durante el mes de julio (31 días) , en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27 , 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34 , 33, 33, 29, 29.

xi fi Fi ni Ni

2 7 1 1 0. 032 0. 032 2 8 2 3 0. 065 0. 097 2 9 6 9 0. 194 0. 290 3 0 7 1 6 0. 226 0. 516 3 1 8 2 4 0. 258 0. 774 3 2 3 2 7 0. 097 0. 871 3 3 3 3 0 0. 097 0. 968 3 4 1 3 1 0. 032 1 N= 3 1 1

Página

Límite de clase .-Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

 La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

 La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Ejemplo Construcción de una tabla de datos agrupados 3 , 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48 , 15, 32, 13.

48 - 3 = 45, incrementamos el número hasta 50. 5010 = 5 (10 Intervalos). Es conveniente que el número de intervalos oscile entre 6 y 15.

clases ci fi Fi ni Ni

[0, 5) 2. 5 1 1 0. 025 0. 025 [5, 10) 7. 5 1 2 0. 025 0. 050 [10, 15) 1 2 .5 3 5 0. 075 0. 125 [15, 20) 1 7 .5 3 8 0. 075 0. 200 [20, 25) 2 2 .5 3 1 1 0. 075 0. 275 [25, 30) 2 7 .5 6 1 7 0. 150 0. 425 [30, 35) 3 2 .5 7 2 4 0. 175 0. 600 [35, 40) 3 7 .5 1 0 3 4 0. 250 0. 850 [40, 45) 4 2 .5 4 3 8 0. 100 0. 950 [45, 50) 4 7 .5 2 4 0 0. 050 1 4 0 1

Límites de clases

Marca de clase

Amplitud

Página

Calculo del segundo cuartil 65 ∗ 2 4 = 32.

Calculo del tercer cuartil 65 ∗ 3 4 = 48.

 Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

Cálculo del primer decil 65 ∗ 1 10 = 6.

Calculo del tercer decil 65 ∗ 3 10 = 19.

Calculo del noveno decil 65 ∗ 9 10

clases fi Fi [50, 60) 8 8 [60, 70) 1 0 1 8 [70, 80) 1 6 3 4 [80, 90) 1 4 4 8 [90, 100) 1 0 5 8 [100, 110) 5 6 3 [110, 120) 2 6 5 6 5

16 ∗^10 =^ 𝟕𝟗.^ 𝟎𝟔

10 ∗^10 =^ 𝟗𝟎.^ 𝟕𝟓

 Li es el límite inferior de la clase

donde se encuentra la mediana.

 N es la suma de las frecuencias

absolutas.

 Fi- 1 es la frecuencia acumulada

anterior a la clase mediana.

 ai es la amplitud de la clase.

8 ∗^10 =^ 𝟓𝟖.^ 𝟏𝟐

16 ∗^10 =^ 𝟕𝟎.^ 𝟗𝟒

D9 = 100 +

10 ∗^10 =^ 𝟏𝟎𝟏

Página

 Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

Calculo del percentil 35 65 ∗ 35 100 = 22.

Calculo del percentil 60 65 ∗ 60 100 = 39

3.4 Representaciones graficas (histogramas, polígonos, ojivas, barras, circular y de caja)

 Un histograma es una representación gráfica de una variable en forma de barras.

Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.

La superficie de cada barra es proporcional a la frecuencia de los valores representados.

clases fi Fi [50, 60) 8 8 [60, 70) 1 0 1 8 [70, 80) 1 6 3 4 [80, 90) 1 4 4 8 [90, 100) 1 0 5 8 [100, 110) 5 6 3 [110, 120) 2 6 5 6 5

 Li es el límite inferior de la clase

donde se encuentra la mediana.

 N es la suma de las frecuencias

absolutas.

 Fi- 1 es la frecuencia acumulada

anterior a la clase mediana.

 ai es la amplitud de la clase.

14 ∗^10 =^ 𝟖𝟑.^ 𝟓𝟕

Página

0

20

40

60

80

[50,

[60,

[70,

[80,

[90,

[100,

[110,

Fi

Fi

 La ojiva son en realidad polígonos que utilizan las frecuencias acumuladas con la salvedad de que las ordenadas no se levanten sobre el punto medio de la clase, sino sobre el límite inferior o superior según se haya acumulado. Existen 2 gráficas ojivas: más que y menos que (ascendente o descendente).

 La grafica circular o pastel se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas

Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente

Alumnos Ángulo Balo nces to 1 2 144° Natación 3 3 6 ° Fútbo l 9 108° S in de po rte 6 7 2 ° To tal 3 0 360°

clases ci fi Fi

[5 0, 60) 55 8 8 [6 0, 70) 65 10 18 [7 0, 80) 75 16 34 [8 0, 90) 85 14 48 [9 0, 100) 95 10 58 [1 00, 110) 105 5 63 [1 10, 120) 115 2 65 65

Página

 Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.

Grupo s anguíneo

fi

A 6 B 4 AB 1 0 9 2 0

 Un diagrama de caja o diagrama de caja y bigotes o box plot , son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente. Ejemplo

CALCULO DE CUARTILES

 Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q1 = (24 + 25) / 2 = 24,  Q2, el Segundo Cuartil es la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33,  Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta Q2= (39 + 39) / 2 = 39

Página

(Extra) 4 medidas de dispersión

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Son: rango o recorrido, desviación media, desviación media para datos agrupados, varianza, desviación típica.

 El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

 La desviación media es la media aritmética de los valores absolutos de las desviaciones

respecto a la media. Se representa por signo Dx

Ejemplo

9, 3, 8, 8, 9, 8, 9, 18

 La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. a varianza se representa por signo .La varianza será siempre un valor positivo o cero; Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.

Página

Ejemplo

9, 3, 8, 8, 9, 8, 9, 18

 La desviación típica es la raíz cuadrada de la varianza. La desviación típica se representa por σ. La desviación típica será siempre un valor positivo o cero; Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.

Ejemplo

9, 3, 8, 8, 9, 8, 9, 18

http://www.ditutor.com/index.html