Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Medidas numericas establecidas en probabilidad, Apuntes de Probabilidad

Probabilidad y el amplio campo de estudio ofrece medidas numericas para ditribuciones normales

Tipo: Apuntes

2020/2021

Subido el 19/04/2024

luis-abel-zapata-jimenez
luis-abel-zapata-jimenez 🇲🇽

1 documento

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
MEDIDAS NUMÉRICAS
Mediante la tabl a de distribución de frecuencias y las gráficas es posible realizar cierta
descripción del comportamiento de los datos en la muestra, pero sabemos que una
representación gráfica puede no ser lo precisa que uno desearía, por lo que además de una
gráfica requerimos de valores que sean representativos del comportamiento de los datos
y que dependan únicamente de dichos datos. A estos val ores se les llama “medidas
numéricas” y se utilizan para ayudar a describir el comportamiento de la muestra con más
precisión.
Las medidas numéricas, por el tipo de info rmación que proporcionan se clasifican en:
- Medidas de tendencia central
- Medidas de dispersión
- Medidas de forma
Medidas de tendencia central
Son valores que se encuent ran dentro del rango de la muest ra, situados en la parte central
de la misma y que se consideran com o representativos de la muestra. Las medidas de
tendencia central más conocidas son la media, la mediana y la moda.
a) Media aritmética: La media aritmética es más conocida únicamente como media.
Es el promedio de un conjunto de val ores. Es la medida de tendencia central más
utilizada y por lo general es la más representativa. Se denota por 𝑥𝑥 (es muy
importante que la x sea minúscula, sino se estará denotando algo diferente).
Se define de la siguiente forma:
Si x1, x2, x3, …, xn son los datos contenidos en una muestra, y se encuentran sin
agrupar , entonces:
, donde n es el tamaño de la muestra y
xi es cada una de los valores de la muestra
Si los datos se encuentran agrupados en una tabla de distribución de frecuencias,
se define la media aritmética como:
Donde: m es el número de intervalos, xi es la marca de clase del intervalo y fi es la
frecuencia del intervalo.
Para los siguientes datos:
4 4 5 5
5 6 6 6
8 8 8 8
8 9 9 9
9 10 10 10
Se tiene la siguiente tabla de distribución de frecuencias:
Limites de
clase
Li
Fronteras d e
clase
LRi
Marca
de clase
xi
Frec.
fi
Frec.
Acum.Fi
Frec.
Rel.
f'i
Frec.
Acum.
Rel. F'i
4 5 3.5 5.5 4.5 5 5 0.25 0.25
6 7 5.5 7.5 6.5 3 8 0.15 0.40
8 9 7.5 9.5 8.5 9 17 0.45 0.85
10 11 9.5 11.5 10.5 3 20 0.15 1.00
Tendríamos:
media para datos agrupa dos:
media para datos sin agrupar:
b) Mediana: Es el valor que divide al conjunto de datos de la muestra en dos
conjuntos de igual tamaño, en otras palabras, la mediana es aquel valor para el
cual el 50% de los datos son menores o iguales a él. Se denota por 𝑥𝑥 .
Cuando los datos no es tán agrupados, éstos se deben ordenar en forma
ascendente o descendente y seleccionar el valor central (si los datos son impares).
Si los datos son pares, entonces se toma el promedio de los dos valores centrales;
es decir, los datos que se encuentren en los lugares n
2 y ( n
2 + 1).
Para nuestro ejemplo el valor de la mediana para datos sin agrupar es:
Cuando los datos están agrupados, entonces se realiza una interpolación lineal
utilizando las fronteras y la frecuencia acumulada, (los datos de la ojiva), para
encontrar el valor de x en el cual la frecuencia acumulada es de 𝑛𝑛
2.
Con la distribución de frecuencias obtenida, se utilizan las columnas de fronteras
y de frecuencia acumulada.
Frontera de clase
superior
LRi
Frecuencia acumulada Fi
5.5 5
7.5
8
9.5
17
11.5
20
Y se realiza la interpolación para obtener el valor de x, para el cual la frecuencia
acumulada sea de 𝑛𝑛
2= 20
2= 10
=
=
n
i
i
x
n
x
1
1
i
m
i
i
fx
n
x
=
=
1
1
pf3

Vista previa parcial del texto

¡Descarga Medidas numericas establecidas en probabilidad y más Apuntes en PDF de Probabilidad solo en Docsity!

MEDIDAS NUMÉRICAS

Mediante la tabla de distribución de frecuencias y las gráficas es posible realizar cierta descripción del comportamiento de los datos en la muestra, pero sabemos que una representación gráfica puede no ser lo precisa que uno desearía, por lo que además de una gráfica requerimos de valores que sean representativos del comportamiento de los datos y que dependan únicamente de dichos datos. A estos valores se les llama “medidas numéricas” y se utilizan para ayudar a describir el comportamiento de la muestra con más precisión.

Las medidas numéricas, por el tipo de información que proporcionan se clasifican en:

  • Medidas de tendencia central
  • Medidas de dispersión
  • Medidas de forma

Medidas de tendencia central Son valores que se encuentran dentro del rango de la muestra, situados en la parte central de la misma y que se consideran como representativos de la muestra. Las medidas de tendencia central más conocidas son la media, la mediana y la moda.

a) Media aritmética: La media aritmética es más conocida únicamente como media. Es el promedio de un conjunto de valores. Es la medida de tendencia central más utilizada y por lo general es la más representativa. Se denota por 𝑥𝑥̅ (es muy importante que la x sea minúscula, sino se estará denotando algo diferente). Se define de la siguiente forma: Si x 1 , x 2 , x 3 , …, x n son los datos contenidos en una muestra, y se encuentran sin agrupar , entonces: , donde n es el tamaño de la muestra y x (^) i es cada una de los valores de la muestra

Si los datos se encuentran agrupados en una tabla de distribución de frecuencias, se define la media aritmética como:

Donde: m es el número de intervalos, x (^) i es la marca de clase del intervalo y f (^) i es la frecuencia del intervalo.

Para los siguientes datos:

Se tiene la siguiente tabla de distribución de frecuencias:

Limites de clase Li

Fronteras de clase LRi

Marca de clase x (^) i

Frec. f (^) i

Frec. Acum.Fi

Frec. Rel. f'i

Frec. Acum. Rel. F'i 4 5 3.5 5.5 4.5 5 5 0.25 0. 6 7 5.5 7.5 6.5 3 8 0.15 0. 8 9 7.5 9.5 8.5 9 17 0.45 0. 10 11 9.5 11.5 10.5 3 20 0.15 1.

Tendríamos: media para datos agrupados:

media para datos sin agrupar:

b) Mediana: Es el valor que divide al conjunto de datos de la muestra en dos conjuntos de igual tamaño, en otras palabras, la mediana es aquel valor para el cual el 50% de los datos son menores o iguales a él. Se denota por 𝑥𝑥�.

Cuando los datos no están agrupados, éstos se deben ordenar en forma ascendente o descendente y seleccionar el valor central (si los datos son impares ). Si los datos son pares, entonces se toma el promedio de los dos valores centrales ; es decir, los datos que se encuentren en los lugares n 2 y (^

n 2 + 1).

Para nuestro ejemplo el valor de la mediana para datos sin agrupar es:

Cuando los datos están agrupados, entonces se realiza una interpolación lineal utilizando las fronteras y la frecuencia acumulada, (los datos de la ojiva), para encontrar el valor de x en el cual la frecuencia acumulada es de

𝑛𝑛

Con la distribución de frecuencias obtenida, se utilizan las columnas de fronteras y de frecuencia acumulada.

Frontera de clase superior L Ri

Frecuencia acumulada Fi

5.5 5 7.5 8 9.5 17 11.5 20

Y se realiza la interpolación para obtener el valor de x, para el cual la frecuencia acumulada sea de 𝑛𝑛 2 =^

20 2 =^10

=

n

i

x n xi

1

i

m

i

xi f n

x ∑

=

1

Frontera de clase superior L Ri

Frecuencia acumulada Fi

7.5 8 x� (^10) 9.5 17

Interpolando se obtiene:

c) Moda: Se denota como m o o x mo, es el valor que se repite con mayor frecuencia dentro de la muestra. Puede existir más de una moda en la misma muestra, entonces se dice que los datos tienen distribución bimodal (2 modas) o multimodal (más de 2 modas).

d) Cuartiles, Deciles y percentiles. Asi como la mediana es el valor que divide a un conjunto de datos ordenados en dos conjuntos de igual tamaño, los datos pueden dividirse en cuatro conjuntos de igual tamaño (cuartiles), en 10 conjuntos de igual tamaño (deciles) y en 100 conjuntos de igual tamaño (percentiles).

Los cuartiles se denotan generalmente por Q 1 , Q 2 y Q 3 , (el segundo cuartil coincide con la mediana). Los deciles se denotan D 1 , D 2 ,…, D 9 ; el quinto decil D 5 coincide con la mediana y con el segundo cuartil. Los percentiles se denotan P 1 , P 2 ,…, P 99 ; el percentil 50 coincide con la mediana, con el segundo cuartil y con el quinto decil. (Se pueden encontrar muchas otras relaciones.)

Medidas de dispersión Existen varias medidas de dispersión, la mayoría se miden con respecto a la media por ser esta una medida que se encuentra alrededor del centro del rango de la muestra y considerarse una medida representativa de los datos. Las medidas de dispersión proporcionan un indicador del alejamiento de los datos. También se les llama medidas de variación. Las medidas más comunes son: el rango, la desviación media, la varianza, la desviación estándar y el coeficiente de variación.

Rango, es la medida de dispersión más simple, proporciona información inmediata acerca de la variabilidad que tienen los datos entre sí. El rango de un conjunto de datos es la diferencia entre el mayor valor menos el menor valor. Se denota por Rango o R, (por lo general no se realiza la operación de resta y solamente se indica). Para el caso de los datos agrupados, se emplean como mayor y menor valor, el límite de clase mayor y menor respectivamente. Para los datos de nuestro ejemplo tenemos: Datos agrupados: Datos NO agrupados:

Desviación media La desviación media o desviación promedio de un conjunto de datos es el promedio de las distancias de cada valor con respecto a la media. Se denota por DM.

Varianza. La varianza de un conjunto de datos es el promedio de las distancias cuadradas de cada valor con respecto a su media. De denota por s 2

Como las unidades de los datos y los de su varianza no coinciden, (la varianza queda en unidades cuadradas), por esta razón se extrae la raíz cuadrada de s 2 , y se obtiene así la desviación estándar.

Desviación estándar Es la medida de dispersión más utilizada. Para un conjunto de datos, la desviación estándar es la raíz cuadrada de la varianza, se denota por s. 𝑠𝑠 = �𝑠𝑠 2

Coeficiente de variación Es una medida de la dispersión de un conjunto de datos en relación con su media. No tiene unidades y se define mediante el cociente de la desviación estándar entre la media. Se denota CV. 𝐶𝐶𝐶𝐶 =