



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este documento proporciona una introducción al análisis descriptivo, centrándose en las medidas de tendencia central y dispersión. Explica cómo calcular e interpretar la media, mediana y moda, así como la varianza y la desviación estándar. También aborda el concepto de datos atípicos y cómo afectan las medidas estadísticas. El documento incluye ejemplos y preguntas para fomentar la comprensión y el análisis de datos.
Tipo: Apuntes
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Regresión lineal simple
El análisis descriptivo reúne tanto las medidas de tendencia central, así como las medidas de localización y las de dispersión.
x ¯ =
∑ xi n
La media es la sumatoria de los datos dividida por el total de estos. Es decir, el promedio de los datos.
La Media se ve afectada por datos atípicos, por lo cual se puede inflar o desinflar la media representativa.
La mediana por otra parte es la parte central de los datos.
Me = ~ x
Se calcula sobre un conjunto de datos ordenados. Corresponde al dato de la mitad, lo que quiere decir que es una medida posicional.
Ej:
En el ejemplo anterior la mediana deja de ser representativa. En este caso es mejor separar los grupos para estudiarlos.
Se trata del dato que mas aparece en la muestra.
Cuando los datos son: Impares - Mitad 1 solo Pares - Promediamos los datos de la mitad
Utilidad de la moda - Nos permite ver como están distribuidas las frecuencias.
Si se repiten en varios casos la moda es mejor separar las muestras
Histograma de frecuencias
La x ¯ y x ~ van a ser muy parecidas y en este caso la media sería una buena medida de tendencia.
A veces no hay una única moda - Datos multimodales
*Estos datos permiten construir gráfico de cajas y bigotes (Box Plot)
Cuantiles: Reparten en porcentajes iguales el conjunto de datos, por ejemplo:
No tienen que estar distanciados por igual
Deciles -> 10% Cuartiles - 25% Cuantiles - 20% Percentiles - 1%
Box Plot
Para sacar los datos atípicos extremos lo que debemos hacer es duplicar la distancia:
RI: Q3 - Q1 (Rango Inter cuartil) a = Q1 - 1,5 x RI b = Q3 + 1,5 x RI
La varianza muestra que tan dispersos están los datos.
:luc_lightbulb:Siempre se mide respecto a la media y Siempre es Positiva
s^2 = ∑( x^1 − ¯ x )
2 n − 1
Muestra qué tan distante esta el dato de la media.
También conocida como desviación típica, Error típico.
s = √ S^2
Para comparar dispersión de dos muestras -> Datos muy variables
Se recomienda no quitar los datos atípicos de la muestra
a = Q1 - 3 x RI b = Q3 + 3 x RI --> Se duplica la distancia
Bigotes largos: Quieren decir que hay gran dispersión (Coeficiente de variación)