MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIMPLES Y AGRUPADOS
Las medidas de tendencia central de datos agrupados se
utilizan en estadística para describir ciertos comportamientos de un grupo de
datos suministrados, como por ejemplo a qué valor están cercanos, cuál es el
promedio de los datos recogidos, entre otros.
MEDIA
La media es
la suma de los valores de todas las observaciones, dividida entre el número de
observaciones realizadas.
En donde el
subíndice i, indica un número de conteo para identificar cada observación.
Ejemplo:
Encuentre
los medios del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.
Hay
8 números en el conjunto. Súmelos, y luego divida entre 8.
=
6.75
Así,
la media es 6.75.
La mediana es el valor central que se localiza en una serie ordenada
de datos. La mediana de una variable X corresponde con el valor central de un
conjunto de n observaciones de la variable X ordenadas según su magnitud.
El siguiente video muestra un ejercicio en el cual da paso a paso cada parte de las medidas de dispersión.
MEDIANA
Ejemplo 1 :
Encuentre
la mediana del conjunto {2, 5, 8, 11, 16, 21, 30}.
Hay
7 números en el conjunto, y estos están acomodados en orden ascendente. El
número medio (el cuarto en la lista) es 11. Así, la mediana es 11.
MODA
La moda es el dato que más se repite o el dato que ocurre
con mayor frecuencia.
La siguiente serie de datos tiene dos modas, ya que el 11 y
el 15, se repiten 2 veces, entonces se dice que la distribución de los datos es
bimodal. 4 6 9 11 11 12 13 15 15
La siguiente serie de datos es trimodal, ya que el 4, el 11
y el 15 se repiten 3 veces. 4 4 4 6 9 11 11 11 12 13 15 15 15
Ejemplo 1:
Encuentra
la moda del conjunto {2, 3, 5, 5, 7, 9, 9, 9, 10, 12}.
El
2, 3, 7, 10 y 12 aparecen una vez cada uno.
El
5 aparece dos veces y el 9 aparece tres veces.
Así,
el 9 es la moda.
SESGO
En estadística se llama sesgo de un
estimador a la diferencia entre su esperanza matemática y el valor del
parámetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.
En notación matemática, dada una muestra
y un estimador
del parámetro muestral θ, el sesgo
MEDIDAS DE DISPERSIÓN PARA DATOS SIMPLES Y AGRUPADOS
Las medidas de dispersión
son parámetros estadísticos que indican como se alejan los datos respecto de la
media aritmética. Sirven como indicador de la variabilidad de los datos. Las
medidas de dispersión más utilizadas son:
·
Rango
·
Desviación
media
·
Desviación
estándar
·
Varianza
Rango
Indica la dispersión entre los valores extremos de una
variable. se calcula como la diferencia entre el mayor y el menor valor de la
variable. (R)
Para datos ordenados se calcula como:
R
= x(n) - x (1)
Desviación media
Es
la media aritmética de los valores absolutos de las diferencias de cada dato
respecto a
la media.
Donde:
DM: Desviación media
Σ: Sumatoria
||: Valor absoluto (+)
X: Marca
de clase
X: Promedio
n: Total de datos
f: Frecuencia
Desviación estándar
La desviación estándar mide el grado de dispersión de los
datos con respecto a la media, se denota como s para una muestra o como σ para
la población. Se define como la raíz cuadrada de la varianza según la
expresión:
Como se puede observar el denominador es n - 1, a
diferencia de la desviación media donde se divide entre n; también existe la fórmula
de desviación típica donde el denominador es n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son
más homogéneos, es decir existe menor dispersión, el incremento de los valores
de la desviación estándar indica una mayor variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los
valores de una variable respecto a la media. Corresponde a la media aritmética
de los cuadrados de las desviaciones respecto a la media. Su expresión
matemática es:
Coeficiente de Variación
Permite determinar la razón existente entre la desviación
estándar (s) y la media. Se denota como CV. El coeficiente de variación permite
decidir con mayor claridad sobre la dispersión de los datos.
También puede ser expresado en por ciento.
El siguiente video muestra un ejercicio en el cual da paso a paso cada parte de las medidas de dispersión.
Autores:
Mario Orlando Suárez Ibujes
Medwave
Fuentes:
https://www.ub.edu/stat/GrupsInnovacion/Statmedia/demo/Temas/Capitulo7/B0C7m1t5.htm
https://www.portaleducativo.net/octavo-basico/792/media-moda-y-mediana-para-datos-agrupados
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-median-mode
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934?ver=sindiseno
LIMITES ESTADÍSTICOS
CUARTILES:
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenado sen cuatro partes iguales.- Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
- Q2 coincide con la mediana.
1: Ordenamos los datos de menor a mayor.
2: Mediante las formulas:
DATOS PAR: DATOS IMPAR:
QK= kn/4 QK=(n+1)/4
Q: Cuartil
K: Número de cuartil
n: número de datos
Número impar de datos
2, 5, 3, 6, 7, 4, 9
Número par de datos
2, 5, 3, 4, 6, 7, 1, 9
DECILES:
Los deciles son los nueve
valores que dividen una serie de datos ordenados
en diez partes iguales.
Los deciles dan los valores
correspondientes al 10%, al 20%... y al 90% de los datos.
El decil 5 coincide con la mediana: D5 =
Me
El decil 5 coincide con el cuartil 2: D5 = Q2 =
Me
Cálculo de los deciles
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior
a la clase el decil.
PERCENTILES
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el mismo número de elementos cada una.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi se calcula mediante la fórmula siguiente:
Donde Pi es la posición del percentil buscado en la serie ordenada de datos.
(N+1)·i/100 pueden resultar números decimales.
Por ejemplo, si el conjunto de datos es de 200 elementos, N=200, tendremos que el sujeto del percentil 50 será (N+1)·i/100=201·50/100=100,5.
¿Qué hacemos en el caso de que nos de un número decimal?
Diferenciaremos dos casos:
- Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 199 elementos, (N+1)·i/100=200·50/100=100, por lo que el percentil 50 será P50=X100.
- Con parte decimal: supongamos que el elemento es un número con parte decimal entre el sujeto t y el t+1. Sea un número de la forma t,d donde t es la parte entera y d la decimal. El percentil será:
Una aplicación muy conocida de los percentiles son las tablas de crecimiento de los niños, en las que se ubica el peso y la talla de un determinado niño dentro de su grupo de edad.
Características de los percentiles
- El percentil 25 (P25) es el cuartil 1 (Q1).
- El percentil 50 (P50) es la mediana y el cuartil 2 (Q2).
- El percentil 75 (P75) es el cuartil 3 (Q3).
El siguiente vídeo muestra un ejemplo acerca de cada uno de los límites estadísticos:
CUARTILES:
DECILES: https://www.vitutor.com/estadistica/descriptiva/a_12.html
PERCENTILES: https://www.universoformulas.com/estadistica/descriptiva/percentiles/
No hay comentarios:
Publicar un comentario