Valor atípico

De wikiRiesgos
Ir a la navegación Ir a la búsqueda

En estadística, tales como muestras estratificadas, un valor atípico (en inglés outlier) es una observación que es numéricamente distante del resto de los datos. Las estadísticas derivadas de los conjuntos de datos que incluyen valores atípicos serán frecuentemente engañosas. Por ejemplo, en el cálculo de la temperatura media de 10 objetos en una habitación, si la mayoría tienen entre 20 y 25 ºC, pero hay un horno a 350 °C, la mediana de los datos puede ser 23, pero la temperatura media será 55. En este caso, la mediana refleja mejor la temperatura de la muestra al azar de un objeto que la media. Los valores atípicos pueden ser indicativos de datos que pertenecen a una población diferente del resto de la muestra establecida.

Tomando como referencia la diferencia entre el primer cuartil (<math>Q_1</math>) y el tercer cuartil <math>Q_3</math>, o valor intercuartil, en un diagrama de caja se considera un valor atípico el que se encuentra 1,5 veces esa distancia de uno de esos cuartiles (atípico leve) o a 3 veces esa distancia (atípico extremo).

Valor atípico leve

Siendo <math>Q_1</math> y <math>Q_3</math> el primer y tercer cuartil, y <math>IQR</math> el rango intercuartil (<math>Q_3-Q_1</math>), un valor atípico leve será aquel que:

<math>< Q_1 - 1.5\cdot \mathrm{IQR},</math>

o

<math>> Q_3 + 1.5\cdot \mathrm{IQR}.</math>

<math>Q_1</math> y <math>Q_3</math> determinan, pues, los llamados limites interiores, a partir de los cuales la observación se considera un atípico leve.

Valor atípico extremo

Los atípicos extremos son observaciones más allá de los límites externos:

<math>< Q_1 - 3\cdot \mathrm{IQR},</math>

o

<math>> Q_3 + 3\cdot \mathrm{IQR}.</math>