Distribución log-normal
En probabilidades y estadísticas, la distribución log-normal es una distribución de probabilidad de una variable aleatoria cuyo logaritmo está normalmente distribuido. Es decir, si X es una variable aleatoria con una distribución normal, entonces exp(X) tiene una distribución log-normal.
La base de una función logarítmica no es importante, ya que loga X está distribuida normalmente si y sólo si logb X está distribuida normalmente, sólo se diferencian en un factor constante.
Log-normal también se escribe log normal o lognormal.
Una variable puede ser modelada como log-normal si puede ser considerada como un producto multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es un retorno a largo plazo de una inversión: puede considerarse como un producto de muchos retornos diarios.
La distribución log-normal tiende a la función densidad de probabilidad
- <math>f(x;\mu,\sigma) = \frac{1}{x \sigma \sqrt{2 \pi}} e^{-(\ln x - \mu)^2/2\sigma^2}</math>
para <math>x>0</math>, donde <math>\mu</math> y <math>\sigma</math> son la media y la desviación estándar del logaritmo de variable. El valor esperado es
- <math>\mathrm{E}(X) = e^{\mu + \sigma^2/2}</math>
y la varianza es
- <math>\mathrm{var}(X) = (e^{\sigma^2} - 1) e^{2\mu + \sigma^2}</math>.
Sumario
Relación con media y la desviación estándar geométrica
La distribución log-normal, la media geométrica, y la desviación estándar geométrica están relacionadas. En este caso, la media geométrica es igual a <math>\exp(\mu)</math> y la desviación estándar geométrica es igual a <math>\exp(\sigma)</math>.
Si una muestra de datos determina que proviene de una población distribuida siguiendo una distribución log-normal, la media geométrica de la desviación estándar geométrica puede utilizarse para estimar los intervalos de confianza tal como la media aritmética y la desviación estándar se usan para estimar los intervalos de confianza para un dato distribuido normalmente.
Límite de intervalo de confianza | log | geométrica |
---|---|---|
3σ límite inferior | <math>\mu - 3\sigma</math> | <math>\mu_\mathrm{geo} / \sigma_\mathrm{geo}^3</math> |
2σ límite inferior | <math>\mu - 2\sigma</math> | <math>\mu_\mathrm{geo} / \sigma_\mathrm{geo}^2</math> |
1σ límite inferior | <math>\mu - \sigma</math> | <math>\mu_\mathrm{geo} / \sigma_\mathrm{geo}</math> |
1σ límite superior | <math>\mu + \sigma</math> | <math>\mu_\mathrm{geo} \sigma_\mathrm{geo}</math> |
2σ límite superior | <math>\mu + 2\sigma</math> | <math>\mu_\mathrm{geo} \sigma_\mathrm{geo}^2</math> |
3σ límite superior | <math>\mu + 3\sigma</math> | <math>\mu_\mathrm{geo} \sigma_\mathrm{geo}^3</math> |
Donde la media geométrica <math>\mu_\mathrm{geo} = \exp(\mu)</math> y la desviación estándar geométrica <math>\sigma_\mathrm{geo} = \exp(\sigma)</math>
Momentos
Los primeros momentos son:
- <math>\mu_1=e^{\mu+\sigma^2/2}</math>
- <math>\mu_2=e^{2\mu+4\sigma^2/2}</math>
- <math>\mu_3=e^{3\mu+9\sigma^2/2}</math>
- <math>\mu_4=e^{4\mu+16\sigma^2/2}</math>
o de forma general:
- <math>\mu_k=e^{k\mu+k^2\sigma^2/2}.</math>
Estimación de parámetros
Para determinar los estimadores que más se aproximan a los parámetros μ y σ de la distribución log-normal, podemos utilizar los mismos procedimientos que para la distribución normal. Para no repetirlo, obsérvese que
- <math>f_L (x;\mu, \sigma) = \frac 1 x \, f_N (\ln x; \mu, \sigma)</math>
donde por <math>f_L (\cdot)</math> denotamos la función densidad de probabilidad de distribución log-normal, y por <math>f_N (\cdot)</math> a la de la distribución normal. Por lo tanto, utilizando los mismos índices para denotar las distribuciones, podemos escribir que
- <math>\begin{matrix}
\ell_L (x_1, x_2, ..., x_n; \mu, \sigma) & = & - \sum _k \ln x_k + \ell_N (\ln x_1, \ln x_2, ..., \ln x_n; \mu, \sigma) = \\
\ & = & \operatorname {const} (\mu, \sigma) + \ell_N (\ln x_1, \ln x_2, ..., \ln x_n; \mu, \sigma). \end{matrix}</math>
Ya que el primer término es constante respecto a μ y σ, ambas funciones logarítmicas, <math>\ell_L</math> y <math>\ell_N</math>, obtienen su máximo con el mismo μ y σ. Por tanto, utilizando las fórmulas para los estimadores de parámetros de la distribución normal, y la igualdad de arriba, deducimos que para la distribución log-normal se cumple:
- <math>\widehat \mu = \frac {\sum_k \ln x_k} n, \
\widehat \sigma^2 = \frac {\sum_k {\left( \ln x_k - \widehat \mu \right)^2}} n.</math>
Distribución relacionada
- Si <math>X \sim \ N(\mu, \sigma^2)</math> es una distribución normal, entonces <math>\exp(X) \sim \operatorname{Log-N}(\mu, \sigma^2)</math>.
- Si <math>X_m \sim \operatorname {Log-N} (\mu, \sigma_m^2), \ m = \overline {1 ... n}</math> son variables independentes log-normalmente distribuidas con el mismo parámetro μ y permitiendo que varíe σ, y <math>Y = \prod_{m=1}^N X_m</math>, entonces Y es una variable distribuida log-normalmente como: <math>Y \sim \operatorname {Log-N} \left( \mu, \sum _m \sigma_m^2 \right)</math>.
Véase también
Software
Se puede usar software o programa de computadora para el ajuste de una distribución de probabilidad, incluyendo la lognormal, a una serie de datos:
- Easy fit, "data analysis & simulation"
- MathWorks Benelux
- ModelRisk, "risk modelling software"
- Ricci distributions, fitting distrubutions with R , Vito Ricci, 2005
- Risksolver, automatically fit distributions and parameters to samples
- StatSoft distribution fitting
- CumFreq [1] , libre sin costo, incluye la distribución normal, la lognormal, raíz-normal, cuadrado-normal, e intervalos de confianza a base de la distribución binomial
- Calculadora Distribución log-normal