MathTexpedia | Apuntes de Informática y Matemáticas

Estadígrafos de orden

En inferencia estadística, uno de los objetivos comunes es estimar el valor de cierto parámetro $\theta$ que caracteriza una cierta característica de interés, $X$ , de una población.

Esta variable $X$ seguirá una distribución de probabilidad $F_\theta$ dependiente de $\theta$ . Además, este parámetro $\theta$ pertenece a un conjunto $\Theta \subseteq \mathbb{R}^k$ llamado espacio paramétrico.

Habitualmente, para obtener el valor del parámetros se obtiene una muestra aleatoria $(X_1, \dots, X_n)$ de tamaño $n$ de la población que ``resuma'' la información sobre $X$ utilizando transformaciones medibles que llamamos estadígrafos.

Estadígrafo. Definición

Llamamos estadígrafo a cualquier función medible de la muestra aleatoria $(X_1, \dots, X_n)$ de la forma:

\begin{align*} T : (X_1, \dots, X_n) \longrightarrow T(X_1, \dots, X_n) \in \mathbb{R}^p \end{align*}

donde $p \leq n$ .

💡Observación

El objetivo de los estadígrafos es simplificar la estructura de la muestra de $\mathbb{R}^n$ a $\mathbb{R}^p$ (habitualmente $p = 1$ o $p = 2$ ), facilitando así el análisis de los datos.

Estimador. Definición

Llamamos estimador a un estadígrafo que toma valores en el espacio paramétrico $\Theta$ , i.e.:

\begin{align*} T : (X_1, \dots, X_n) \longrightarrow T(X_1, \dots, X_n) \in \Theta \subseteq \mathbb{R}^k \end{align*}

Muestra ordenada. Definición

Sea $(X_1, \dots, X_n)$ muestra aleatoria simple de tamaño $n$ , se pueden ordenar sus componentes de forma no decreciente obteniendo $X_{(1)} \leq X_{(2)} \leq \dots \leq X_{(n)}$ . Así, llamamos muestra ordenada a la aplicación:

\begin{array}{rccl} X_{(\cdot)} : & \mathbb{R}^n & \longrightarrow & \mathbb{R}^n \\ & (x_1, \dots, x_n) & \longmapsto & (x_{(1)}, \dots, x_{(n)}) \end{array}

💡Nota

La importancia de las muestras ordenadas radica en que permitirán definir estadígrafos de orden, que son especialmente útiles para estimar parámetros que tengan que ver con el máximo, el mínimo, etc.

✏️Ejemplo

Esto es tan intuitivo como puede parecer. Si tenemos una muestra de datos:

\begin{align*} (x_1, x_2, x_3, x_4) = (10, 3, 5, 2) \end{align*}

Entonces, la muestra ordenada será:

\begin{align*} (x_{(1)}, x_{(2)}, x_{(3)}, x_{(4)}) = (2, 3, 5, 10) \end{align*}

Y la notación $x_{(i)}$ simplemente sirve para diferenciar entre el valor original $x_i$ y su posición en la muestra ordenada. Por lo tanto, la aplicación $X_{(\cdot)}$ en este caso vendría dada por:

\begin{align*} X_{(1)} = 2, \quad X_{(2)} = 3, \quad X_{(3)} = 5, \quad X_{(4)} = 10 \end{align*}

💡Nota

Notar que esta aplicación no es inyectiva, ya que podemos tener varios vectores iniciales distintos que den lugar a la misma muestra ordenada, por ejemplo:

\begin{align*} (10, 3, 5, 2) \quad \text{y} \quad (3, 2, 10, 5) \end{align*}

Ambos vectores dan lugar a la misma muestra ordenada $(2, 3, 5, 10)$ .

En particular, estaríamos hablando de $n!$ vectores distintos que dan lugar a la misma muestra ordenada ya que son permutaciones distintas con $n$ elementos.

Estadígrafos de orden. Definición

Llamamos estadígrafo de orden $k$ a la aplicación:

\begin{array}{rccl} X_{(k)} : & \mathbb{R}^n & \longrightarrow & \mathbb{R} \\ & (x_1, \dots, x_n) & \longmapsto & x_{(k)} \end{array}

que nos da la $k$ -ésima componente de la muestra ordenada.

✏️Ejemplo

Intuitivamente, podemos pensar en los dos estadígrafos de orden más simples:

Mínimo: $X_{(1)} = \min \{X_1, \dots, X_n\}$
Máximo: $X_{(n)} = \max \{X_1, \dots, X_n\}$

De hecho, podemos notar que los estadígrafos siguen la siguiente cadena de desigualdades:

\begin{align*} \min_{i = 1}^n X_i = X_{(1)} \leq X_{(2)} \leq \dots \leq X_{(n-1)} \leq X_{(n)} = \max_{i = 1}^n X_i \end{align*}

💡Observación

Pese a que la observación muestral $(X_1, \dots, X_n)$ pueda ser independiente e idénticamente distribuida, las componentes del estadígrafo de orden $(X_{(1)}, \dots, X_{(n)})$ no son independientes entre sí, ya que están relacionadas por la condición de ordenación, y tampoco son idénticamente distribuidas.

Propiedades de los estadígrafos de orden. Proposición

Sea $X$ variable aleatoria con función de distribución $F$ de la que obtenemos una muestra aleatoria simple $(X_1, \dots, X_n)$ de tamaño $n$ entonces se verifica que:

$F_{X_{(n)}}(x) = [F (x)]^n$
$F_{X_{(1)}}(x) = 1 - [1 - F(x)]^n$
$F_{X_{(k)}}(x) = \displaystyle \sum_{j = k}^{n} \binom{n}{j} [F(x)]^j[1 - F(x)]^{n - j}$

📐Demostración

X_{(n)} \leq x

✏️Ejemplo

A partir de estas propiedades y las definiciones previas, podemos ver el comportamiento de los estadígrafos de orden más simples. Supongamos una variable aleatoria $X$ con distribución uniforme $\mathcal{U}(0, 1)$ . Entonces:

\begin{align*} F_{X_{(n)}}(x) & = \begin{cases} 0 & x < 0 \\ x^n & 0 \leq x \leq 1 \\ 1 & x > 1 \end{cases} \implies X_{(n)} \rightsquigarrow \text{Beta}(n, 1) \\[2ex] \end{align*}

De hecho, si considerásemos $Y \rightsquigarrow \mathcal{U}(0, \theta)$ tendríamos:

\begin{align*} F_{(Y_{(n)})}(y) & = \begin{cases} 0 & y < 0 \\ \left(\frac{y}{\theta}\right)^n & 0 \leq y \leq \theta \\ 1 & y > \theta \end{cases} \implies Y_{(n)} \rightsquigarrow \text{Beta}(n, 1) \cdot \theta \end{align*}

Otro estadígrafo de orden interesante es el rango o recorrido muestral que viene dado por:

\begin{align*} R = X_{(n)} - X_{(1)} \end{align*}

Función de densidad del estadígrafo de orden $k$ . Proposición

Sea $X$ una variable aleatoria continua con función de densidad $f$ y función de distribución $F$ de la que obtenemos una muestra aleatoria simple $(X_1, \dots, X_n)$ de tamaño $n$ . Entonces, la función de densidad del estadígrafo de orden $k$ , $X_{(k)}$ viene dada por:

\begin{align*} f_{X_{(k)}}(x) = n! \frac{[F(x)]^{k - 1}}{(k - 1)!} f(x) \frac{[1 - F(x)]^{n - k}}{(n - k)!} \end{align*}

📐Demostración

(X_1, \dots, X_n)

💡Nota

Notar que esto solo se da en caso de emplear notación ``estándar'', en el caso de la española, tendríamos que:

\begin{align*} f_{X_{(k)}}(x) = \text{¡}n! \frac{[F(x)]^{k - 1}}{\text{¡}(k - 1)!} f(x) \frac{[1 - F(x)]^{n - k}}{\text{¡}(n - k)!} \end{align*}

Densidad conjunta de la muestra ordenada. Teorema

Sea $X$ variable aleatoria continua con función de densidad $f$ , se extrae una muestra aleatoria simple de tamaño $n$ , entonces la función de densidad conjunta de la muestra ordenada es:

\begin{align*} f_{X_{(\cdot)}}(x_1, \dots, x_n) = n! \displaystyle \prod_{i = 1}^n f(x_i) I (x_1 \leq x_2 \leq \dots \leq x_n) \end{align*}

💡Nota

A lo largo de los apuntes, se pueden emplear diferentes notaciones para el caso de las funciones indicadores/indicatrices:

\begin{align*} I (A), \quad I_A, \quad \chi_A \end{align*}

Al final, lo que tenemos es que la expresión anterior vale $1$ si se cumple la condición $A$ y $0$ en caso contrario:

\begin{align*} f_{X_{(\cdot)}}(x_1, \dots, x_n) = \begin{cases} n! \displaystyle \prod_{i = 1}^n f(x_i) & x_1 \leq x_2 \leq \dots \leq x_n \\ 0 & \text{en otro caso} \end{cases} \end{align*}

💡Nota

Hay que notar que, cada muestra ordenada $(x_{(1)}, \dots, x_{(n)})$ puede ser obtenida a partir de $n!$ permutaciones distintas de la muestra original $(x_1, \dots, x_n)$ , es decir, que tiene $n!$ posibles resultados.

Podemos ver un ejemplo sencillo con $n = 2$ . Supongamos que tenemos $X_1$ y $X_2$ dos variables aleatorias independientes e idénticamente distribuidas y dos realizaciones muestrales $(x_1, x_2)$ y $(x_1', x_2')$ tales que:

\begin{align*} x_1 < x_2 \quad \text{ y } \quad x_2' < x_1' \quad y \quad (x_1, x_2) = (x_2', x_1') \end{align*}

Esto gráficamente sería:

TikZ Graph

Por lo tanto, al ordenar ambas muestras, obtenemos la misma muestra ordenada:

\begin{align*} (x_{(1)}, x_{(2)}) = (x_1, x_2) = (x_2', x_1') \end{align*}

Que gráficamente sería:

TikZ Graph

📐Demostración

X

Ojiva empírica

La función de distribución empírica o ojiva empírica es un estadígrafo funcional que permite aproximar la función de distribución de una variable aleatoria a partir de una muestra muestral.

Ojiva empírica. Definición

Sea $(X_1, \dots, X_n)$ una muestra aleatoria simple $X$ variable aleatoria con función de distribución $F$ . Se define la ojiva empírica de $X$ asociada a la muestra aleatoria simple $(X_1, \dots, X_n)$ como la función $F_n : \mathbb{R} \to [0, 1]$ que asocia a cada $x \in \mathbb{R}$ el valor:

\begin{align*} F_n(x) = \dfrac{\text{Card } \{X_i \leq x\}}{n} = \frac{1}{n} \displaystyle \sum_{i = 1}^{n} I_{ (- \infty, x]} (X_i) = \frac{1}{n} \displaystyle \sum_{i = 1}^{n} I_{[X_i, \infty)} (x) \end{align*}

💡Nota

Esta función se puede entender también como:

\begin{align*} F_n(x) = \left\{ \begin{array}{cl} 0 & \text{ si } x < X_{(1)} \\ \frac{i}{n} & \text{ si } X_{(i)} \leq x < X_{(i + 1)} \text{ para algún } i = 1, \dots, n - 1 \\ 1 & \text{ si } x \geq X_{(n)} \end{array} \right. \end{align*}

Por lo que, a cada realización muestral le asocia una función escalonada que es función de distribución. Así, para cada muestra, la ojiva empírica cambia (salvo que la muestra simplemente cambie el orden de los datos).

✏️Ejemplo

Sea la muestra de tamaño $n = 5$ dada por $(2.1, 3.5, 1.8, 4.2, 2.7)$ de una variable aleatoria $X$ . Entonces, la ojiva empírica asociada a esta muestra es:

Los estadísticos de orden de la muestra son:

\begin{align*} X_{(1)} = 1.8, \quad X_{(2)} = 2.1, \quad X_{(3)} = 2.7, \quad X_{(4)} = 3.5, \quad X_{(5)} = 4.2 \end{align*}

Así, la ojiva empírica asociada a esta muestra es:

\begin{align*} F_n(x) = \left\{ \begin{array}{cl} 0 & \text{ si } x < 1.8 \\[1ex] \frac{1}{5} & \text{ si } 1.8 \leq x < 2.1 \\[1ex] \frac{2}{5} & \text{ si } 2.1 \leq x < 2.7 \\[1ex] \frac{3}{5} & \text{ si } 2.7 \leq x < 3.5 \\[1ex] \frac{4}{5} & \text{ si } 3.5 \leq x < 4.2 \\[1ex] 1 & \text{ si } x \geq 4.2 \end{array} \right. \end{align*}

Gráficamente, la ojiva empírica asociada a esta muestra es:

TikZ Graph

Propiedades de la ojiva empírica. Proposición

Algunas propiedades de la ojiva empírica $F_n$ son:

Sea $x \in \mathbb{R}$ fijo, entonces la ojiva empírica $F_n$ puede expresarse como:

\begin{align*} F_n(x) = \frac{1}{n} \displaystyle \sum_{i = 1}^{n} I_{(-\infty, x]} (X_i) = \frac{1}{n} \displaystyle \sum_{i = 1}^{n} I_{[X_i, \infty)} (x) \end{align*}

La ojiva empírica $F_n$ es un estimador insesgado de la función de distribución $F$ de la variable aleatoria $X$ .

📐Demostración

x \in \mathbb{R}

💡Nota

Además, si calculamos la varianza de $F_n(x)$ :

\begin{align*} Var(F_n(x)) & = Var\left(\frac{1}{n} \displaystyle \sum_{i = 1}^{n} Y_i\right) = \frac{1}{n^2} \displaystyle \sum_{i = 1}^{n} Var(Y_i) = \\[2ex] & = \frac{1}{n^2} \cdot n \cdot F(x)(1 - F(x)) = \frac{F(x)(1 - F(x))}{n} \end{align*}

que es una parábola que alcanza su valor máximo en $F(x) = 0.5$ , por lo que:

Cuando $F(x) = 0$ o $F(x) = 1$ entonces $Var(F_n(x)) = 0$
Cuando $F(x) = 0.5$ entonces $Var(F_n(x)) = \frac{1}{4n}$ es máxima

De esta forma, la estimación es más precisa en las colas de la distribución que en el centro.

Por la ley de los grandes números se tiene que:

\begin{align*} F_n(x) \xrightarrow[n \to \infty]{\text{c.s.}} F(x) \quad \forall x \in \mathbb{R} \end{align*}

Por el Teorema del Límite Central se tiene que:

\begin{align*} \dfrac{F_n(x) - F(x)}{\sqrt{F(x)(1 - F(x)) / n}} \xrightarrow[n \to \infty]{\mathcal{L}} \mathcal{N}(0, 1) \quad \forall x \in \mathbb{R} \end{align*}

Teorema de Glivenko-Cantelli

Sea $(X_n)_{n \in \mathbb{N}}$ sucesión de variables aleatorias independientes e idénticamente distribuidas con función de distribución común $F$ . Sean $(X_1, \dots, X_n)$ las $n$ primeras componentes de la sucesión y $F_n$ la ojiva empírica asociada a la muestra aleatoria simple $(X_1, \dots, X_n)$ . Entonces la aplicación:

\begin{array}{rcl} \Delta_n : (X_1, \dots , X_n) & \longrightarrow & \mathbb{R} \\ (x_1, \dots, x_n) & \longmapsto & D_\infty(F_n, F) = \displaystyle \sup_{x \in \mathbb{R}} |F_n(x) - F(x)| \end{array}

cumple que:

\begin{align*} \Delta_n \xrightarrow[n \to \infty]{\text{c.s.}} 0 \end{align*}

💡Nota

Podemos observar que, al definir $\Delta_n$ como la distancia máxima entre la ojiva empírica y la función de distribución, el Teorema de Glivenko-Cantelli nos dice que la distancia entre ambas funciones tiende a $0$ casi seguramente cuando el tamaño muestral tiende a infinito. Es decir, que la ojiva empírica es un estimador consistente de la función de distribución.

📐Demostración

x \in \mathbb{R}

💡Nota

A través de este resultado, podemos ver que en un conjunto de muestras cualquiera de probabilidad 1, la función de distribución $F$ está determinada por la ojiva empírica de la forma siguiente:

\begin{align*} F_n(x) - \varepsilon < F(x) < F_n(x) + \varepsilon \quad \forall \varepsilon > 0, \quad \forall x \in \mathbb{R} \end{align*}

Es decir, que se puede estimar la función de distribución $F$ a partir de la ojiva empírica $F_n$ con un error arbitrariamente pequeño cuando el tamaño muestral es suficientemente grande.

Simulación

La simulación es una técnica que permite generar valores aleatorios de un estadístico cualquiera, a partir de los cuales se puede aproximar la función de distribución del estadístico mediante la ojiva empírica.

Generación de números aleatorios con distribución uniforme

Uno de los pasos básicos en la simulación es la generación de números aleatorios (o pseudo-aleatorios) con una distribución $\mathcal{U}(0, 1)$ .

💡Nota

Se dicen números pseudo-aleatorios a aquellos números que son generados mediante un algoritmo que, conociendo la semilla inicial, siempre generan la misma secuencia de números.

La mayoría de lenguajes de programación, calculadoras y software estadístico incluyen funciones para generar números pseudo-aleatorios con distribución uniforme en el intervalo $(0, 1)$ , como puede ser runif en R. Estos emplean algoritmos congruenciales tales que:

\begin{align*} n_{i + 1} = (a \cdot n_i + c) \mod m \end{align*}

Lo que genera una secuencia de números enteros $n_i \in [0, m - 1]$ que se pueden pasar al intervalo $[0, 1)$ dividiendo entre $m$ . La semilla inicial sería $n_0$ y los parámetros $a, c$ y $m$ .

Generación de valores aleatorios con distribución arbitraria

Para generar valores aleatorios con una distribución arbitraria $F$ se pueden emplear diversos métodos, que a menudo se combinan entre sí.

Método de Montecarlo

Esta técnica se basa en la generación de valores aleatorios de distribuciones a partir de generados aleatorios con distribución $\mathcal{U}(0, 1)$ . Para ello, sea $X$ una variable aleatoria que toma los valores $x_1, x_2, \dots, x_k$ con probabilidades $p_1, p_2, \dots, p_k$ , tales que $p_i > 0$ y $\sum_{i = 1}^{k} p_i = 1$ , para generar cada valor aleatorio de $X$ se sigue el siguiente procedimiento:

Partición de $[0, 1]$ en $k$ subintervalos $C_1, \dots, C_k$ de longitudes $p_1, \dots, p_k$ respectivamente.
Generación de un número aleatorio $u$ con distribución $U(0, 1)$ .
Ver en que subintervalo $C_i$ está $u$ , así:

\begin{align*} u \in C_j \implies \text{ valor generado de } X \text{ es } x_j \end{align*}

💡Nota

También es válido para variables aleatorias discretas no finitas, ya que en ese caso se puede considerar una partición infinita numerable de $[0, 1]$ .

✏️Ejemplo

Se considera la variable aleatoria discreta $X$ tal que:

\begin{align*} P(X = 1) = \frac{1}{2}, \qquad P(X = 1.5) = \frac{1}{3} , \qquad P(X = 3) = \frac{1}{6} \end{align*}

Para generar una muestra aleatoria de tamaño $5$ los pasos son:

Generar la partición del intervalo en 3 subintervalos con longitudes que correspondan con las probabilidades, es decir: $\frac{1}{2}$ , $\frac{1}{3}$ y $\frac{1}{6}$ :

\begin{align*} C_1 = \left[0, \frac{1}{2}\right), \quad C_2 = \left[\frac{1}{2}, \frac{5}{6}\right), \quad C_3 = \left[\frac{5}{6}, 1\right) \end{align*}

Lo que gráficamente se representa como:

TikZ Graph 2. Generar 5 números aleatorios $u_1, \dots, u_5$ con distribución $\mathcal{U}(0, 1)$ . Supongamos que los números generados son:

\begin{align*} u_1 = 0.23, \quad u_2 = 0.67, \quad u_3 = 0.91, \quad u_4 = 0.45, \quad u_5 = 0.12 \end{align*}

Ver en que subintervalo cae cada número generado:

\begin{array}{c|c|c} u_i & Subintervalo C_j & Valor generado de X \\ \hline u_1 = 0.23 & C_1 & 1 \\ u_2 = 0.67 & C_2 & 1.5 \\ u_3 = 0.91 & C_3 & 3 \\ u_4 = 0.45 & C_1 & 1 \\ u_5 = 0.12 & C_1 & 1 \end{array}

Lo que gráficamente se representa como:

TikZ Graph

💡Nota

Este procedimiento se puede aplicar en R con las distribuciones discretas más comunes mediante las funciones rbinom, rpois, rgeom, etc.

Método de transformación

Otra técnica para generar valores aleatorios con una distribución arbitraria $F$ continua es el método de transformación. Este método se basa en los generadores de números aleatorios con distribución $\mathcal{U}(0, 1)$ y la función inversa de la función de distribución $F$ .

Por el teorema de la la transformación de la distribución acumulada tenemos que si $X$ es continua entonces $F(X) \equiv \mathcal{U}(0, 1)$ . Por tanto, se genera un valor $u$ de $\mathcal{U}(0, 1)$ y se aplica la función inversa de la función de distribución $F$ para obtener el correspondiente valor de $X$ , es decir:

\begin{align*} x = F^{ - 1}(u) \end{align*}

✏️Ejemplo

Se considera la variable aleatoria $X \rightsquigarrow \mathcal{E}(\lambda)$ cuya función de distribución es:

\begin{align*} F(x) = \left(1 - e^{ - \lambda x}\right) \cdot I_{[0, \infty)} (x) \end{align*}

Ahora, para generar valores aleatorios de $X$ mediante el método de transformación, se sigue el siguiente procedimiento:

Generar un número aleatorio $u$ con distribución $\mathcal{U}(0, 1)$ .
Calcular la función inversa de la función de distribución $F$ :

\begin{align*} y = F(x) = 1 - e^{ - \lambda x} &\iff e^{ - \lambda x} = 1 - y \iff \\[2ex] & \iff - \lambda \cdot x = \log (1 - y) \iff x = - \frac{\log (1 - n)}{\lambda} \end{align*}

Aplicar la función inversa al número aleatorio generado:

\begin{align*} x = F^{ - 1} (u) = - \frac{1}{\lambda} \ln(1 - u) \end{align*}

Gráficamente, este procedimiento se representa como:

TikZ Graph

Transformación de Box-Muller

Aunque el método de transformación es aplicable a cualquier distribución continua, algunas distribuciones no tienen función inversa explícita, como es el caso de la normal. Para estos casos, se pueden emplea la transformación de Box-Muller.

Sean $U_1, U_2 \rightsquigarrow \mathcal{U}(0, 1)$ variables aleatorias independientes entonces:

\begin{align*} X = \sqrt{ - 2 \log (U_1)} \cdot \cos (2\pi U_2) \quad \text{ y } \quad Y = \sqrt{ - 2 \log (U_1)} \cdot \sin (2\pi U_2) \end{align*}

son variables aleatorias independientes con distribución $\mathcal{N}(0, 1)$ .

💡Nota

En R existen funciones para la generación de valores de las distribuciones continuas más comunes, como son rnorm, rexp, runif, etc.

Método de aceptación rechazo

Otro método para generar valores aleatorios de una distribución continua que no necesita la función inversa $F^{ - 1}$ es el método de aceptación-rechazo. Para este caso, se require de la función de densidad $f$ de la variable aleatoria $X$ y una acotación superior dada por $C \cdot g$ donde $g$ es otra función de densidad asociada a una variable aleatoria $Y$ de la que se puede calcular fácilmente la inversa de su función de distribución $G^{ - 1}$ . Es decir, que se necesita:

\begin{align*} f(x) \leq C \cdot g(x) \quad \forall x \in \mathbb{R}, \quad C > 0 \end{align*}

El procedimiento para generar un valor aleatorio de $X$ es el siguiente:

Generación de un valor de $Y$ a través de su función inversa empleando el método de transformación:

\begin{align*} a = G^{ - 1} (u_1) \quad \text{ con } u_1 \rightsquigarrow \mathcal{U}(0, 1) \end{align*}

Calculo de $f(a)$ y $C \cdot g(a)$ .
Generación de otro número aleatorio $b$ a través de $\mathcal{U}(0, C g(a))$
Si $b < f(a)$ se acepta $a$ como valor generado de $X$ , en caso contrario se rechaza y se vuelve al paso 1.

Gráficamente, este procedimiento se representa como:

TikZ Graph

Validez del método de aceptación-rechazo. Proposición

Sea $X$ variable aleatoria con función de densidad $f$ , el método de aceptación-rechazo genera valores de una variable con función de densidad $f$ .

📐Demostración

\begin{align*} X = Y |_{\text{No rechazo}} \end{align*}

✏️Ejemplo

Sea $X$ variable aleatoria normal estándar, es decir, $X \rightsquigarrow \mathcal{N}(0, 1)$ con función de densidad:

\begin{align*} f(x) = \frac{1}{\sqrt{2\pi}} e^{ - \frac{x^2}{2}} \quad x \in \mathbb{R} \end{align*}

Se sabe sabe que la función de distribución no tiene una expresión implícita y, por tanto, tampoco su inversa. Sin embargo, sabemos que la función de densidad alcanza su máximo en $x^* = \mu = 0$ , donde vale:

\begin{align*} f(x^*) = f(0) = \frac{1}{\sqrt{2\pi}} \end{align*}

Además, si $x \notin [ - 1, 1]$ entonces:

\begin{align*} x^2 > |x| \implies f(x) < \frac{1}{\sqrt{2\pi}} e^{ - \frac{|x|}{2}} \end{align*}

Por lo que, podemos acotar $f$ mediante la función $g_1$ definida como:

\begin{align*} g_1(x) = \left\{ \begin{array}{ll} \dfrac{1}{\sqrt{2\pi}} & \text{ si } x \in [ - 1, 1] \\[4ex] \dfrac{1}{\sqrt{2\pi}} e^{ - \frac{|x|}{2}} & \text{ si } x \notin [ - 1, 1] \end{array} \right. \end{align*}

Que cumple:

$f(x) \leq g_1(x)$ para todo $x \in \mathbb{R}$
La integral de $g$ es finita:

\begin{align*} \int_{ - \infty}^{\infty} g(x) \, dx = \sqrt{\frac{2}{\pi}} \cdot \left(2e^{ - \frac{1}{2}} + 1\right) \approx 1.766 = C \end{align*}

Por lo tanto, definimos la función de densidad $g$ como:

\begin{align*} g \coloneq \frac{1}{C} g_1 \end{align*}

La función inversa de la función de distribución $G$ asociada a $g$ es:

\begin{align*} G^{ - 1}(y) = \left\{ \begin{array}{ll} \log \left(\dfrac{\pi}{2} y^2\right) & \text{ si } y \in \left(0, \sqrt{\frac{2}{\pi e}}\right)\\[4ex] \sqrt{2\pi} - \dfrac{2}{\sqrt{e}} - 1 & \text{ si } y \in \left[\sqrt{\frac{2}{\pi e}}, \sqrt{\frac{2}{\pi e}} + \sqrt{\frac{2}{\pi}}\right]\\[4ex] - 2 \log \left(1 + \dfrac{2}{\sqrt{e}} - \sqrt{\dfrac{2}{\pi}} y\right) & \text{ si } y \in \left(\sqrt{\frac{2}{\pi e}} + \sqrt{\frac{2}{\pi}}, 1\right) \end{array} \right. \end{align*}

Por tanto, se puede generar valores aleatorios de la distribución normal estándar mediante el método de aceptación-rechazo con $g$ y $C$ definidos anteriormente.

Inferencia - Tema 1

Estadígrafos de orden

Estadígrafo. Definición

💡Observación

Estimador. Definición

Muestra ordenada. Definición

💡Nota

✏️Ejemplo

💡Nota

Estadígrafos de orden. Definición

✏️Ejemplo

💡Observación

Propiedades de los estadígrafos de orden. Proposición

📐Demostración

✏️Ejemplo

Función de densidad del estadígrafo de orden kkk. Proposición

📐Demostración

💡Nota

Densidad conjunta de la muestra ordenada. Teorema

💡Nota

💡Nota

📐Demostración

💡Teorema del Cambio de Variable

Ojiva empírica

Ojiva empírica. Definición

💡Nota

✏️Ejemplo

Propiedades de la ojiva empírica. Proposición

📐Demostración

💡Nota

Teorema de Glivenko-Cantelli

💡Nota

📐Demostración

💡Nota

Simulación

Generación de números aleatorios con distribución uniforme

💡Nota

Generación de valores aleatorios con distribución arbitraria

Método de Montecarlo

💡Nota

✏️Ejemplo

💡Nota

Método de transformación

✏️Ejemplo

Transformación de Box-Muller

💡Nota

Método de aceptación rechazo

Validez del método de aceptación-rechazo. Proposición

📐Demostración

✏️Ejemplo

Función de densidad del estadígrafo de orden $k$ . Proposición