8.2 Remuestreos Bootstrap en presencia de censura
Estos métodos tratan del mecanismo bootstrap para aproximar la distribución de un estadístico, \(R\left( \mathbf{T}, \boldsymbol{\delta} \right)\), siendo \(\mathbf{T}=\left( T_1, T_2, \ldots,T_n \right)\) y \(\boldsymbol{\delta}=\left( \delta _1,\delta_2, \ldots ,\delta _n \right)\). Los dos siguientes métodos de remuestreo fueron propuestos por Efron (1981).
8.2.1 El bootstrap simple
Procede de la siguiente forma:
Construir la distribución empírica bidimensional, \(F_n^{T,\delta }\), de la muestra \(\left\{ \left( T_1,\delta _1 \right), \left( T_2,\delta _2 \right), \ldots, \left( T_n,\delta _n \right) \right\}\).
Arrojar remuestras \(\left\{ \left( T_1^{\ast},\delta _1^{\ast} \right), \left( T_2^{\ast},\delta _2^{\ast} \right), \ldots, \left( T_n^{\ast},\delta _n^{\ast} \right) \right\}\) a partir de dicha distribución empírica. Esto es tanto como decir que\[P^{\ast}\left( \left( T^{\ast},\delta^{\ast} \right) =\left( T_i,\delta _i \right) \right) =\frac{1}{n}\text{, para }i=1,2,\ldots ,n\text{.}\]
Evaluar el estadístico de interés en el vector que contiene la remuestra bootstrap: \(R^{\ast}=R\left( \mathbf{T}^{\ast}, \boldsymbol{\delta}^{\ast} \right)\), con \(\mathbf{T}^{\ast} =\left( T_1^{\ast},T_2^{\ast},\ldots ,T_n^{\ast} \right)\) y
\(\boldsymbol{\delta}^{\ast}=\left( \delta _1^{\ast},\delta _2^{\ast},\ldots ,\delta _n^{\ast} \right)\).
Aproximar la distribución en el muestreo del estadístico \(R\left( \mathbf{T}, \boldsymbol{\delta} \right)\) por la distribución en el remuestreo de \(R\left( \mathbf{T}^{\ast},\boldsymbol{\delta}^{\ast} \right)\).
Este método es de muy rápida implementación y ejecución.
8.2.2 El bootstrap obvio
Para detallar el método es necesario definir el estimador de Kaplan-Meier, \(\hat{G}\left( t \right)\), de la variable censurante, a partir de\[1-\hat{G}\left( t \right) =\prod_{T_{(i)}\leq t}\left( \frac{n-i }{n-i+1} \right)^{1-\delta _{(i)}}.\] Observemos que este estimador es totalmente semejante al de Kaplan-Meier de la variable de interés pero simplemente reemplazando cada valor \(\delta _{(i)}\) por \(1-\delta _{(i)}\).
El mecanismo de remuestreo procede como sigue:
Construir los estimadores de Kaplan-Meier de las distribuciones de la variable de interés, \(\hat{F}\left( t \right)\), y de la variable censurante, \(\hat{G}\left( t \right)\).
Para cada índice \(i=1,2,\ldots ,n\), arrojar observaciones bootstrap independientes, \(X_i^{\ast}\) con distribución \(\hat{F}\ \)y \(C_i^{\ast}\) con distribución \(\hat{G}\).
Definir \(T_i^{\ast}=\min \left\{ X_i^{\ast},C_i^{\ast}\right\}\) y \(\delta_i^{\ast}=\mathbf{1}_{\left\{ X_i^{\ast}\leq C_i^{\ast}\right\}}\), para \(i = 1, 2, \ldots, n\), y considerar la remuestra bootstrap \(\left( \mathbf{T}^{\ast},\boldsymbol{\delta}^{\ast}\right)\), con \(\mathbf{T}^{\ast}=\left( T_1^{\ast},T_2^{\ast}, \ldots, T_n^{\ast} \right)\) y \(\boldsymbol{\delta}^{\ast} = \left( \delta_1^{\ast}, \delta_2^{\ast},\ldots ,\delta_n^{\ast} \right)\).
Aproximar la distribución en el muestreo del estadístico \(R\left( \mathbf{T},\boldsymbol{\delta} \right)\) por la distribución en el remuestreo de su análogo bootstrap, \(R\left( \mathbf{T}^{\ast},\boldsymbol{\delta}^{\ast} \right)\).
Obviamente, este método de remuestreo imita fielmente el modelo de datos censurados por la derecha. Su ejecución es considerablemente más lenta que la del método simple, pues necesita de la construcción de los estimadores de Kaplan-Meier, de la obtención de remuestras a partir de ellos y de algunos cálculos adicionales.