8.3 Relaciones entre los métodos de remuestreo bajo censura

8.3.1 Equivalencia entre el bootstrap simple y el obvio

Es fácil demostrar que el bootstrap simple y el obvio son planes de remuestreo equivalentes (cuando se supone que en la muestra no existe ninguna observación no censurada que esté empatada con otra censurada). Esta equivalencia se establece en el sentido de que la distribución bootstrap de \(\left( T^{\ast},\delta^{\ast} \right)\) es la misma para cualquiera de los dos métodos.

Así, si \(\left( T^{\ast},\delta^{\ast} \right)\) se genera mediante el método obvio, entonces

\[\begin{aligned} P^{\ast}\left( T^{\ast}>t \right) &= P^{\ast}\left( X^{\ast}>t,C^{\ast }>t \right) \\ &= P^{\ast}\left( X^{\ast}>t \right) P^{\ast}\left( C^{\ast}>t \right) =\left( 1-\hat{F}\left( t \right) \right) \left( 1-\hat{G}\left( t \right) \right) \\ &= \left[ \prod_{T_{(i)}\leq t}\left( \frac{n-i}{n-i+1} \right) ^{\delta _{(i)}}\right] \left[ \prod_{T_{(i)}\leq t}\left( \frac{n-i}{n-i+1} \right)^{1-\delta _{(i)}}\right] \\ &= \prod_{T_{(i)}\leq t}\frac{n-i}{n-i+1}=\prod_{i=1}^{\#\left \{ T_{(j)}\leq t\right\} }\frac{n-i}{n-i+1} \\ &= \frac{n-1}{n}\cdot \frac{n-2}{n-1}\cdot \cdots \cdot \frac{n-\#\left\{ T_{(j)}\leq t\right\} }{n-\#\left\{ T_{(j)}\leq t\right\} +1} \\ &= \frac{n-\#\left\{ T_{(j)}\leq t\right\} }{n}=1-H_n\left( t \right) =\frac{\#\left\{ T_{(j)}>t\right\} }{n}, \end{aligned}\]

siendo \(H_n\left( t \right)\) la distribución empírica de la muestra \(\left( T_1,T_2,\ldots ,T_n \right)\).

Esto demuestra que la distribución bootstrap marginal de \(T^{\ast}\) es la misma para ambos remuestreos. Sólo resta probar pues que la distribución condicionada \(\left. \delta^{\ast}\right\vert _{T^{\ast}=T_i}\) es idéntica en ambos casos. Pero esto es inmediato ya que, en los dos remuestreos esa distribución condicionada es la degenerada en el valor \(\delta _i\).

8.3.2 El bootstrap de Reid

Es otro método alternativo propuesto por Reid (1981). Consta de los siguientes pasos:

  1. Construir el estimador de Kaplan-Meier, \(\hat{F}\left( t \right)\), de la muestra original.

  2. Arrojar remuestras bootstrap (todas formadas por observaciones no censuradas, \(T_i^{\ast}\), \(i=1,2,\ldots ,n\)) a partir de \(\hat{F}\left(t \right)\).

  3. Aproximar la distribución en el muestreo de \(R\left( \mathbf{T},\boldsymbol{\delta} \right)\), por la distribución bootstrap de \(R\left( \mathbf{T}^{\ast},\mathbf{1} \right)\), siendo \(\mathbf{1}\) el vector formado por \(n\) unos.

8.3.3 Validez de los planes de remuestreo

Akritas (1986) demuestra que los procesos bootstrap \[\begin{aligned} \sqrt{n}\left( \hat{F}^{\ast}_{Efron}\left( t \right) - \hat{F}\left( t \right) \right) \\ \sqrt{n}\left( \hat{F}^{\ast}_{Reid} \left( t \right) - \hat{F}\left( t \right) \right) \end{aligned}\] tienden a sendos procesos límite distintos. Aquí \(\hat{F}^{\ast}_{Efron}\) denota la versión bootstrap del estimador de Kaplan-Meier bajo el remuestreo de Efron (cualquiera de ellos, ya que el remuestreo simple y el obvio son equivalentes) y \(\hat{F}^{\ast}_{Reid}\) es la correspondiente versión bootstrap del estimador de Kaplan-Meier bajo el remuestreo de Reid (una distribución empírica, al fin y al cabo, porque en el remuestreo de Reid todas las observaciones son no censuradas).

Además el proceso límite del estimador de Kaplan-Meier, \(\sqrt{n} \left( \hat{F}\left( t \right) -F\left( t \right) \right)\), es el mismo que el del bootstrap de Efron. Como consecuencia el remuestreo de Efron es consistente y el de Reid es inconsistente.