KDE – Método De Plug-In Directo
Un resumen rápido: en el Manual de optimización de KDE, derivamos la fórmula para el ancho de banda óptimo y el AMISE mínimo, de la siguiente manera:
Donde:
se define así: y son cantidades constantes conocidas determinadas por la selección de la función kernel (p. ej., gaussiana).
El principal problema al usar la fórmula anterior en la práctica es que no sabemos
¿Cómo podemos superar este problema? Podemos estimar
Antes de continuar, debemos presentar un buen truco matemático: suponiendo que
Entonces, si vamos a aplicarlo a
Recordemos que
En efecto, convertimos
Donde
Estimación
Usando un estimador KDE con función kernel
Conectando
La siguiente pregunta es qué es
Bajo ciertos supuestos de regularidad (Wand y Jones (1995)), el sesgo asintótico y la varianza de
Y el ancho de banda óptimo de AMSE es:
Donde:
es el número de etapas, siempre que .
- Para
(Método Silverman), comenzamos con una distribución conocida (por ejemplo, Gaussiana), calculamos (analíticamente), y calculamos el ancho de banda óptimo. - Para
(Método de Plug-in directo), empezamos con distribución conocida (ej., Gaussiana). Entonces:- Calcule
(analíticamente). - Etapa 1:
- Calcule el valor de ancho de banda óptimo para estimar
- Calcule
.
- Calcule el valor de ancho de banda óptimo para estimar
- Etapa 2:
- Calcule el valor de ancho de banda óptimo para estimar
- Calcule
.
- Calcule el valor de ancho de banda óptimo para estimar
- Calcule el ancho de banda óptimo de KDE.
- Calcule
- Para
(método Direct Plug-in), comenzamos con una distribución conocida (por ejemplo, Gaussiana). Después:- Calcule
(analíticamente). - Etapa 1:
- Calcule el valor de ancho de banda óptimo para estimar
. - Calcule
.
- Calcule el valor de ancho de banda óptimo para estimar
- Etapa 2:
- Calcule el valor de ancho de banda óptimo para estimar
. - Calcule
.
- Calcule el valor de ancho de banda óptimo para estimar
- Etapa 3:
- Calcule el valor de ancho de banda óptimo para estimar
. - Calcule
.
- Calcule el valor de ancho de banda óptimo para estimar
- Etapa 4:
- Calcule el valor de ancho de banda óptimo para estimar
. - Calcule
.
- Calcule el valor de ancho de banda óptimo para estimar
- Calcule el ancho de banda óptimo de KDE.
- Calcule
Por lo general, dos etapas (
Método de Plug-in Directo (Sheather & Jones)
Este es el método propuesto por Sheather y Jones (1991), donde consideran
- Usando los datos de la muestra, calcule
. - Suponga una distribución subyacente gaussiana (ej.,
), luego calcule (analíticamente) . - Calcule el ancho de banda óptimo para
, : - Estime
: - Calcule el ancho de banda óptimo para
, : - Estime
: - Ahora, usando
como un estimado para :
Conclusión
En este artículo, asumimos que la función kernel
El método de complemento directo de Sheather y Jones es popular en la práctica para un amplio conjunto de casos, y ofrece un buen rendimiento para densidades uniformes, al menos en simulación.
Referencias
- Silverman, B.W. (1986). Density Estimation for Statistics and Data Analysis. Chapman & Hall/CRC London.
- W. Zucchini, Applied smoothing techniques, Part 1 Kernel Density Estimation., 2003.
- Byeong U. Park and J. S. Marron. Comparison of Data-Driven Bandwidth Selectors. Journal of the American Statistical Association Vol. 85, No. 409 (Mar., 1990), pp. 66-72 (7 pages).
- S.J. Sheather and M.C. Jones. A reliable data-based bandwidth selection method for kernel density estimation. J. Royal Statist. Soc. B, 53:683-690, 1991.