4
C. R. Acad. Sci. Paris, Ser. I 337 (2003) 67–70 Statistique/Probabilités Vitesse de convergence uniforme presque sûre de l’estimateur linéaire par méthode d’ondelettes Anne Massiani Université Paris 6, LSTA, boîte 158, 175, rue du Chevaleret, 75013 Paris, France Reçu le 20 février 2003 ; accepté le 19 mai 2003 Présenté par Paul Deheuvels Résumé Nous établissons une loi du logarithme itéré en norme uniforme pour l’estimateur linéaire par méthode d’ondelettes. La preuve de ce résultat est basée sur une loi du logarithme itéré fonctionnelle pour les accroissements du processus empirique uniforme démontrée par Deheuvels et Mason (Ann. Probab. 20 (1992) 1248–1287). Pour citer cet article : A. Massiani, C. R. Acad. Sci. Paris, Ser. I 337 (2003). 2003 Académie des sciences. Publié par Éditions scientifiques et médicales Elsevier SAS. Tous droits réservés. Abstract Rate of almost sure uniform convergence of the linear wavelet density estimator. We establish an uniform law of the iterated logarithm for the linear wavelet density estimator. A key tool in the proof of this result is the functional law of the iterated logarithm for the increments of the empirical process proved by Deheuvels and Mason (Ann. Probab. 20 (1992) 1248– 1287). To cite this article: A. Massiani, C. R. Acad. Sci. Paris, Ser. I 337 (2003). 2003 Académie des sciences. Publié par Éditions scientifiques et médicales Elsevier SAS. Tous droits réservés. 1. Introduction Au cours de la dernière décennie, le problème de l’estimation non paramétrique d’une densité f par la méthode des ondelettes a intéressé de nombreux statisticiens. Leurs travaux concernent l’estimateur linéaire introduit par Doukhan et Léon [3], ainsi que les estimateurs non linéaire dits « à seuil» considérés, entre autres, par Donoho et Johnstone [2], puis par Hall, Kerkyacharian et Picard [6]. Härdle et al. [7] ont décrit de façon détaillée le comportement asymptotique du risque L p de cet estimateur lorsque la densité f appartient aux espaces de Sobolev ou de Besov. Citons également Zhang et Zheng [10] qui ont démontré la normalité asymptotique de l’erreur L 2 pour l’estimateur linéaire, et qui en déduisent un test d’ajustement de la densité. Nous prouvons ici une loi du logarithme itéré uniforme pour l’estimateur linéaire par méthode d’ondelettes, ce qui fournit une autre mesure largement acceptée dans la littérature des performances de cet estimateur. Des Adresse e-mail : [email protected] (A. Massiani). 1631-073X/03/$ – see front matter 2003 Académie des sciences. Publié par Éditions scientifiques et médicales Elsevier SAS. Tous droits réservés. doi:10.1016/S1631-073X(03)00259-0

Vitesse de convergence uniforme presque sûre de l'estimateur linéaire par méthode d'ondelettes

Embed Size (px)

Citation preview

Page 1: Vitesse de convergence uniforme presque sûre de l'estimateur linéaire par méthode d'ondelettes

ttes. Laempirique

eof the2) 1248–

oduit paronoho et

rng [10]est

lettes,ateur. Des

C. R. Acad. Sci. Paris, Ser. I 337 (2003) 67–70

Statistique/Probabilités

Vitesse de convergence uniforme presque sûrede l’estimateur linéaire par méthode d’ondelettes

Anne Massiani

Université Paris 6, LSTA, boîte 158, 175, rue du Chevaleret, 75013 Paris, France

Reçu le 20 février 2003 ; accepté le 19 mai 2003

Présenté par Paul Deheuvels

Résumé

Nous établissons une loi du logarithme itéré en norme uniforme pour l’estimateur linéaire par méthode d’ondelepreuve de ce résultat est basée sur une loi du logarithme itéré fonctionnelle pour les accroissements du processusuniforme démontrée par Deheuvels et Mason (Ann. Probab. 20 (1992) 1248–1287).Pour citer cet article : A. Massiani, C. R.Acad. Sci. Paris, Ser. I 337 (2003). 2003 Académie des sciences. Publié par Éditions scientifiques et médicales Elsevier SAS. Tous droits réservés.

Abstract

Rate of almost sure uniform convergence of the linear wavelet density estimator. We establish an uniform law of thiterated logarithm for the linear wavelet density estimator. A key tool in the proof of this result is the functional lawiterated logarithm for the increments of the empirical process proved by Deheuvels and Mason (Ann. Probab. 20 (1991287).To cite this article: A. Massiani, C. R. Acad. Sci. Paris, Ser. I 337 (2003). 2003 Académie des sciences. Publié par Éditions scientifiques et médicales Elsevier SAS. Tous droits réservés.

1. Introduction

Au cours de la dernière décennie, le problème de l’estimation non paramétrique d’une densitéf par la méthodedes ondelettes a intéressé de nombreux statisticiens. Leurs travaux concernent l’estimateur linéaire intrDoukhan et Léon [3], ainsi que les estimateurs non linéaire dits « à seuil » considérés, entre autres, par DJohnstone [2], puis par Hall, Kerkyacharian et Picard [6].

Härdle et al. [7] ont décrit de façon détaillée le comportement asymptotique du risqueLp de cet estimateulorsque la densitéf appartient aux espaces de Sobolev ou de Besov. Citons également Zhang et Zhequi ont démontré la normalité asymptotique de l’erreurL2 pour l’estimateur linéaire, et qui en déduisent un td’ajustement de la densité.

Nous prouvons ici une loi du logarithme itéré uniforme pour l’estimateur linéaire par méthode d’ondece qui fournit une autre mesure largement acceptée dans la littérature des performances de cet estim

Adresse e-mail :[email protected] (A. Massiani).

1631-073X/03/$ – see front matter 2003 Académie des sciences. Publié par Éditions scientifiques et médicales Elsevier SAS. Tous droitsréservés.doi:10.1016/S1631-073X(03)00259-0

Page 2: Vitesse de convergence uniforme presque sûre de l'estimateur linéaire par méthode d'ondelettes

68 A. Massiani / C. R. Acad. Sci. Paris, Ser. I 337 (2003) 67–70

pour untants dansmpiriqueimateurel où desHall [5]),à noyau

r souci degageons

nnue

)mateur à

lementt

ines) :

résultats analogues ont déja été établis par Stute [9], par Hall [4], et enfin par Deheuvels et Mason [1],autre estimateur classique de la densité, l’estimateur à noyau de Parzen–Rosenblatt. Un des outils impornotre démonstration est la loi du logarithme itéré fonctionnelle pour les accroissements du processus euniforme obtenue par Deheuvels et Mason [1]. Notons qu’une loi du logarithme itéré ponctuelle pour l’estlinéaire par méthode d’ondelettes figure dans Massiani [8]. Remarquons que contrairement au cas poncturésultats similaires existent aussi pour la plus large classe des estimateurs dits « à noyau généralisé » (cf.il n’existe pas à notre connaissance de loi du logarithme itéré en norme uniforme pour ces estimateursgénéralisé, de laquelle notre résultat pourrait se déduire.

La section suivante est consacrée à la présentation détaillée de cet estimateur et de notre résultat. Paconcision, la preuve complète de notre loi du logarithme itéré ne peut bien sûr être développée ici. Nous décependant dans la Section 3 la structure générale de cette preuve.

2. Présentation de notre résultat

Soit X1,X2, . . . une suite de variables aléatoires indépendantes et équidistribuées, de densité incof

appartenant àL2(R), que l’on cherche à estimer.Soit égalementϕ une fonction d’échelle, supposée à support compact. Posons, pour toutx, y ∈ R :

K(x,y) =∑k∈Z

ϕ(x − k)ϕ(y − k). (1)

On peut alors estimerf à partir des observationsX1, . . . ,Xn par la fonctionfn définie pour toutx ∈ R par :

fn(x) = 2jn

n

n∑i=1

K(2jnx,2jnXi

), (2)

où jn est un niveau d’analyse multirésolution qui varie avec la taille de l’échantillonn. L’estimateur défini par (2est une expression classique de l’estimateur linéaire par méthode d’ondelettes sous la forme d’un estinoyau généralisé (cf. Härdle et al. [7], p. 127).

Dans la suite, nous désignons par[a] la partie entière d’un réela. La loi du logarithme itéréprésentée ci-après est valable si le niveau d’analyse multirésolutionjn est tel quejn = [dn], où la suite{λn =2−dn, n � 1} vérifie les conditions de Csörgo–Révész–Stute suivantes :

0 < λn < 1 pourn � 1, λn ↓ 0, et nλn ↑ ∞, quandn → ∞, (3)

log(λ−1n )

log logn→ ∞ quandn → ∞, (4)

nλn

logn→ ∞ quandn → ∞. (5)

Théorème 2.1. Supposons queϕ est une fonction continue à gauche et à variations bornées. Supposons égaquejn = [dn], où la suite{λn = 2−dn , n � 1} vérifie les conditions(3), (4), et (5). Si la densitéf est continue estrictement positive sur un intervalle[A,B], alors pour toutA < C < D < B, l’estimateurfn défini par(2)vérifie:

limn→∞ sup

C�x�D

(n

2jn log(2jn)

)1/2

± fn(x) − Efn(x)

(f (x)∫ ∞−∞ K2(2jnx, u) du)1/2

= 1. (6)

Remarque 1. Rappelons que la quantité∫ ∞−∞ K2(2jnx, u) du intervenant dans notre résultat vérifie, pour certa

constantesM et M ′ strictement positives et indépendantes dex et den (cf. Massiani [8] pour plus de précisionsM �

∫ ∞−∞ K2(2jnx, u) du � M ′, pour toutx ∈ R et toutn � 1.

Page 3: Vitesse de convergence uniforme presque sûre de l'estimateur linéaire par méthode d'ondelettes

A. Massiani / C. R. Acad. Sci. Paris, Ser. I 337 (2003) 67–70 69

tresarian,

heuvels etsuspiriquen de la

tionss

eque

vient,

Remarque 2. La fonction de Haarϕ = 1]0,1] satisfait bien sûr les conditions du Théorème 2.1, mais d’auexemples de telles fonctionsϕ peuvent être fournis par la construction de Daubechie (cf. Härdle, KerkyachPicard et Tsybakov [7], Chapitre 7).

3. Eléments de démonstrations

La preuve du théorème 2.1 repose sur une idée inspirée de la démonstration du théorème 4.1 de DeMason [1]. Cette idée consiste à exprimer la quantitéfn(x) − Efn(x) en fonction des accroissements du procesempirique, puis à utiliser la loi du logarithme itéré fonctionnelle pour les accroissements du processus emuniforme établie par Deheuvels et Mason [1]. Avant de rappeler ce résultat, nous explicitons l’expressioquantitéfn(x) − Efn(x) qui est employée dans notre démonstration (cf. formule (11)).

Nous supposons ici que le support deϕ est inclus dans]−L,L[ , oùL ∈ N. Posons, pour tousx, y ∈ R :

K(x, y) = K(x + 2L,y), et fn(x) = 2jn

n

n∑i=1

K(2jnx,2jnXi

).

Remarquons que :

K(x, y) = 0 si y − x ∈]−∞,0] ∪ [4L,+∞[ . (7)

De plus :

fn(x) = fn

(x + 2L

2jn

), pour toutx ∈ R.

Puisquef est continue sur[A,B] et que 2−jn → 0 quandn → ∞, il suffit donc de démontrer que pour tousC etD tels queA < C < D < B, on a, presque sûrement :

limn→∞ sup

C�x�D

(n

2jn log(2jn)

)1/2

± fn(x) − Efn(x)

(f (x)∫ ∞−∞ K2(2jnx, u) du)1/2

= 1. (8)

Pour cela, commençons par remarquer quefn(x) − Efn(x) = 2jn∫ ∞−∞ K(2jnx,2jny) d(Fn(y) − F(y)), où F

désigne la fonction de répartition desXi , et Fn la fonction de répartition empirique basée sur les observaX1, . . . ,Xn, qui est définie poury ∈ R parFn(y) = 1

n

∑ni=1 1{Xi�y}. Soit alorsU1,U2, . . . une suite de variable

aléatoires indépendantes de loi uniforme sur[0,1]. NotonsUn(u) = 1n

∑ni=1 1{Ui�u}, pour 0� u � 1, la fonction

de répartition empirique basée sur les observationsU1, . . . ,Un, et désignons parαn le processus empiriquuniforme défini parαn(u) = √

n(Un(u) − u), pour 0� u � 1. On peut supposer sans perte de généralitéFn(x) = Un(F (x)), pour toutx ∈ R. Ainsi, après un changement de variable et une intégration par parties, ilen utilisant (7) :

fn(x) − Efn(x) = 2jn

n1/2

4L∫0

[αn

(F

(x + u

2jn

))− αn

(F(x)

)]dK

(2jnx,2jnx + u

). (9)

Définissons maintenant, pour 0< a < 1, 0� u � 1, et 0� t � 1 :

ξn(a, t, u) = αn(t + ua) − αn(t), (10)

et posons, pourC � x � D et 0� u � 4L :

an = supC�x�D

{F

(x + 4L

2jn

)− F(x)

}, vn(x,u) = a−1

n

(F

(x + u

2jn

)− F(x)

).

Page 4: Vitesse de convergence uniforme presque sûre de l'estimateur linéaire par méthode d'ondelettes

70 A. Massiani / C. R. Acad. Sci. Paris, Ser. I 337 (2003) 67–70

ui décritlé dans le

e

dis que

es, Ann.

Ser. I 310

) 47–61.6 (1998)

w York,

556.

ory

On obtient grâce à (9), pourC � x � D et 0� u � 4L :

fn(x) − Efn(x) = 2jn

n1/2

4L∫0

ξn

(an,F (x), vn(x,u)

)dK

(2jnx,2jnx + u

). (11)

Pour poursuivre la démonstration, on peut alors utiliser le théorème 3.1 de Deheuvels et Mason [1] qle comportement asymptotique des accroissements du processus empirique uniforme, et qui est rappeThéorème A ci-après. Notons S l’ensemble de Strassen constitué des fonctionsg définies sur[0,1] qui sontabsolument continues et telles que :

g(u) =u∫

0

h(s) ds oùh ∈ L2(R) vérifie

1∫0

h2(u) du � 1. (12)

Pourε > 0, on désigne alors par Sε l’ensemble des fonctionsg bornées sur[0,1] telles qu’il existegε ∈ S vérifiant :sup0�u�1 |g(u) − gε(u)| � ε.

Théorème A (Deheuvels et Mason [1]).Soit{λn, n � 1} une suite vérifiant les conditions de Csörg˝o–Révész–Stut(3), (4), et (5). Pour toutε > 0, il existe presque sûrement unNε fini tel que sin � Nε, alors :{(

2λn log(λ−1

n

))−1/2ξn(λn, t, ·), 0 � t � 1− λn

} ⊂ Sε. (13)

De plus, pour toutg ∈ S, et toutε > 0, il existe presque sûrement unN ′ε,g fini tel que sin � N ′

ε,g , alors, il existet ∈ [0,1− λn] vérifiant:

sup0�u�1

∣∣(2λn log(λ−1

n

))−1/2ξn(λn, t, u) − g(u)

∣∣ � ε. (14)

La preuve de la majoration de la limite intervenant dans la formule (8) est basée sur la relation (13), tanla minoration de la limite repose sur une légère adaptation de la relation (14).

Remerciements

Je remercie sincèrement M. Daniel Pierre-Loti-Viaud pour ses précieux conseils.

Références

[1] P. Deheuvels, D.M. Mason, Fonctional laws of the iterated logarithm for the increments of empirical and quantile processProbab. 20 (1992) 1248–1287.

[2] D. Donoho, I. Johnstone, Minimax risk overlp -balls forLp -error, Probab. Theory Related Fields 99 (1994) 277–303.[3] P. Doukhan, J. Leon, Déviation quadratique d’estimateurs d’une densité par projection orthogonale, C. R. Acad. Sci. Paris,

(1990) 425–430.[4] P. Hall, On the law of the iterated logarithm for density estimators, Statist. Probab. Lett. 9 (1990) 237–240.[5] P. Hall, Laws of the iterated logarithm for nonparametric density estimator, Z. Wahrscheinlichkeitstheorie Verw. Gebiete 56 (1981[6] P. Hall, G. Kerkyacharian, D. Picard, Block threshold rules for curve estimation using kernel and wavelet methods, Ann. Statist. 2

922–942.[7] W. Härdle, G. Kerkyacharian, D. Picard, A. Tsybakov, Wavelets, Approximation, and Statistical Applications, Springer-Verlag, Ne

1998.[8] A. Massiani, Etude asymptotique locale de l’estimateur par méthode d’ondelettes, C. R. Math. Acad. Sci. Paris 335 (2002) 553–[9] W. Stute, A law of the iterated logarithm for kernel density estimators, Ann. Probab. 10 (1982) 414–422.

[10] S. Zhang, Z. Zheng, On the asymptotic normality forL2-error of wavelet density estimator with application, Comm. Statist. TheMethods 28 (5) (1999) 1093–1104.