6
C. R. Acad. Sci. Paris, t. 328, SCrie I, p. 521-526, 1999 Statistique/Sfatist (ProbabilitcWfrobabilify Theory) Un test d’auto-similarit pour les processus gaussiens A accroissements stationnaires Jean-Marc BARDET Lahoratoire de statistique et probabilitts, Universitk Paul-Sabatier, 118, route de Narbonne, 31062 Toulouse crdrx, France Courriel : bardet&ict.fr (Rryu 1~ 18 ckemhrr 1998, accept6 lr 11 janvier 1999) R&urn& Cette Note propose un test d’auto-similar% pour une serie d’observations provenant d’un processus gaussien a accroissements stationnaires. Ce test repose sur I’estimation d’une distance entre le processus consider6 et un ensemble de processus contenant tous les mouvements browniens fractionnaires. Cette distance est construite a partir d’une double estimation de l’esperance des variations quadratiques g&nCralisCes considerees pour une gamme d’echelles temporelles. La seconde de ces estimations fait appel 2 I’estimation du parametre d’auto-similarit par des methodes de regression qui prescntent une vitcsse dc convcrgencc comparable 21celle obtenue par estimation par maximum de vraisemblance, tout en presentant une vitesse de calcul avantageuse et une plus grande robustesse. 0 AcadCmie des SciencesElsevier, Paris Testing self-similarity of Gaussian processes with stationary increments Abstract. In this Note, we present a method,for testing self-similarity of discretized observations of a Gaussian process with stationary increments. The test is based on the estimation of a distance between the process and a set of processes containing all the fractional Brownian motions. This distance is constructed from two e.stimations of multiscule generalized quadratic variations expectations. The second estimation requires to estimate by regre.rsinn the self-similarity index H. Both these estimators of H present good robustness and computing time properties compared with maximum likelihood approach, with nearly similar convergence rate. 0 Academic des SciencestElsevier, Paris A bridged English Version We propose to test self-similarity of a Gaussian process with stationary increments, from a fixed step discretization of this process. A process 2 = ( (Zt) : t E R} is self-similar with index H > 0 if, for all d E N*, for all (tl,. , h) E R”, and for all c E W+ : (X,,: . . . yX,,) g (cmHXr+, , . . . ~ ccHXctc,). Note pr6Sent6e par Jean-Pierre KAffmm. 0764~4442/99/03280.52 I 0 Acadkmie des ScienceslElsevier, Paris 521

Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

Embed Size (px)

Citation preview

Page 1: Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

C. R. Acad. Sci. Paris, t. 328, SCrie I, p. 521-526, 1999 Statistique/Sfatist (ProbabilitcWfrobabilify Theory)

Un test d’auto-similarit pour les processus gaussiens A accroissements stationnaires

Jean-Marc BARDET

Lahoratoire de statistique et probabilitts, Universitk Paul-Sabatier, 118, route de Narbonne, 31062 Toulouse crdrx, France Courriel : bardet&ict.fr

(Rryu 1~ 18 ckemhrr 1998, accept6 lr 11 janvier 1999)

R&urn& Cette Note propose un test d’auto-similar% pour une serie d’observations provenant d’un processus gaussien a accroissements stationnaires. Ce test repose sur I’estimation d’une distance entre le processus consider6 et un ensemble de processus contenant tous les mouvements browniens fractionnaires. Cette distance est construite a partir d’une double estimation de l’esperance des variations quadratiques g&nCralisCes considerees pour une gamme d’echelles temporelles. La seconde de ces estimations fait appel 2 I’estimation du parametre d’auto-similarit par des methodes de regression qui prescntent une vitcsse dc convcrgencc comparable 21 celle obtenue par estimation par maximum de vraisemblance, tout en presentant une vitesse de calcul avantageuse et une plus grande robustesse. 0 AcadCmie des SciencesElsevier, Paris

Testing self-similarity of Gaussian processes with stationary increments

Abstract. In this Note, we present a method,for testing self-similarity of discretized observations of a Gaussian process with stationary increments. The test is based on the estimation of a distance between the process and a set of processes containing all the fractional Brownian motions. This distance is constructed from two e.stimations of multiscule generalized quadratic variations expectations. The second estimation requires to estimate by regre.rsinn the self-similarity index H. Both these estimators of H present good robustness and computing time properties compared with maximum likelihood approach, with nearly similar convergence rate. 0 Academic des SciencestElsevier, Paris

A bridged English Version

We propose to test self-similarity of a Gaussian process with stationary increments, from a fixed step discretization of this process. A process 2 = ( (Zt) : t E R} is self-similar with index H > 0 if, for all

d E N*, for all (tl,. , h) E R”, and for all c E W+ : (X,,: . . . y X,,) g (cmHXr+, , . . . ~ ccHXctc,).

Note pr6Sent6e par Jean-Pierre KAffmm.

0764~4442/99/03280.52 I 0 Acadkmie des ScienceslElsevier, Paris 521

Page 2: Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

J.-M. Bardet

Fractional Brownian motions, fractional ARIMA processes, some a-stable processes, etc., are self- similar processes (more details are in [ 111). But, only fractional Brownian motions are self-similar Gaussian processes with stationary increments. The test is then a way to recognize a fractional Brownian motion.

Assume that X0, X1 ! X2, . . . , X,v is an observation given by discretization of a fractional Brownian motion X = {(X,) ; t E W}, with parameter H ~]0,1[, and such that IEX: = g2 (and with X0 = 0 a.s.). Let 7b1? n2, . . . , n,,, be given distinct integer numbers (called scales), and let u = (pi, 7~~~ _ . . ,T+) be a family of p real numbers. We assume that u has his Q first vanished moments, i.e. CT=‘=, %QrLi = 0 for q = 0, 1,. . . . Q - 1 and cJ’=, iQ,Li # 0 (with Q 2 2). Following Istas and Lang [8], we call ?L-quadratic variation of X for scale n, the process UTl(,i) such that:

We show that lEU,,(j) = c~‘C,,(H)~~~, where C,l(H) E I3 does not depend on 71 and .i. As a consequence, EU, is a self-similar function of n, and log(EU,) is an affine function of log n,. By using results of Istas and Lang [8], we show that S,v(n) = ~Ic.,)L;--1)+1(~~l(o)+u~(l)+.‘.+lii,([~/~~l--P)). converges to EU, following a central limit theorem when N -+ +co. In the same way, vector

(log SN(W), . . . i 1% SN(%n)) converges to (log(EU,,), . . : log(EUn7,,)) following a central limit theorem with identifiable asymptotic covariance matrix F. We thus obtain a linear model that allows an estimation of (H. (T’C?~(H)) by regression, first, with an ordinary least square regressions, and secondly, with a generalized least square regressions because F can be estimated.

When X is a fractional Brownian motion, vector (2Elogrc.l + ii:. . ,2g logn,,, + gj’, where g and e are the generalized least square estimators of H and log(c~~C,,(H)), and vector (log SN (n.i )! . . . , log S,v (rr,,,)) are two estimators of (log( EU,, I ), . . ! log( EU,, ,,, )). The test statistic is a distance between those both estimators. It corresponds to a distance between points (lognj, log S,(n,)) and g eneralized regression line. The distribution of this distance converges with a N convergence rate to a Chi-square distribution with (m - 2) freedom degrees. The test is then very easy to be used and efficient to reject the self-similarity hypothesis for a Gaussian process with stationary increments. Moreover, more the scales number is large, more the set of Gaussian processes with stationary increments verifying the test is close to the set of all the fractional Brownian motions.

We have chosen to work on the time-parameter space instead of spectral one for simplicity and robustness reasons. Simulations show test efficiency, simplicity and robustness. In fact, as estimations of H are linear and explicit, computing time is very short in comparison with maximum likelihood approach. Moreover, these estimations of H are nearly as good and more robust in comparison with maximum likelihood estimation. Asymptotical properties of the test will be confirmed by numerical simulations using a fractional Brownian motion generator. We have also tested real data that seem to be a skeleton of a fractional Brownian motion (because of aggregation phenomena for example), and we validate the self-similarity hypothesis for Nile River yearly minimum water levels between year 722 and year 1281 (also called the Joseph effect, see [4]). More, this self-similarity test allows us to find a new sampling period for which fractional Brownian motion modeling is adapted.

1. Introduction

Nous nous proposons de tester l’auto-similarite d’un processus gaussien a accroissements stationnaires, a partir d’une discretisation a pas fixe de ce processus. Rappelons qu’un processus

522

Page 3: Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

Un test d’auto-similarit pour les processus gaussiens a accroissements stationnaires

2 = { (2,) ; t E W} est auto-similaire d’index H > 0 si, pour tout d E fW*, pour tout (ti, . . . , td) E IWd, et pour tout c E R+ :

(X,, , . . . Xt,) 5 (C-HXctl). . . j c-“xc,,)

Les mouvements browniens fractionnaires (M.B.F.), les processus ARIMA fractionnaires, certains processus a-stable, etc., sont auto-similaires (pour plus de details, voir [l I]). Mais les seuls processus auto-similaires gaussiens a accroissements stationnaires sont les M.B.F., et notre test est done un moyen de reconnaitre un M.B.F.

Dans tout ce qui suit, nous considerons (Xa: Xi T X2, . . . ! X,), une serie d’observations reelles issue d’un processus gaussien a accroissements stationnaires X = {(X,) ; t E Iw}. Nous ferons l’hypothese suivante : Hypofhkse M.B.F. : X est un mouvement brownien fractionnaire de parametre H E IO! l[, tel que IEXF = u2 (on suppose X0 = I) p.s.).

On considere aussi l’ensemble des familles de reels MI,(Q), defini par : Ensemble &TT~(Q) : Une famille 71, = (TL~,‘TLZ, . . , r~r,) de p reels appartient a A.$(Q) si ‘(L a ses Q

premiers moments qui s’annulent, soit Cy=‘=, ?r/,, = 0 pour q = 0, 1,. . . , Q - 1 et Cf’=i T?I,~ # 0 (on choisira Q _> 2).

Pour u E J&,(Q), on appelle u-variation quadrutique de X a l’echelle 71. E N*, le processus Un(j) tel que :

Ces u-variations quadratiques sont un cas particulier des variations quadratiques generalisees introduites par Istas et Lang [S] pour Ctendre des resultats obtenus avec les variations quadratiques ordinaires (voir [7]). Un exemple simple de ?L-variations quadratiques est celui correspondant aux variations des variations, soit ‘u = (1, -2,l). On montre la propriete suivante :

PROPRIF~TI? 1. - Si X ve’rijie 1’hypothPse M. B. F., si u E MT>(Q), ulors, pour 71. E N*, pour tout j E {O! 1,. . . , [N/n] -p}, EUlt(,j) = ~‘C,,(H)TL*~ uvec C,,(H) = -i CizI CE,=, ~k~~.~jk-k’(~~.

Ainsi, EU,, est une fonction auto-similaire en n, et log-(EU,,) est une fonction affine de logn. Grace aux travaux de Istas et Lang [7], nous montrons que I’estimateur nature1 de EU,, a

savoir Sni (n) = LN,nl L ?, + 1 (U, (0) + U,, (1) + . . . + U,, ([N/rr,] - p)) , converge vers EU,

suivant un theoreme de limite centrale quand N + +oc. Ce resultat s’etend au vecteur (lqgS‘V(%), . . ,logs,v(~r~,r,)) . q UI converge vers (log(EU,, ), . . ,10g(W,~,,)) suivant un theoreme de limite centrale dont la covariance asymptotique F est identifiable. On a done un modele lineaire qui permet d’estimer (H, CJ”C~~(H)) p ar regression, suivant un moindres cart& ordinaires (M.C.O.), puis un moindres car& generalists (M.C.G.), puisque F peut &tre estimee. La vitesse de convergence de cet estimateur est en fl, ce qui est comparable a la vitesse de I’estimateur par maximum de vraisemblance (voir [4]), et mieux que celle de l’estimateur par log-periodogmmme (voir IlO]).

Lorsque X est un M.B.F:, les vecteurs (log SN(TL~), . . . ! 10gS~(7~~~~)) et (2H logr~~ + K, . . ,2j? log-n,, + k), avec k et K les estimateurs M.C.G. de H et log($CT,(H)), sont deux estimateurs convergents de (log(lECrT,, ): . . . , log(~Eli,,~~~ )). Une distance entre ces deux estimateurs, qui correspond a une distance entre les log S,V(~L,) et la droite de regression generalisee, est notre statistique de test. La distribution de cette distance convergera avec une vitesse de convergence en N vers la distribution

523

Page 4: Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

J.-M. Bardet

d’un chi-deux a (m - 2) degres de liberte. Le test sera done facile a utiliser et tres efficace pour rejeter l’hypothese d’auto-similarite pour un processus gaussien a accroissements stationnaires. Notons aussi que plus le nombre d’echelles m est grand, plus l’ensemble des processus gaussiens a accroissements stationnaires verifiant le test sera proche de l’ensemble de tous les M.B.F.

Ce test d’auto-similar& presente l’avantage de travailler en temporel et non en frequentiel ; ainsi, la propriete d’invariance d’echelle est traitee directement, ce qui se traduit par une plus grande robustesse des estimations. De plus, ce test possede des qualites de simplicite de calcul qui permettent, m&me sur de tres nombreuses donntes, de travailler en temps reel. C’est ce que confirment des simulations numeriques. Nous avons aussi test6 l’auto-similarite de donnCes rkelles semblant se comporter comme des M.B.F. (notamment en raison de phenomenes d’aggregation), et nous avons d&ermine pour ces donnees l’echantillonage le plus a mCme de conduire a une telle modblisation. Nous montrons notamment que l’hypothese d’auto-similarid pour les q< historiques >> niveaux d’etiage du Nil (voir [4]) est tout a fait legitime. La construction du test exigeant aussi l’estimation de H, nous donnerons des resultats sur les qualites de ces deux estimateurs (M.C.O. et M.C.G.), en les comparant avec l’estimation de H obtenue par maximum de vraisemblance. On observera ainsi des resultats equivalents en precision, et de bien meilleure qualite en robustesse et en vitesse de calcul.

2. Estimations par variations quadratiques gCn&ali&es

Montrons maintenant plus precisement les resultats Cvoques precedemment (on utilisera les memes notations). A partir des resultats de Istas et Lang [8], on montre que Sri;(n) converge vers EU, suivant un theoreme de limite centrale quand N --) +oo. Plus gCnCralement, si n1, . . . , n, sont des entiers positifs distincts, on montre la proposition suivante :

PROPOSITION 1. - Si X ve’rijie l’hypothdse M.B.F., si u E M,(Q) ve’rijie C,(x) # 0 pour x ~]0,1[,

alors : JX(log S,(n,) - 2H log r&i - logrr2CU(H)) l<i<m C.Nm-(0; F), 03 F = (fij)rli,j~~ - N-+m

est telle qu’avec d;j = PGCD(ni, TL,j), on ait :

2

fij = d;,

2nfHn5nC,“(H) ukuk’In,k - njk’ + !d;j /2H .

COROLLAIRE 1. - Sous l’hypothese M.B.F., conside’rons (XA, Xi, . . . , XL), oli X,! = X; + EN, avec (EN) bruit blanc gaussien de variance YN (i) = o(N-~/~), independant des (Xi). Soit le vecteur (S~T(ni))l~i~m, calct&~partirdes (X6,X:, . . . ,X&). Alors (SkT(n;))ls;rm a la m$me convergence asymptotique que celle annoncee pour (SN(n;))l<;<, duns la proposition 1.

Remarque 1. - Quand jn; k - njk’ j + +co, on a cov(U,Y(k), U=,(k’)) = 0(/nik - njk’j4ne4*), pour IL E Mr(Q). 11 suffit ainsi d’avoir Q > 2 pour avoir le theoreme limite precedent, alors que pour Q = 1, ce theoreme n’est valable que pour H < 3/4 (cas des variations quadratiques ordinaires). Comme les U,,z (k) sont de plus en plus decorrelts quand Q augmente, il semblerait interessant de choisir Q le plus grand possible. Pot&ant, les simulations montrent qu’il vaut mieux avoir p le plus petit possible (et done Q le plus petit possible) pour avoir la meilleure vitesse de convergence des estimateurs.

L”Ll* Notons : I, = t(l, 1:. _. , l), A = I - tl, S,+,T = (logSN(ni))I<;<,, ES = (loglEU,,)l<i<m -- -- et L = (log~b;)t<;<,. Sous l’hypothese M.g.Fy il existe 6 = t(2H, K), oti K = log(a2CU(H)) E R, tel que ES = 2HL + KI, = Jr9 (avec J = (L, I,)). D’apres la proposition 1, on a un mod& lineaire puisque S~V = J8 + (P,v/&V), oti [j, est un vecteur asymptotiquement gaussien. Par

524

Page 5: Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

Un test d’auto-similarit pour les processus gaussiens i accroissements stationnaires

rkgression de 5’~ sur L, on obtient une premibre estimation &(N) = (@l(N), gl(N)) de CI par moindres car&s ordinaires (M.C.O.). 11 est aussi possible de << blanchir >) les &arts ?I la droite de regression en utilisant l’estimation de la matrice de covariance limite de SN. En effet, cette matrice FestdeformeF=F(nl,... , n,, H) et la Fatrice $I (N) = F(nl, . . . , n,, fil (N)), converge en probabilitk vers F. On peut done dCterminer 6$(N), estimateur de 0 par moindres car&s gCdralisCs (M.C.G.), en minimisant 11s~ - JO(l$1(NJ = t(S~ - .JO)F1(N)-‘(S, - JO).

PROWSITION 2. - Sous les mgmes hypothbes que la proposition I : 1) I’estimateur des M.C.O. de H est HI tel que :

t(AL)S~ H1(N) = 2t(AL)(AL)’

1 t(AL)F(AL) et fi(@l(N) - H) &-JN(OI d); auec d = 4 (+,(AL)(AL))2 ;

2) notons B = I - et BN = I - lmtb’(N)P1. L’estimateurdesM.C.G. de H est 22 tI,FI(N)-lI,

3. Test d’auto-similarit et simulations

Les vecteurs SN et J&(N) = 2Zz(N)L + kz(N)I, sont deux estimateurs du vecteur (log EU,*)z”=,. La statistique du test est une distance CM:(N) entre ces deux estimateurs, dkfinie par :

CM’(N) = NIISN - J@z(N)II~~~,~.

Aprks avoir determink fil(N), on construit le test i partir de la proposition suivante :

PROPOSITION 3. - Sous les mt?mes hypothtses que la proposition 1, on a :

CM2(N) L - x2(m - 2). N-+-CCC

Remarque 2. - Ce dernier rksultat s’explique par le fait que la somme des car& rksiduels se comporte comme un Chi-deux, le nombre de degrks de 1ibertC &ant d6terminC par la double-estimation du paramhtre. Les preuves des autres propositions sont dans [2].

Pour valider expkimentalement nos rkultats, nous avons gCnCr6 des M.B.F. & I’aide d’une simulation par ondelettes, suivant I’algorithme proposC par [l]. Nous avons calculk 21(N) et g2(N) 2 partir de la trajectoire simulke d’un M.B.F. CchantillonnC ?I un pas quelconque, pour des skies de 200 B 50000 dondes, avec H dans 10, l[, 5 5 m 5 30 et (nl, . . . , n,) proportionnel B (1,2,. . . , m) (on calcule F1(N) en tronquant les sommes infinies dkfinissant F). Nous avons cornpark ces estimateurs de H avec l’estimateur par maximum de vraisemblance (M.V.) avec approximation de Whittle (voir algorithme de [4]). Sur l’ensemble de nos rksultats, il apparait que I’estimateur par M.C.G. donne des rksultats cornparables h ceux obtenus par M.V. En revanche, l’addition d’un bruit blanc gaussien dkgrade consid&rable_ment l’est@ation par M.V. alors que i?l(N) et jlz(N) sont robustes B cette pertubation. De plus, HI(N) et Hz(N), obtenus par moindres car&, sont asymptotiquement exprimables et demandent un temps de calcul d’ordre N contre N log N pour l’estimateur par M.V. avec l’approximation de Whittle. Pour exemple, dans des conditions d’utilisation du rkseau

525

Page 6: Un test d'auto-similarité pour les processus gaussiens à accroissements stationnaires

J.-M. Bardet

informatique comparables, quand N = 50000, les estimateurs gt (N) et gz (IV) demandent moins de 5 secondes de calcul, i’estimateur par M.V. ne donne un rtsultat a lo-” pres qu’au bout d’une heure.

Nous avons test& avec un risque de 50/o, deux series de donnees x reelles >P susceptibles d’&tre auto- similaires. Les premieres don&es testees sont 50400 mesures de charge Clectrique calculees toutes les minutes pendant cinq semaines sur Ie reseau national francais (voir [9]). Obtenues par aggregation, iI semblait vraisemblable qu’elles soient auto-similaires. On trouve toujours H N 0.3, et la regression semble donner de tres bons resultats. Cependant, le test CiW rejette toujours l’hypothese nulle, quels que soient les parametres choisis. L’hypothese d’une modelisation de ces donnees par un M.B.F. ne peut Ctre que rejette. La seconde serie de donnees est constituee des niveaux d’etiage du Nil, de l’annee 722 a l’annee 1281 (voiv [4]), soit N = 560 donnees. Quelles que soient les Cchelles choisies et leur nombre, on trouve Hz N 0.88 (a 0.02 p&s) et le test est toujours accept6 (par exemple, pour ‘“1 = 10, (n1: . . . . T/,1”) = (1)“‘; lo), on trouve Ea N 0.881 et CM2 N 4.1 E [2.2; 17.51 alors que Hnfr- 21 0.886). Ces donnees semblent bien presenter ce que Mandelbrot a appele (c effet Joseph D, c’est-a-dire qu’elles sont mod&sables par un M.B.F.

Remerciements. L’auteur d&ire exprimer sa profonde gratitude aux Professeurs D. Dacunha-CasteBe, X. Guyon et J.M. Poggi.

RCftSrences bibliographiques

[I] Abry P., Sellan F., The wavelet-based synthesis for the fractional Brownian motion proposed by F. Sellan and Y. Meyer: remarks and fast implementation, Appl. Comput. Harm. Anal. 3 (1996) 377-383.

[2] Bardet J.-M., Testmg self-similarity of processes with stationary increments, Preprint, Orsay. 1997. [3] Bardet J.-M., A test of self-similarity using wavelet analysis, Preprint, Evty, 1997. [4] Beran J., Statistics for long memory processes, Monogr. Statis. Appl. Probab. 61, Chapman & Hall, 1994, 315 p. [5] C&-go M.. RCvesz P., Strong approximation in probability and statistics, Academic Press, 1981, [6] Dacunha-Castelle D., Duflo M.. Probabilites et statistiques, Tome 2, Masson, 1983. 171 Guyon X., Leon J., Convergence en loi des H-variations d’un processus gaussien stationnaire, Ann. Inst. H. Poincare 25

(1989) 265282. [S] lstas J.. Lang G., Quadratic variations and estimation of the local Holder index of a Gaussian process, Ann. Inst.

H. Poincare 33 (1997) 407-436. 191 Poggi J.M., Viano M.C., An estimate of the fractal index using multiscale aggregates, J. Time Ser. Anal, (1997).

[IO] Robinson P., Loa-periodogram regression of time series with long-range dependence. Ann. Statis. 23 (1995) 1048-1072. [ 1 I] Samorodnitsky G., Taqqu MS., Stable non-Gaussian random processes, Stochastic Modelling, Chapman & Hall, 1994,

636 p.

526