42

Séries chronologiques : modèles de Box-Jenkins

Embed Size (px)

Citation preview

Page 1: Séries chronologiques : modèles de Box-Jenkins

Dur, dur!! Les s�eries chronologiques!!

Bernard Rapacchi

Centre Interuniversitaire de Calcul de Grenoble

18 aout 1993

Page 2: Séries chronologiques : modèles de Box-Jenkins

Dans cette note, nous nous int�eressons aux s�eries chronologiques sous le point de vue de

l'Analyse des mod�eles Box-Jenkins (ARMA, ARIMA, SARIMA, : : :), ou d'Analyse Spectrale.

Nous supposons que vous avez d�ej�a lu une petite note [8] introduisant les s�eries chronologiques

et leurs aspects sous le point de vue Analyse Exploratoire et M�ethodes Robustes. On aurait pu

s'arreter l�a, mais pourquoi faire simple quand on peut faire compliqu�e : : :

i

Page 3: Séries chronologiques : modèles de Box-Jenkins

Table des mati�eres

1 INTRODUCTION AUX MODELES BOX-JENKINS 1

1.1 Introduction : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1

1.2 S�erie Stationnaire : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1

1.2.1 D�e�nition : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1

1.3 Comment rendre une s�erie stationnaire : : : : : : : : : : : : : : : : : : : : : : : : 2

1.3.1 Pourquoi des s�eries sont non stationnaires : : : : : : : : : : : : : : : : : : 2

1.3.2 Le lissage de la s�erie : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 2

1.3.3 Les op�erateurs de Box-Jenkins : : : : : : : : : : : : : : : : : : : : : : : : 2

1.4 Fonction d'autocorr�elation : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3

2 LE MODELE LINEAIRE DE BOX-JENKINS 5

2.1 Hypoth�ese : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5

2.2 Filtre : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5

3 PROCESSUS A MOYENNE MOBILE 7

3.1 MA d'ordre 1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7

3.2 MA d'ordre q : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

3.3 En r�esum�e : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 9

4 PROCESSUS AUTOREGRESSIF 10

4.1 AR d'ordre 1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10

4.2 AR d'ordre p : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11

4.3 La Fonction d'Autocorr�elation Partielle : : : : : : : : : : : : : : : : : : : : : : : 12

4.3.1 ACF et PACF d'un AR(1) : : : : : : : : : : : : : : : : : : : : : : : : : : 12

4.3.2 PACF d'un AR(p) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 14

4.4 Dualit�e : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 14

5 PROCESSUS ARMA, ARIMA ET SARIMA 15

5.1 Les processus ARMA : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15

5.1.1 D�e�nition : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15

5.1.2 Processus ARMA(1,1) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15

5.2 Les processus ARIMA : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16

5.3 Les processus SARIMA : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16

6 UN EXEMPLE 17

6.1 Donn�ees de Pollution Atmosph�erique : : : : : : : : : : : : : : : : : : : : : : : : : 17

6.2 Les logiciels : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17

6.3 Processus de mod�elisation : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17

ii

Page 4: Séries chronologiques : modèles de Box-Jenkins

6.4 Mod�elisation : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 18

7 ETUDE MULTIVARIEE DES SERIES CHRONOLOGIQUES 25

7.1 Fonction de corr�elation crois�ee : : : : : : : : : : : : : : : : : : : : : : : : : : : : 25

7.1.1 D�e�nition : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 25

7.1.2 L'exemple de la pollution : : : : : : : : : : : : : : : : : : : : : : : : : : : 25

7.2 Mod�ele de Fonction de Transfert : : : : : : : : : : : : : : : : : : : : : : : : : : : 26

7.3 L'in uence de l'inversion de temp�erature sur la pollution : : : : : : : : : : : : : : 27

7.4 Les in uences de l'inversion et de la temp�erature : : : : : : : : : : : : : : : : : : 34

7.5 Pr�evisions : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 36

iii

Page 5: Séries chronologiques : modèles de Box-Jenkins

Chapitre 1

INTRODUCTION AUX

MODELES BOX-JENKINS

1.1 Introduction

Nous supposons donc que vous savez ce qu'est une s�erie chronologique (sinon voir [8]) et

quels sont les pi�eges pouvant survenir face �a l'�etude de celles-ci. Dans la suite, nous aurons une

s�erie not�ee:

Xt avec t = 1; : : : ; n

C'est-�a-dire que nous avons une s�erie de n observations s�equentielles ordonn�ees suivant leurs

indices.

1.2 S�erie Stationnaire

1.2.1 D�e�nition

La notion de s�erie stationnaire est indispensable pour la suite de l'analyse des s�eries. Une

s�erie stationnaire Xt est une s�erie dont les propri�et�es sont inchang�ees par changement d'origine

des temps, c'est-�a-dire:

1. L'esp�erance deXt est constante dans le temps: on peut penser \esp�erance" comme esp�erance

math�ematique, mais il faut garder en tete que c'est la valeur esp�er�ee pour l'observation au

temps t.

2. Pour tout h �x�e, la covariance entreXt et Xt+h est invariante dans le temps. Ceci implique,

entre autres, que la s�erie est stable en dispersion. Cette notion de d�ecalage de la s�erie est

tr�es importante pour la suite. On peut faire le nuage de points de la s�erie avec les valeurs

de la s�erie d�ecal�ees d'un d�ecalage h. La stationnarit�e implique que, si on prend un certain

nombre de points au d�ebut ou �a la �n de la s�erie on doit toujours retrouver le meme nuage

de points.

1

Page 6: Séries chronologiques : modèles de Box-Jenkins

1.3 Comment rendre une s�erie stationnaire

1.3.1 Pourquoi des s�eries sont non stationnaires

1. La premiere s�erie non stationnaire �a laquelle on pense est celle qui est croissante dans le

temps. Par exemple la s�erie \Airline Data" (cf [8]) est croissante, qu'elle soit prise telle

quelle, ou transform�ee par Logarithme.

2. Une s�erie saisonni�ere est �egalement non stationnaire puisque la valeur esp�er�ee d�epend

du temps dans la p�eriode de la saison. Par exemple la s�erie \Airline Data" n'est pas

stationnaire �egalement par le fait de saisonnalit�e.

3. Une s�erie dont la dispersion varie dans le temps n'est pas stationnaire. Par exemple, la

s�erie des valeurs brutes \Airline Data" n'est pas stationnaire du fait que sa dispersion

grandit dans le temps. La transformation par le Logarithme permet d'�eviter ce probl�eme.

En fait, en prenant une s�erie brutalement, on a fort peu de chances pour qu'elle soit station-

naire.

1.3.2 Le lissage de la s�erie

On peut d'abord lisser les donn�ees (cf [8]). On regardera alors le rugueux et celui-ci est

stationnaire. Nous ne nous attarderons pas sur cet aspect de l'analyse.

1.3.3 Les op�erateurs de Box-Jenkins

L'op�erateur de recul B

L'op�erateur de recul B est d�e�ni comme agissant sur la s�erie. A un instant t on fait corres-

pondre la valeur de la s�erie �a l'instant t� 1. On d�e�nit ainsi une nouvelle s�erie B X comme:

B Xt = Xt�1

On peut appliquer plusieurs fois cet op�erateur, on d�e�nit ainsi des nouvelles s�eries:

B2Xt = B (BXt) = BXt�1 = Xt�2

et

BmXt = Xt�m

L'op�erateur de di��erenciation r

L'op�erateur r (prononcer \nabla") est d�e�ni par:

rXt = Xt �Xt�1 (1.1)

Nous entrons maintenant dans des consid�erations de notations. En e�et, par �ecriture pure-

ment formelle on peut �ecrire:

rXt = Xt � BXt = (1� B)Xt (1.2)

On peut �ecrire r sous la forme d'un polynome en B avec:

2

Page 7: Séries chronologiques : modèles de Box-Jenkins

r = 1� B

Ce mode d'�ecriture sous forme de polynome en B est en fait tr�es pratique mais totalement

formel. Il ne faut pas oublier que, quand on �ecrit (1 � B)X , on d�e�nit �a partir d'une s�erie X,

une nouvelle s�erie qui �a t, fait correspondre la di��erence entre la valeur de la s�erie observ�ee �a

l'instant t et celle observ�ee �a l'instant t� 1.

L'op�erateur de d�esaisonnalisation rs

L'op�erateur rs est d�e�ni par:

rsXt = Xt �Xt�s

En d'autres termes:

rs = (1� Bs)

Les e�ets des op�erateurs de Box-Jenkins

L'op�erateur r

1. permet d'�eliminer la tendance de la s�erie.

2. peut etre r�ep�et�e plusieurs fois si la tendance n'est pas lin�eaire. Par exemple:

r2Xt = (1� B)2Xt = (1� 2B + B

2)Xt

permet d'�eliminer une tendance quadratique. Le nombre de fois o�u on applique r est

appel�e ordre de di��erenciation.

L'op�erateur rs

1. permet d'�eliminer la saisonnalit�e de p�eriode s.

2. On peut �egalement l'appliquer plusieurs fois.

rs2Xt = rs (Xt �Xt�s)

Le nombre de fois o�u on applique rs est appel�e ordre de d�esaisonnalisation.

1.4 Fonction d'autocorr�elation

{ L'autocovariance au d�ecalage k, (k) est d�e�nie par:

(k) = 1=nn�kXj=1

(Xj+k �X)(Xj �X) avec X = 1=nnXi=1

Xi (1.3)

Il faut remarquer que la somme fait intervenir n � k termes mais on divise par n et non

pas par n� k comme on le fait dans un calcul de covariance habituel. Ceci est fait dans le

but de donner �a la matrice de corr�elation de bonnes propri�et�es.

3

Page 8: Séries chronologiques : modèles de Box-Jenkins

{ L'autocorr�elation au d�ecalage k �(k) est d�e�nie par:

�(k) = (k)= (0) (1.4)

{ La fonction d'autocorr�elation est la fonction qui �a k associe la valeur �(k). On notera cette

fonction comme �etant l'ACF de la s�erie X.

4

Page 9: Séries chronologiques : modèles de Box-Jenkins

Chapitre 2

LE MODELE LINEAIRE DE

BOX-JENKINS

2.1 Hypoth�ese

On suppose que notre s�erie Xt est g�en�er�ee �a partir d'une autre s�erie at qui suit une loi de

Gauss de moyenne 0 et d'�ecart-type �a, sous le forme:

Xt = �+ at + tat�1 + t�1at�2 + : : :

at v�eri�e donc: 8>>><>>>:

a ; N(0; �2a)

E(at) = 0 8 t

(k) = Cov(at; at+k) =

(�2a si k=0

0 si k 6= 0

La s�erie at est un \bruit blanc". C'est l'exemple parfait d'une s�erie stationnaire puisque son

esp�erance est toujours nulle, que sa dispersion est stable et qu'il y a ind�ependance entre les

observations.

La valeur � est la moyenne de la s�erie Xt. Nous supposerons dor�enavant, que la s�erie

Xt est centr�ee et donc que � = 0.

L'Analyse des s�eries sous l'aspect Box-Jenkins consiste �a chercher la s�erie at et les coe�cients

i qui permettent de passer de la s�erie at �a Xt.

2.2 Filtre

De l'�equation pr�ec�edente, on peut �ecrire:

Xt = at + 1B at + 2B2at + : : :

Xt = (1 + 1B + 2B2 + : : :)at

Xt = (B)at (2.1)

(B) est un polynome en B dont les coe�cients sont les i. Si on revient �a la notion de

�ltre [8], la s�erie at est en entr�ee d'un �ltre dont la s�erie Xt est en sortie et le polynome (B)

est la \fonction de transfert" du �ltre.

5

Page 10: Séries chronologiques : modèles de Box-Jenkins

On peut remarquer que formellement le polynome (B) a une in�nit�e de termes mais dans

la pratique on ne dispose que de n observations et on ne peut remonter que jusqu'�a la valeur

t = 1.

6

Page 11: Séries chronologiques : modèles de Box-Jenkins

Chapitre 3

PROCESSUS A MOYENNE

MOBILE

En anglais, moyenne mobile se dit \Moving Average" c'est pourquoi nous dirons que ces

s�eries sont des MA.

3.1 MA d'ordre 1

On dit que la s�erie Xt suit un processus de moyenne mobile d'ordre 1 (MA(1)) si elle est

g�en�er�ee par un bruit blanc at sous la forme:

Xt = at � �at�1

Xt = (1� �B)at

La fonction de transfert du �ltre se r�eduit �a un seul terme.

Variance de X Par calculs simples, on peut montrer que

V ar(X) = (1 + �2)�2a

V ar(X) > �2

a

C'est-�a-dire qu'en mod�elisant, on diminue la variance du ph�enom�ene ce qui est, par nature,

le propre de toute mod�elisation!

Autocorr�elation de X De meme, on peut montrer que

�(k) =

(��

1+�2Si k = 1

0 Si k � 2

On peut dessiner la fonction d'autocorr�elation (ACF). Ce dessin est d'ailleurs appel�e au-

7

Page 12: Séries chronologiques : modèles de Box-Jenkins

tocorr�elogramme.

-1.0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

3.2 MA d'ordre q

On suppose que la s�erie X est g�en�er�ee par un bruit blanc a sous la forme:

Xt = at � �1at�1 � �2at�2 � : : :� �qat�q

Xt = �(B)at

On suppose bien �evidement que q est inf�erieur au nombre d'observations.

Autocorr�elation de X On peut montrer que

�(k)

(6= 0 Si k � q

= 0 Si k > q

L'autocorr�elogramme de X devient:

-1.0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

8

Page 13: Séries chronologiques : modèles de Box-Jenkins

3.3 En r�esum�e

Pour reconna�tre qu'une s�erie X est un processus moyenne mobile d'ordre q, on va dessiner

l'autocorr�elogramme de cette s�erie. Pour chacune des valeurs d'autocorr�elation, on aura un

intervalle de con�ance sur cette valeur. Si on peut d�ecider que jusqu'�a un d�ecalage q, ces valeurs

sont di��erentes de 0, et qu'ensuite elles ne sont pas statistiquement di��erentes de 0, alors on

pourra dire que la s�erie suit un processus MA(q).

On peut remarquer aussi qu'une telle s�erie est stationnaire.

9

Page 14: Séries chronologiques : modèles de Box-Jenkins

Chapitre 4

PROCESSUS AUTOREGRESSIF

De tels processus seront not�es AR.

4.1 AR d'ordre 1

On dit que la s�erie Xt suit un processus autor�egressif d'ordre 1 (AR(1)) si on peut �ecrire:

Xt = �Xt�1 + at

Xt � �Xt�1 = at

(1� �B)Xt = at

o�u la s�erie at est un bruit blanc.

On peut remarquer qu'on fait une r�egression de la s�erie d�ecal�ee de 1 sur la s�erie elle-meme

et les r�esidus forment un bruit blanc.

Fonction de transfert On peut �ecrire:

Xt = at + �Xt�1

Xt = at + �at�1 + �2Xt�2

Xt = at + �at�1 + �2at�2 + : : :+ �

kat�k + : : :

Xt =1Xi=0

�iat�i

Xt =1Xi=0

�iBiat = (B)at

La fonction de transfert a donc une in�nit�e de termes. Si on revient �a notre �ecriture formelle

sous forme de polynome, on remarque qu'on a calcul�e l'inverse du polynome (1� �B) et

que

(1� �B)�1 =1Xi=0

�iBi

10

Page 15: Séries chronologiques : modèles de Box-Jenkins

Variance de X Par calculs simples, on peut montrer que

V ar(X) =�2a

1� �2

Ici aussi, on diminue la variance en mod�elisant �a condition que � soit en valeur absolue

inf�erieur �a 1.

Autocorr�elation de X De meme, on peut montrer que

�(k) = �kpour k � 1

On peut obtenir deux sortes de corr�elogramme suivant si � est positif ou n�egatif.

-1.0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

1.0

Stationnarit�e Un processus AR(1) est stationnaire si et seulement si la valeur absolue de �

est inf�erieure �a 1.

j�j < 1

4.2 AR d'ordre p

Une s�erie X suit un processus autor�egressif d'ordre p (AR(p)) si on peut �ecrire:

Xt = �1Xt�1 + �2Xt�2 + : : :+ �pXt�p + at

Xt � �1Xt�1 � �2Xt�2 � : : :� �pXt�p = at

(1� �1B � �2B2� � � � � �pB

p)Xt = at

�(B)Xt = at

o�u la s�erie at est un bruit blanc.

11

Page 16: Séries chronologiques : modèles de Box-Jenkins

Ici encore, on fait une r�egression des p s�eries d�ecal�ees sur la s�erie elle-meme.

Autocorr�elation Pour un processus AR(p), on ne peut rien dire de sa fonction ACF, si ce

n'est que:

�(k) 6= 0 pour tout k

C'est pour pouvoir reconna�tre un processus autor�egressif qu'on a introduit la Fonction

d'Autocorr�elation Partielle.

4.3 La Fonction d'Autocorr�elation Partielle

L'Autocorr�elation Partielle au d�ecalage k (PACF(k)) est d�e�nie comme �etant la corr�elation

entre:

{ Le r�esidu de la r�egression de la s�erie Xt+k par les s�eries Xt+1; Xt+2; : : : ; Xt+k�1

et

{ Le r�esidu de la r�egression de la s�erie Xt par les s�eries Xt+1; Xt+2; : : : ; Xt+k�1

En d'autres termes:

Xt+k = �1Xt+1 + �2Xt+2 + : : :+ �k�1Xt+k�1 + U

Xt = �1Xt+1 + �2Xt+2 + : : :+ �k�1Xt+k�1 + V

et

PACF (k) = Corr(U; V )

Il faut comprendre que l'autocorr�elation partielle est la corr�elation entre Xt et Xt+k, une

fois qu'on a expliqu�e ceux-ci par les valeurs entre eux deux, Xt+1; Xt+2; : : : ; Xt+k�1.

4.3.1 ACF et PACF d'un AR(1)

Prenons une s�erie Xt suivant un processus autor�egressif d'ordre 1. Par exemple:

Xt = 0:9Xt�1 + at

ACF(1) La corr�elation entre Xt et Xt+1 peut se calculer facilement

ACF (1) = Corr(Xt+1; Xt)

= Corr(0:9Xt+ at+1; Xt)

= 0:9Corr(Xt; Xt) + Corr(at+1; Xt)

= 0:9 + 0 = 0:9

Ceci est vrai car Xt et at+1 sont ind�ependants.

12

Page 17: Séries chronologiques : modèles de Box-Jenkins

ACF(2) En �ecrivant la relation entre une valeur �a un instant et la valeur pr�ec�edente �a l'ordre

t� 1, on a:

Xt�1 = 0:9Xt�2 + at�1

d'o�u

Xt = 0:9(0:9Xt�2+ at�1) + at

Xt = 0:81Xt�2 + 0:9at�1 + at

Comme Xt�2 est ind�ependant �a la fois de at�1 et at, on en d�eduit facilement que:

Corr(Xt; Xt�2) = 0:81

ACF(p) En continuant ce type de raisonnement, on montre que:

Corr(Xt; Xt�k) = 0:9k

On voit ici o�u se situe le probl�eme de la fonction d'autocorr�elation des processus au-

tor�egressifs: il semblerait, par la valeur de cette fonction, qu'il y ait une relation entre Xt

et Xt�2. Or cette relation n'est qu'indirecte puisqu'elle n'existe que par Xt�1 et par les

relations de celui-ci avec Xt et Xt�2.

La fonction d'autocorr�elation partielle existe justement pour conna�tre jusqu'�a quel niveau

de d�ecalage, il existe une relation directe entre Xt et les valeurs pr�ec�edentes.

PACF(1) L'autocorr�elation partielle au d�ecalage 1 est:

PACF (1) = Corr(Xt+1; Xt)

= 0:9

Rappel Dans une r�egression:

Yi = �Xi + �i

le coe�cient � peut etre calcul�e comme:

� =Cov(X; Y )

V ar(X)= Corr(X; Y )

�(X)�(Y )

V ar(X)= Corr(X; Y )

�(Y )

�(X)

C'est-�a-dire que, si les deux variables X et Y ont meme �ecart-type, que l'on fasse la

r�egression de X sur Y ou la r�egression de Y sur X on retrouve le meme coe�cient �:

� = Corr(X; Y )

Pour r�esumer, on peut dire que si on dispose de 2 variables X et Y de moyennes nulles et

de meme �ecart-type, si on fait la r�egression de X sur Y :

Y = �X + �

alors, la r�egression de Y sur X est:

X = �Y + �

et non, comme on aurait pu le penser:

X = 1=�Y + �

13

Page 18: Séries chronologiques : modèles de Box-Jenkins

PACF(2) Il faut, pour calculer PACF(2), faire la r�egression de Xt+1 sur Xt+2 et sur Xt. On

sait d�ej�a que:

Xt+2 = 0:9Xt+1 + at+2

Du rappel pr�ec�edent, on en d�eduit que, si on fait la r�egression de Xt+1 sur Xt on obtient:

Xt = 0:9Xt+1 + Vt

Pour le calcul de PACF(2), on calcule la corr�elation entre les 2 r�esidus de ces r�egressions:

PACF (2) = Corr(Xt+2� 0:9Xt+1; Xt� 0:9Xt+1)

= Corr(at+2; Xt� 0:9Xt+1)

= Corr(at+2; Xt)� 0:9Corr(at+2; Xt+1)

PACF (2) = 0

PACF(k) Par de calculs similaires on peut montrer que:

PACF (k) = 0 Pour tout k > 1

4.3.2 PACF d'un AR(p)

Nous ne nous attarderons pas sur cette fonction d'autocorr�elation partielle mais on peut

montrer que:

PACF (k) = 0 Pour tout k > p

4.4 Dualit�e

Pour introduire un tableau de dualit�e entre les processus MA et AR:

AR(p) MA(q)

ACF = 0 Pour tout k > q

PACF = 0 Pour tout k > p

On reconna�t qu'une s�erie suit un processus MA(q) si sa fonction d'autocorr�elation ACF s'an-

nule �a partir d'un d�ecalage q, ou qu'elle suit un processus AR(p) si sa fonction d'autocorr�elation

partielle PACF s'annule �a partir d'un d�ecalage p.

14

Page 19: Séries chronologiques : modèles de Box-Jenkins

Chapitre 5

PROCESSUS ARMA, ARIMA ET

SARIMA

5.1 Les processus ARMA

5.1.1 D�e�nition

On dit qu'une s�erie Xt suit un processus ARMA d'ordre (p,q) (not�e ARMA(p,q)), si on

peut �ecrire:

Xt � �1Xt�1 � : : :� �pXt�p = at � �1at�1 � : : :� �qat�q

�(B)Xt = �(B)at

o�u la s�erie at est un bruit blanc.

5.1.2 Processus ARMA(1,1)

En prenant p=1 et q=1, la s�erie Xt suit un processus ARMA(1,1) si on peut �ecrire:

(1� �B)Xt = (1� �B)at

Les propri�et�es d'un ARMA(1,1) sont:

{ Pour que la s�erie Xt soit stationnaire et inversible (c'est-�a-dire qu'on puisse calculer at en

fonction de Xt il faut que:

j�j < 1 et j�j < 1

{ L'ACF d'un ARMA(1,1) d�ecroit exponentiellement �a partir de k=1, alors que l'ACF d'un

AR(1) d�ecroit exponentiellement �a partir de k=0.

{ La PACF d'un ARMA(1,1) ressemble �a celle d'un MA(1) �a partir de k=2.

On peut dire, en gros, que si on ne se retrouve pas d'une fa�con �evidente en face d'un processus

AR ou MA, on a de fortes chances de se trouver en face d'un processus ARMA.

15

Page 20: Séries chronologiques : modèles de Box-Jenkins

5.2 Les processus ARIMA

Une s�erie Xt suit un processus ARIMA (AutoRegressive Integrated Moving Average) d'ordre

(p,d,q) si elle suit un processus ARMA d'ordre (p+d,q):

�(B)Xt = �(B)at

o�u la valeur B=1 est racine d'ordre d du polynome �(B). On mod�elise alors la s�erie sous la

forme:

�(B)(1�B)dXt = �(B)at

�(B)rdXt = �(B)at

o�u le polynome �(B) est de degr�e p et le polynome �(B) est de degr�e q. On �ecrit que la s�erie

Xt suit un processus ARIMA(p,d,q).

On peut remarquer que la s�erie Xt suivant un processus ARIMA n'est pas stationnaire

puisqu'il faut lui appliquer l'op�erateur de di��erenciation pour avoir un bruit blanc la g�en�erant.

5.3 Les processus SARIMA

Une s�erie Xt suit un processus SARIMA (Seasonnal AutoRegressive Integrated Moving Ave-

rage) d'ordre (p; d; q) � (P;D;Q)ssi cette s�erie a une saisonnalit�e de p�eriode s et qu'on peut

�ecrire:

�1(B)�2(Bs)(1� B)d(1�B

s)DXt = �1(B)�2(Bs)at

o�u �1 est un polynome de degr�e p, �2 est de degr�e P , �1 est de degr�e q et �2 est de degr�e Q.

16

Page 21: Séries chronologiques : modèles de Box-Jenkins

Chapitre 6

UN EXEMPLE

6.1 Donn�ees de Pollution Atmosph�erique

Les donn�ees dont nous disposons nous �et�e fournies par l'ASCOPARG (Association pour le

Controle de la Pollution Atmosph�erique dans la R�egion Grenobloise) par Mme Marie-Blanche

Personnaz.

Cette Association mesure, en divers points de la cuvette grenobloise, chaque quart d'heure

plusieurs polluants et plusieurs parametres m�et�eorologiques. Son but est non seulement de

controler la pollution atmosph�erique mais �egalement de pr�evenir les personnes comp�etentes en

cas de pollution a��gue.

Nous nous int�eresserons ici seulement �a quelques parametres: le dioxide de soufre (SO2)

mesur�e �a la Villeneuve de Grenoble, la temp�erature au Peuil-de-Claix (situ�e environ �a 800m

d'altitude) l'inversion de temp�erature, c'est-�a-dire �a la di��erence de temp�erature entre le Peuil-

de-Claix et le Pont-de-Claix (situ�e dans la vall�ee). La situation encaiss�ee de la vall�ee grenobloise

permet e�ectivement de mesurer facilement cette inversion de temp�erature, mais elle apporte

beaucoup de probl�eme de pollution. Des �etudes ant�erieures ont montr�e l'in uence de ces pa-

rametres sur la pollution.

6.2 Les logiciels

Plusieurs logiciels permettent d'estimer des mod�eles Box-Jenkins. La pauvret�e de la com-

mande \Box-Jenkins" du logiciel SPSSx [10] ne nous permet pas de nous �etendre sur celle-ci.

Nous avons ajout�e au logiciel EDA [5] plusieurs commandes qui ne sont en fait que des inter-

faces entre ce logiciel et la biblioth�eque NAG. Ces commandes, regroup�ees sous le vocable de

TSEDA, ont �et�e �ecrites pour EDA car, comme nous allons le voir, l'�etude de la mod�elisation

suit l'id�ee du logiciel d'interactivit�e, d'it�erativit�e et de graphique. Mais nous pr�ef�erons ici, dans

un souci d'universalit�e, prendre notre exemple �a l'aide du logiciel BMDP: nous utiliserons donc

le programme BMDP2T de ce logiciel [4].

6.3 Processus de mod�elisation

La mod�elisation d'une s�erie sous la forme Box-Jenkins se fait en 3 �etapes:

1. Identi�cation du mod�ele.

2. Estimation des parametres du mod�ele.

17

Page 22: Séries chronologiques : modèles de Box-Jenkins

3. Veri�cation du mod�ele.

4. Si la v�eri�cation ne permet pas de conclure �a un bon mod�ele on revient alors en 1.

On voit bien dans ce sch�ema l'it�erativit�e du processus. L'identi�cation du mod�ele se fait �a

l'aide des dessins des ACF et PACF; ici on voit appara�tre l'aspect graphique du travail.

6.4 Mod�elisation

Le �chier DATA2 de donn�ees contient 4 variables: la temp�erature �a Pont-de-Claix, celle

au Peuil-de-Claix, le SO2 �a la Villeneuve et la vitesse du vent. Ces mesures sont ramen�ees par

moyenne sur 3 heures �a partir de 0heure de chaque jour. Nous avons pris 240 mesures, soit 30

jours, situ�ees en p�eriode d'hiver, �a cheval sur les mois de janvier et f�evrier 1986.

Les ordres de BMDP2T permettant de faire les auto-corr�elogrammes ACF et PACF de

l'inversion sont les suivants:

/PROBLEM TITLE IS 'MODELISATION DE LA POLUTION'.

/INPUT VARIABLES ARE 4.

FORMAT IS '(4F4.0)'.

FILE IS DATA2 .

/VARIABLE ADDED IS 1.

NAMES ARE TPNTCLAI,TPEUIL,SO2VILLE,VARITH,INVERS.

/TRANSFORM INVERS=TPEUIL-TPNTCLAI.

/END

ACF VAR=5./

PACF VAR=5./

END/

Le r�esultat est le suivant:

18

Page 23: Séries chronologiques : modèles de Box-Jenkins

PLOT OF AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 .806 + IXX+XXXXXXXXXXXXXXXXX2 .531 + IXXXX+XXXXXXXX3 .355 + IXXXX+XXXX4 .230 + IXXXXXX5 .143 + IXXXX +6 .128 + IXXX +7 .218 + IXXXXX+8 .268 + IXXXXX+X9 .111 + IXXX +

10 -.097 + XXI +11 -.203 +XXXXXI +12 -.247 XXXXXXI +13 -.258 XXXXXXI +14 -.208 +XXXXXI +15 -.055 + XI +16 .058 + IX +17 -.011 + I +18 -.130 + XXXI +19 -.158 + XXXXI +20 -.138 + XXXI +21 -.096 + XXI +22 -.020 + I +23 .147 + IXXXX +24 .280 + IXXXXX+X25 .209 + IXXXXX +26 .057 + IX +27 -.033 + XI +28 -.059 + XI +29 -.057 + XI +30 -.022 + XI +31 .090 + IXX +32 .169 + IXXXX +33 .074 + IXX +34 -.089 + XXI +35 -.191 + XXXXXI +36 -.224 +XXXXXXI +

PLOT OF PARTIAL AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 .806 + IXX+XXXXXXXXXXXXXXXXX2 -.342 XXXXXX+XXI +3 .183 + IXX+XX4 -.127 XXXI +5 .065 + IXX+6 .099 + IXX+7 .266 + IXX+XXXX8 -.173 X+XXI +9 -.446 XXXXXXXX+XXI +10 -.026 + XI +11 .069 + IXX+12 .033 + IX +13 .018 + I +14 -.006 + I +15 .131 + IXXX16 -.063 +XXI +17 -.133 XXXI +18 .009 + I +19 .089 + IXX+20 .021 + IX +21 .086 + IXX+22 -.051 + XI +23 .157 + IXX+X24 .006 + I +25 -.181 XX+XXI +26 -.065 +XXI +27 -.046 + XI +28 .115 + IXXX29 .041 + IX +30 -.035 + XI +31 -.033 + XI +32 -.058 + XI +33 -.042 + XI +34 -.009 + I +35 -.036 + XI +36 .002 + I +

Laissons de cot�e pour le moment l'aspect saisonnier de cette s�erie; saison d'ailleurs qui est

quotidienne puisque la p�eriode est de 8 fois 3 heures.

L'aspect des auto-corr�elogrammes laisserait supposer un mod�ele ARMA(1,1). Faisons une

estimation de ces parametres et dessinons les corr�elogrammes des r�esidus. Les ordres sont:

19

Page 24: Séries chronologiques : modèles de Box-Jenkins

ARIMA VAR=5. CENTERED. AROR='(1)'.MAOR='(1)'./

ESTIMATION RESIDUALS=RES5./

ACF VAR=RES5./

PACF VAR=RES5./

BMDP a un avantage: il permet de faire l'estimation des parametres par deux m�ethodes

di��erentes ce qui permet d'avoir une qualit�e du mod�ele choisi; en e�et, si les parametres estim�es

par les deux m�ethodes sont tr�es di��erents on peut douter de la justesse de celui-ci.

ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

INVERS RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 INVERS MA 1 1 -.1214 .0741 -1.64

2 INVERS AR 1 1 .8366 .0404 20.73

ESTIMATION BY BACKCASTING METHOD

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

INVERS RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 INVERS MA 1 1 -.1293 .0729 -1.77

2 INVERS AR 1 1 .8441 .0389 21.69

On peut remarquer deux choses:

1. les parametres sont stables: ce qui tendrait �a prouver qu'on ne s'est pas trop �eloign�e du

vrai mod�ele.

2. le parametre MA(1) a un \T-RATIO" inf�erieur �a 2., ce qui ne nous permet pas de conclure

qu'il est di��erent de z�ero: nous le supprimerons donc.

3. le parametre AR(1) est di��erent de 1., ce qui nous conduit �a dire qu'il n'y a pas lieu de

di��erencier la s�erie.

L'aspect \Moving Average" de la s�erie vient en fait de la saisonnalit�e de celle-ci comme on

peut le constater sur les corr�elogrammes. Pour batir un mod�ele saisonnier, il faut s'int�eresser

aux graphiques seulement aux d�ecalages 8, 16, 24, 32, : : :

20

Page 25: Séries chronologiques : modèles de Box-Jenkins

PLOT OF AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 -.019 + I +2 -.046 + XI +3 -.025 + XI +4 -.078 +XXI +5 -.076 +XXI +6 -.107 XXXI +7 .102 + IXXX8 .281 + IXX+XXXX9 .131 + IXXX+

10 -.135 +XXXI +11 .028 + IX +12 -.017 + I +13 -.049 + XI +14 .001 + I +15 -.012 + I +16 .221 + IXXX+XX17 .070 + IXX +18 -.055 + XI +19 -.013 + I +20 -.008 + I +21 -.006 + I +22 .019 + I +23 .041 + IX +24 .179 + IXXXX25 .039 + IX +26 -.099 + XXI +27 -.048 + XI +28 -.012 + I +29 -.084 + XXI +30 .014 + I +31 -.025 + XI +32 .205 + IXXX+X33 .100 + IXX +34 -.042 + XI +35 -.024 + XI +36 -.029 + XI +

PLOT OF PARTIAL AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 -.019 + I +2 -.046 + XI +3 -.027 + XI +4 -.082 +XXI +5 -.083 +XXI +6 -.122 XXXI +7 .085 + IXX+8 .274 + IXX+XXXX9 .161 + IXX+X

10 -.130 XXXI +11 .025 + IX +12 .029 + IX +13 .039 + IX +14 .060 + IX +15 -.059 + XI +16 .103 + IXXX17 .055 + IX +18 .010 + I +19 -.002 + I +20 -.018 + I +21 .030 + IX +22 .068 + IXX+23 .036 + IX +24 .113 + IXXX25 -.024 + XI +26 -.058 + XI +27 -.034 + XI +28 .002 + I +29 -.079 +XXI +30 -.024 + XI +31 -.105 XXXI +32 .110 + IXXX33 .081 + IXX+34 .041 + IX +35 -.025 + XI +36 -.024 + XI +

En regardant les graphiques pr�ec�edents, on peut en d�eduire un ajout au mod�ele comme �etant

un ARMA(1,1) sur une p�eriode de 8. Les ordres pour cela sont:

ARIMA VAR=5. CENTERED. AROR='(1),(8)'.MAOR='(8)'./

ESTIMATION RESIDUALS=RES5./

ACF VAR=RES5./

PACF VAR=RES5./

21

Page 26: Séries chronologiques : modèles de Box-Jenkins

Le r�esultat en est:

ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

INVERS RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 INVERS MA 1 8 .7542 .0656 11.49

2 INVERS AR 1 1 .8359 .0375 22.30

3 INVERS AR 2 8 .8437 .0337 25.04

RESIDUAL SUM OF SQUARES = 59632.947267

DEGREES OF FREEDOM = 228

RESIDUAL MEAN SQUARE = 261.548014

ESTIMATION BY BACKCASTING METHOD

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

INVERS RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 INVERS MA 1 8 .6793 .0613 11.08

2 INVERS AR 1 1 .8373 .0358 23.38

3 INVERS AR 2 8 .9332 .0206 45.38

RESIDUAL SUM OF SQUARES = 64231.664197

DEGREES OF FREEDOM = 228

RESIDUAL MEAN SQUARE = 281.717825

( BACKCASTS EXCLUDED )

La moyenne de la variance des r�esidus vaut environ 270, celle de la s�erie de d�epart �etant de

1450, on d�eduit que notre mod�ele permet d'expliquer environ 81% de la variance de l'inversion

de temp�erature. Les corr�elogrammes des r�esidus sont les suivants:

22

Page 27: Séries chronologiques : modèles de Box-Jenkins

PLOT OF AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 -.013 + I +2 .046 + IX +3 .012 + I +4 -.087 +XXI +5 -.058 + XI +6 -.083 +XXI +7 .028 + IX +8 -.089 +XXI +9 .083 + IXX+

10 -.089 +XXI +11 .122 + IXXX12 .044 + IX +13 .009 + I +14 .068 + IXX+15 -.081 +XXI +16 -.096 +XXI +17 -.012 + I +18 .016 + I +19 .057 + IX +20 .044 + IX +21 .070 + IXX+22 .091 + IXX +23 .048 + IX +24 -.057 + XI +25 -.070 + XXI +26 -.093 + XXI +27 -.028 + XI +28 .007 + I +29 -.046 + XI +30 .068 + IXX +31 -.027 + XI +32 .089 + IXX +33 .080 + IXX +34 .002 + I +35 .030 + IX +36 -.027 + XI +

PLOT OF PARTIAL AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 -.013 + I +2 .046 + IX +3 .014 + I +4 -.089 +XXI +5 -.062 +XXI +6 -.078 +XXI +7 .034 + IX +8 -.088 +XXI +9 .071 + IXX+

10 -.101 XXXI +11 .118 + IXXX12 .030 + IX +13 .016 + I +14 .039 + IX +15 -.058 + XI +16 -.113 XXXI +17 .036 + IX +18 .012 + I +19 .096 + IXX+20 .004 + I +21 .066 + IXX+22 .085 + IXX+23 .047 + IX +24 -.059 + XI +25 -.070 +XXI +26 -.094 +XXI +27 .046 + IX +28 .021 + IX +29 -.027 + XI +30 .038 + IX +31 -.060 + XI +32 .064 + IXX+33 .068 + IXX+34 -.024 + XI +35 .028 + IX +36 -.019 + I +

On peut constater sur ces dessins que les r�esidus forment bien un bruit blanc.

L'inversion de temp�erature suit donc un mod�eleARMA (1; 0)�(1; 1)8. Pour la temp�erature au

Peuil-de-Claix, on peut trouver par la meme technique, qu'elle suit un mod�ele ARIMA (1; 0; 1)�

(0; 1; 1)8 dont l'estimation des parametres est la suivante:

23

Page 28: Séries chronologiques : modèles de Box-Jenkins

ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

8

TPEUIL RANDOM 1- 240 (1-B )

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 TPEUIL MA 1 1 -.4365 .0614 -7.11

2 TPEUIL MA 2 8 .8245 .0385 21.41

3 TPEUIL AR 1 1 .9346 .0267 34.94

RESIDUAL SUM OF SQUARES = 25531.598432

DEGREES OF FREEDOM = 228

RESIDUAL MEAN SQUARE = 111.980695

ESTIMATION BY BACKCASTING METHOD

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

8

TPEUIL RANDOM 1- 240 (1-B )

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 TPEUIL MA 1 1 -.4311 .0599 -7.20

2 TPEUIL MA 2 8 .9490 .0114 82.91

3 TPEUIL AR 1 1 .9390 .0232 40.48

RESIDUAL SUM OF SQUARES = 21095.997980

DEGREES OF FREEDOM = 228

RESIDUAL MEAN SQUARE = 92.526307

La moyenne de la variance des r�esidus vaut environ 100, celle de la s�erie de d�epart �etant

d'environ 1520, on peut en d�eduire que notre mod�ele explique environ 93% de la variance de la

temp�erature au Peuil-de-Claix.

24

Page 29: Séries chronologiques : modèles de Box-Jenkins

Chapitre 7

ETUDE MULTIVARIEE DES

SERIES CHRONOLOGIQUES

7.1 Fonction de corr�elation crois�ee

7.1.1 D�e�nition

{ La covariance crois�ee au d�ecalage k entre une s�erie Xt et une s�erie Yt, X;Y (k) est d�e�nie

par:

X;Y (k) = 1=nn�kXj=1

(Yj+k � Y )(Xj �X) avec X = 1=nnXi=1

Xi et Y = 1=nnXi=1

Yi (7.1)

Il faut remarquer que, ici encore, la somme ne fait intervenir que n � k termes mais on

divise par n et non pas par n� k comme on le fait dans un calcul de covariance habituel.

Il faut aussi dire que dans ce calcul de covariance on essaie de conna�tre l'in uence de la

s�erie X sur la s�erie Y avec un certain d�ecalage dans le temps.

{ La corr�elation crois�ee au d�ecalage k entre deux s�eries Xt et Yt, �X;Y (k) est d�e�nie par:

�X;Y (k) = X;Y (k)= X;Y (0) (7.2)

{ La fonction de corr�elation crois�ee est la fonction qui �a k associe la valeur �X;Y (k). On

notera cette fonction comme �etant la CCF de la s�erie X sur la s�erie Y.

7.1.2 L'exemple de la pollution

Regardons la corr�elation crois�ee entre l'inversion de temp�erature et le niveau de SO2 mesur�e

�a la Villeneuve de Grenoble. Le programme que nous utilisons permet d'�etudier en meme temps

l'in uence des 2 variables l'une sur l'autre. Les ordres de BMDP sont les suivants:

CCF VAR=3,5./

Le r�esultat est, en partie, le suivant:

25

Page 30: Séries chronologiques : modèles de Box-Jenkins

CORRELATION OF SO2VILLE AND INVERS IS .52

PLOT OF CROSS CORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I-20 .367 + IXX+XXXXXX-19 .410 + IXX+XXXXXXX-18 .419 + IXX+XXXXXXX-17 .356 + IXX+XXXXXX-16 .252 + IXX+XXX-15 .221 + IXX+XXX-14 .300 + IXX+XXXXX-13 .396 + IXX+XXXXXXX-12 .453 + IXX+XXXXXXXX-11 .485 + IXX+XXXXXXXXX-10 .504 + IXX+XXXXXXXXXX-9 .463 + IXX+XXXXXXXXX-8 .386 + IXX+XXXXXXX-7 .357 + IXX+XXXXXX-6 .421 + IXX+XXXXXXXX-5 .525 + IXX+XXXXXXXXXX-4 .615 + IXX+XXXXXXXXXXXX-3 .667 + IXX+XXXXXXXXXXXXXX-2 .696 + IXX+XXXXXXXXXXXXXX-1 .651 + IXX+XXXXXXXXXXXXX0 .521 + IXX+XXXXXXXXXX1 .416 + IXX+XXXXXXX2 .438 + IXX+XXXXXXXX3 .499 + IXX+XXXXXXXXX4 .536 + IXX+XXXXXXXXXX5 .548 + IXX+XXXXXXXXXXX6 .530 + IXX+XXXXXXXXXX7 .468 + IXX+XXXXXXXXX8 .348 + IXX+XXXXXX9 .277 + IXX+XXXX

10 .291 + IXX+XXXX11 .338 + IXX+XXXXX12 .364 + IXX+XXXXXX13 .374 + IXX+XXXXXX14 .374 + IXX+XXXXXX15 .333 + IXX+XXXXX16 .266 + IXX+XXXX17 .201 + IXX+XX18 .214 + IXX+XX19 .272 + IXX+XXXX20 .321 + IXX+XXXXX

Comme on a mis en premier l'indice de pollution, les premi�eres valeurs pour des d�ecalages

n�egatifs concernent l'in uence de l'inversion sur la pollution et celles des d�ecalages positifs

concernent l'in uence de la pollution sur l'inversion de temp�erature.

Comme on le constate, la corr�elation crois�ee entre deux s�eries qui �evoluent en meme temps

(ici elles sont p�eriodiques de meme p�eriode) ne veut rien dire. C'est dans ce probl�eme qu'on voit

l'aspect n�ecessaire de la mod�elisation univari�ee des s�eries.

Constatons toutefois que dans ce corr�elogramme, il semblerait que l'e�et de l'inversion de

temp�erature se fasse avec un d�ecalage entre 6 et 9 heures de retard.

7.2 Mod�ele de Fonction de Transfert

On peut mod�eliser l'in uence d'une s�erie Xt sur une autre s�erie Yt sous une forme lin�eaire

par:

Yt � �1Yt�1 � : : :� �rYt�r = !0Xt�b � !1Xt�b�1 � : : :� !sXt�b�s +Nt

�(B)Yt = !(B)Xt�b +Nt

Yt = ��1(B)!(B)Xt�b + nt

Yt = v(B)Xt + nt

o�u Nt est un bruit. On retrouve une formulation d'un �ltre lin�eaire o�u la s�erie en entr�ee est

Xt, la sortie est la s�erie Yt, la fonction de transfert est d�ecrite dans le polynome v(B).

Tout le probl�eme r�eside alors dans l'estimation de ce polynome v(B).

26

Page 31: Séries chronologiques : modèles de Box-Jenkins

7.3 L'in uence de l'inversion de temp�erature sur la pollution

Revenons �a notre exemple pour plus de simplicit�e. Pour essayer d'identi�er notre mod�ele, le

principe est:

1. Mod�eliser suivant un mod�ele SARIMA, l'inversion de temp�erature et r�ecup�erer les r�esidus.

2. Filtrer la pollution suivant le meme mod�ele et r�ecup�erer les r�esidus.

3. Calculer le corr�elation crois�ee entre ces r�esidus.

Les ordres du programme BMDP sont les suivants:

ARIMA VAR=5. CENTERED. AROR='(1)',(8)'. MAOR='(8)'./

ESTIMATION RESIDUALS=RES5./

FILTER VAR=3. RESIDUALS=RES3./

CCF VAR=RES5,RES3. MAXLAG=10./

Le r�esultat est le suivant:

27

Page 32: Séries chronologiques : modèles de Box-Jenkins

CORRELATION OF RES5 AND RES3 IS .07

CROSS CORRELATIONS OF RES5 (I) AND RES3 (I+K)

1- 10 .16 .06 .04 .07 .11 .03 .05 -.12 -.13 .05

ST.E. .07 .07 .07 .07 .07 .07 .07 .07 .07 .07

CROSS CORRELATIONS OF RES3 (I) AND RES5 (I+K)

1- 10 -.08 .06 .03 -.02 -.02 -.01 .10 -.10 .06 .02

ST.E. .07 .07 .07 .07 .07 .07 .07 .07 .07 .07

TRANSFER FUNCTION WEIGHTS

SCCF(X(I),Y(I+K)) SCCF(Y(I),X(I+K))

LAG *SY/SX *SX/SY *SY/SX *SX/SY

0 .11126 .04062 .11126 .04062

1 .26738 .09763 -.12688 -.04633

2 .10517 .03840 .10410 .03801

3 .06226 .02273 .04290 .01566

4 .11743 .04288 -.03200 -.01168

5 .18321 .06689 -.03534 -.01290

6 .04845 .01769 -.02228 -.00813

7 .09044 .03302 .15734 .05745

8 -.19448 -.07101 -.16512 -.06029

9 -.21450 -.07832 .09859 .03600

10 .08346 .03047 .03751 .01370

WHERE X(I) IS THE FIRST SERIES, Y(I) THE SECOND

SERIES, SX THE STANDARD ERROR OF X(I), AND SY

THE STANDARD ERROR OF Y(I)

PLOT OF CROSS CORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I-10 .023 + IX +-9 .060 + IX +-8 -.100 +XXI +-7 .095 + IXX+-6 -.013 + I +-5 -.021 + XI +-4 -.019 + I +-3 .026 + IX +-2 .063 + IXX+-1 -.077 +XXI +0 .067 + IXX+1 .162 + IXX+X2 .064 + IXX+3 .038 + IX +4 .071 + IXX+5 .111 + IXXX6 .029 + IX +7 .055 + IX +8 -.118 XXXI +9 -.130 XXXI +10 .050 + IX +

28

Page 33: Séries chronologiques : modèles de Box-Jenkins

Remarquons qu'ici on a bien mis la variable de m�et�eorologie en premier. Si on regarde

le dessin de la fonction de corr�elation crois�ee, on constate que la seule corr�elation vraiment

signi�cative est au d�ecalage 1 (soit 3 heures de d�ecalage). On remarquera ainsi que l'hypoth�ese

d'un retard entre 6 et 9 heures que nous avions faite pr�ec�edement �etait fausse.

Ici on peut proposer deux mod�eles:

1. On remarque une certaine forme de courbe en exponentielle d�ecroissante sur les d�ecalages

1, 2, 3 pour la CCF. On propose alors un mod�ele o�u le polynome �(B) est du deuxi�eme

degr�e. Mais dans ce cas l'�evaluation des estimateurs du polynome v(B) devient relativement

compliqu�e. Nous vous proposons de vous reporter au livre de Box et Jenkins pour cela [1].

2. On suppose sinon que le polynome �(b) se r�eduit �a l'unit�e. Alors une premi�ere estimation

du polynome est donn�ee directement par le programme; il faut pour cela regarder dans le

paragraphe TRANSFERT FUNCTION WEIGHTS, �a l'intersection de la ligne LAG

0 et de la premi�ere colonne. On obtient ainsi une valeur initiale du parametre: v1 = 0:27,

et b = 1 avec !0 = 0:27. Cette valeur va etre estim�ee �a nouveau quand on soumettra le

mod�ele �nal.

Dans le programme BMDP, on va soumettre la variable de pollution �a un mod�ele o�u elle

est in uenc�ee par l'inversion �a un d�ecalage de 3 heures avec un coe�cient de 0.27, puis on va

mod�eliser par un mod�ele SARIMA les r�esidus r�esultants.

ARIMA VAR=3. CENTERED. /

INDEP VAR=5. CENTERED.

UPORDERS='(1)'. UPVALUES=0.27./

ESTIMATION

RESIDUALS=RES53./

ACF VAR=RES53./

PACF VAR=RES53./

Le r�esultat des fonctions d'autocorr�elation et d'autocorr�elation partielle sont les suivants:

29

Page 34: Séries chronologiques : modèles de Box-Jenkins

PLOT OF AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 .635 + IXX+XXXXXXXXXXXXX2 .206 + IXXX+X3 -.158 XXXXI +4 -.285 XXX+XXXI +5 -.180 XXXXXI +6 .050 + IX +7 .292 + IXXXX+XX8 .408 + IXXXX+XXXXX9 .260 + IXXXX+X

10 .012 + I +11 -.192 XXXXXI +12 -.228 X+XXXXI +13 -.095 + XXI +14 .118 + IXXX +15 .271 + IXXXXX+X16 .379 + IXXXXX+XXX17 .276 + IXXXXX+X18 .104 + IXXX +19 -.082 + XXI +20 -.155 + XXXXI +21 -.103 + XXXI +22 .018 + I +23 .114 + IXXX +24 .173 + IXXXX +25 .070 + IXX +26 -.003 + I +27 -.070 + XXI +28 -.061 + XXI +29 .010 + I +30 .118 + IXXX +31 .174 + IXXXX +32 .178 + IXXXX +33 .074 + IXX +34 .022 + IX +35 -.014 + I +36 -.010 + I +

PLOT OF PARTIAL AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 .635 + IXX+XXXXXXXXXXXXX2 -.331 XXXXX+XXI +3 -.228 XXX+XXI +4 .018 + I +5 .115 + IXXX6 .129 + IXXX7 .175 + IXX+X8 .113 + IXXX9 -.151 X+XXI +10 -.046 + XI +11 -.002 + I +12 .038 + IX +13 .061 + IXX+14 .080 + IXX+15 .012 + I +16 .202 + IXX+XX17 -.022 + XI +18 .054 + IX +19 -.023 + XI +20 -.000 + I +21 -.023 + XI +22 -.013 + I +23 -.045 + XI +24 .013 + I +25 -.136 XXXI +26 .118 + IXXX27 .022 + IX +28 .038 + IX +29 .028 + IX +30 .061 + IXX+31 .000 + I +32 .008 + I +33 -.044 + XI +34 .080 + IXX+35 -.002 + I +36 -.012 + I +

En regardant la PACF, on peut supposer qu'�a part le probl�eme du �a la saisonnalit�e elle

n'est pas nulle seulement aux d�ecalages 1, 2, 3. On mod�eliserait ces r�esidus comme un SARIMA

(3; 0; 0) � (1; 0; 0)8. Mais l'estimation montre que le troisi�eme parametre ne peut pas etre jug�e

signi�cativement di��erent de 0. On mod�elise donc ces r�esidus comme un SARIMA (2; 0; 0) �

(1; 0; 0)8.

ARIMA VAR=3. CENTERED. /

INDEP VAR=5. CENTERED.

30

Page 35: Séries chronologiques : modèles de Box-Jenkins

UPORDERS='(1)'. UPVALUES=0.27./

ARIMA VAR=3. CENTERED. AROR='(1,2),(8)'./

ESTIMATION

RESIDUALS=RES53./

Le r�esultat est le suivant:

31

Page 36: Séries chronologiques : modèles de Box-Jenkins

ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD

SUMMARY OF THE MODEL

OUTPUT VARIABLE -- SO2VILLE

INPUT VARIABLES -- NOISE INVERS

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

SO2VILLE RANDOM REMOVED 1- 240

INVERS RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 SO2VILLE AR 1 1 .8749 .0653 13.41

2 SO2VILLE AR 1 2 -.2430 .0636 -3.82

3 SO2VILLE AR 2 8 .4203 .0593 7.09

4 INVERS UP 1 1 .3910 .1013 3.86

RESIDUAL SUM OF SQUARES = 166052.610876

DEGREES OF FREEDOM = 225

RESIDUAL MEAN SQUARE = 738.011604

ESTIMATION BY BACKCASTING METHOD

SUMMARY OF THE MODEL

OUTPUT VARIABLE -- SO2VILLE

INPUT VARIABLES -- NOISE INVERS

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

SO2VILLE RANDOM REMOVED 1- 240

INVERS RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 SO2VILLE AR 1 1 .8501 .0604 14.09

2 SO2VILLE AR 1 2 -.2298 .0594 -3.87

3 SO2VILLE AR 2 8 .4812 .0533 9.02

4 INVERS UP 1 1 .4267 .0968 4.41

RESIDUAL SUM OF SQUARES = 167033.000869

DEGREES OF FREEDOM = 225

RESIDUAL MEAN SQUARE = 742.368893

( BACKCASTS EXCLUDED )

32

Page 37: Séries chronologiques : modèles de Box-Jenkins

PLOT OF AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 .003 + I +2 .001 + I +3 -.001 + I +4 -.035 + XI +5 .032 + IX +6 -.012 + I +7 .078 + IXX+8 -.096 +XXI +9 -.031 + XI +10 -.101 XXXI +11 -.064 +XXI +12 -.013 + I +13 .064 + IXX+14 .083 + IXX+15 .000 + I +16 .048 + IX +17 .062 + IXX+18 .075 + IXX+19 .023 + IX +20 -.002 + I +21 .041 + IX +22 -.076 +XXI +23 .021 + IX +24 .080 + IXX+25 -.095 +XXI +26 -.005 + I +27 -.092 +XXI +28 -.026 + XI +29 -.049 + XI +30 .040 + IX +31 .022 + IX +32 .056 + IX +33 -.043 + XI +34 -.076 + XXI +35 .093 + IXX +36 -.028 + XI +

PLOT OF PARTIAL AUTOCORRELATIONS

-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0LAG CORR. +----+----+----+----+----+----+----+----+----+----+

I1 .003 + I +2 .001 + I +3 -.001 + I +4 -.035 + XI +5 .033 + IX +6 -.012 + I +7 .078 + IXX+8 -.099 +XXI +9 -.028 + XI +10 -.105 XXXI +11 -.057 + XI +12 -.027 + XI +13 .073 + IXX+14 .072 + IXX+15 .020 + IX +16 .045 + IX +17 .079 + IXX+18 .068 + IXX+19 .007 + I +20 -.028 + XI +21 .029 + IX +22 -.072 +XXI +23 .028 + IX +24 .104 + IXXX25 -.073 +XXI +26 .013 + I +27 -.074 +XXI +28 -.014 + I +29 -.044 + XI +30 .020 + I +31 -.016 + I +32 .073 + IXX+33 -.073 +XXI +34 -.058 + XI +35 .073 + IXX+36 -.034 + XI +

Si on note St le dioxyde de soufre mesur�e �a la Villeneuve et It l'inversion de temp�erature �a

l'instant t, on peut �ecrire le mod�ele:

(1� 0:86B + 0:23B2)(1� 0:45B8)St = 0:41It�1+ at

33

Page 38: Séries chronologiques : modèles de Box-Jenkins

7.4 Les in uences de l'inversion et de la temp�erature

Par la meme d�emarche, on peut �etudier l'in uence de la temp�erature mesur�ee au Peuil-

de-Claix sur la pollution. On remarquerait alors que la corr�elation est positive et est �a e�et

imm�ediat, et qu'une premi�ere estimation du parametre !0 est 0.67.

Le programme qui permet d'analyser les in uences de ces deux parametres en meme temps

est:

ARIMA VAR=3. CENTERED./

INDEP VAR=5. CENTERED.

UPORDERS='(1)'. UPVALUES=0.27./

INDEP VAR=2. CENTERED.

UPORDERS='(0)'. UPVALUES=0.67./

ARIMA VAR=3. CENTERED. AROR='(1,2),(8)'./

ESTIMATION RESIDUALS=RES523./

ACF VAR=RES523./

PACF VAR=RES523./

Le r�esultat en est:

34

Page 39: Séries chronologiques : modèles de Box-Jenkins

ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD

SUMMARY OF THE MODEL

OUTPUT VARIABLE -- SO2VILLE

INPUT VARIABLES -- NOISE INVERS TPEUIL

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

SO2VILLE RANDOM REMOVED 1- 240

INVERS RANDOM REMOVED 1- 240

TPEUIL RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 SO2VILLE AR 1 1 .8350 .0648 12.88

2 SO2VILLE AR 1 2 -.2590 .0637 -4.07

3 SO2VILLE AR 2 8 .3734 .0607 6.15

4 INVERS UP 1 1 .3832 .0939 4.08

5 TPEUIL UP 1 0 .5313 .0980 5.42

RESIDUAL SUM OF SQUARES = 147714.352336

DEGREES OF FREEDOM = 224

RESIDUAL MEAN SQUARE = 659.439073

ESTIMATION BY BACKCASTING METHOD

SUMMARY OF THE MODEL

OUTPUT VARIABLE -- SO2VILLE

INPUT VARIABLES -- NOISE INVERS TPEUIL

VARIABLE VAR. TYPE MEAN TIME DIFFERENCES

SO2VILLE RANDOM REMOVED 1- 240

INVERS RANDOM REMOVED 1- 240

TPEUIL RANDOM REMOVED 1- 240

PARAMETER VARIABLE TYPE FACTOR ORDER ESTIMATE ST. ERR. T-RATIO

1 SO2VILLE AR 1 1 .8126 .0600 13.55

2 SO2VILLE AR 1 2 -.2387 .0597 -4.00

3 SO2VILLE AR 2 8 .4312 .0552 7.81

4 INVERS UP 1 1 .4063 .0897 4.53

5 TPEUIL UP 1 0 .5733 .0980 5.85

RESIDUAL SUM OF SQUARES = 148664.011513

DEGREES OF FREEDOM = 224

RESIDUAL MEAN SQUARE = 663.678623

Si on note St le dioxyde de soufre mesur�e �a la Villeneuve, It l'inversion de temp�erature

et Tt la temp�erature au Peuil-de-Claix �a l'instant t, on peut mod�eliser les in uences des deux

35

Page 40: Séries chronologiques : modèles de Box-Jenkins

parametres m�et�eorologiques sous la forme:

(1� 0:82B + 0:24B2)(1� 0:40B8)St = 0:40It�1+ 0:55Tt+ at

Le pourcentage de variance expliqu�ee par ce mod�ele est d'environ 80%.

Il est bien �evident que dans une �etude plus approfondie nous utiliserions d'autres parametres

pour conna�tre leurs in uences sur la pollution, par exemple on peut supposer que la vitesse du

vent doit intervenir pour \chasser" la pollution ainsi que sa direction suivant que ce vent am�ene

ou non les �emissions de pollution.

7.5 Pr�evisions

En�n, pour terminer la justi�cation d'un mod�ele, il faut v�eri�er si les pr�evisions que nous

pouvons faire, �a partir de ce mod�ele, sont compatibles avec ce qui est observ�e.

On peut utiliser 2 mani�eres de faire:

1. Faire une pr�evision sur plusieurs temps (par exemple, le dernier jour observ�e) �a partir des

donn�ees mesur�ees sur la p�eriode pr�ec�edant ceux-ci.

2. Faire une pr�evision r�eactualis�ee �a chaque fois par ce qui a �et�e r�eellement observ�e.

Notre programme BMDP se terminera donc par:

FORECAST CASES=8. START=233./

FORECAST CASES=1. START=234./

FORECAST CASES=1. START=235./

FORECAST CASES=1. START=236./

FORECAST CASES=1. START=237./

FORECAST CASES=1. START=238./

FORECAST CASES=1. START=239./

FORECAST CASES=1. START=240./

Le r�esultat sera le suivant:

36

Page 41: Séries chronologiques : modèles de Box-Jenkins

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

233 63.28706 25.14692 63.00000 .28706

234 82.49854 32.23587 140.00000 -57.50146

235 130.99423 33.77615 189.00000 -58.00577

236 155.05760 33.92746 129.00000 26.05760

237 135.17631 33.92769 120.00000 15.17631

238 101.64390 33.93442 61.00000 40.64390

239 108.05569 33.93925 62.00000 46.05569

240 80.80442 33.94053 64.00000 16.80442

STANDARD ERROR = 25.1469 BY CONDITIONAL METHOD

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

234 82.26831 25.08865 140.00000 -57.73169

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

235 177.18237 25.33572 189.00000 -11.81763

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

236 187.64872 25.29021 129.00000 58.64872

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

237 100.22288 25.54174 120.00000 -19.77712

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

238 95.78532 25.51849 61.00000 34.78532

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

239 79.13462 25.56798 62.00000 17.13462

PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL

240 53.71337 25.53624 64.00000 -10.28663

Comme on peut le constater, notre mod�ele serait �a am�eliorer puisqu'il aurait une certaine

tendance �a estimer avec un peu de retard la pointe de pollution; ceci est peut-etre du �egalement

au pas de temps choisi de 3 heures qui est sans sans doute un peu grand.

37

Page 42: Séries chronologiques : modèles de Box-Jenkins

Bibliographie

[1] G.E.P. Box et G.M. Jenkins. Time Series Analysis: forecasting and control. Holden-Day

(1976).

[2] P.J. Brockwell et R.A. Davis. Time Series: Theory and Method. Springer-Verlag (1987).

[3] P.F. Coutrot et F. Droesbeke. Les m�ethodes de pr�evision. Que sais-je? no 2157 (1984).

[4] W.J. Dixon et coll. BMDP Statistical Software. University of California Press (1985).

[5] E. Horber. Exploratory Data Analysis: User's Manual. Version 2.1/1. Universit�e de Gen�eve.

(1989).

[6] C.W. Ostrow Jr. Time Series Analysis: Regression Techniques. S�erie: Quantitative Appli-

cations in the Social Sciences. Sage Publications (1982).

[7] B. Rapacchi. TSEDA. User's Manual. Centre InterUniversitaire de Calcul de Grenoble

(1989).

[8] B. Rapacchi. Lissons les donn�ees !!. Centre InterUniversitaire de Calcul de Grenoble (1989).

[9] D.H. Sanders, A.F. Murph, R.J. Eng. Les statistiques: une approche nouvelle. Mac-Graw

Hill (1984).

[10] SPSS Inc. SPSSx. User's Manual. MacGraw-Hill Book Company (1986).

38