20
Les modèles à équations simultanées 1.1 Nature et type de modèles à Equations simultanées (MES) Les MES sont des modèles dans lesquels nous avons plus d’une équation reliée au travers des variables à gauche(VAG) qui se trouve aussi à droite. Un MES est donc une structure entre variables endogènes et exogènes dans laquelle : Il y a pour chaque variable endogène une équation Chaque équation est reliée aux autres Les variables endogènes sont des variables dépendantes jointes Les variables dans un MES sont de deux catégories, soit des variables endogènes contemporaines(à expliquer) soit des variables prédéterminées ; les variables prédéterminées comprennent : Les variables endogènes retardées Les variables exogènes contemporaines Les variables exogènes retardées3 Exemples considérons la fonction macroéconomique suivante : t t t C Y u Equation de comportement des consommateurs t t t Y C I i= 1, t Identité Les variables endogènes contemporaines sont C et Y, les variables prédéterminées I et l’intercepte (la constante). C est la consommation, Y le PIB en terme réel et I constitue l’investissement dont il est supposé non stochastique ou du moins indépendamment distribué par rapport à u. ce modèle est appelé modèle structurel. Le modèle est simultané expliquant la consommation la consommation par la première équation et le revenu par la deuxième équation. Ce modèle constitue t il un MES ? Toutes les relations incluses sont requises pour déterminer la valeur des variables endogènes ; C et Y sont des variables dépendantes jointes. En effet si u varie Y et C varient aussi. Donc non seulement C et Y sont des variables dépendantes mais sont corrélées avec u. Ceci, comme on va le voir aura des conséquences sur les propriétés statistiques des estimateurs dans le MES, car les variables de droite Y puisque corrélée avec u don aléatoire ; ceci viole une des hypothèses classiques de modèle de régression. En substituant , on obtient 1 1 1 1 1 1 1 1 1 t t t t t t C I u Y I u Cette dernière écriture constitue la forme réduite du modèle structurel. La forme réduite montre explicitement comment les variables endogènes sont jointement dépendantes des variables prédéterminées et du terme aléatoire (stochastique) u. Dans notre cas, C et Y sont complètement déterminées par I et u ; I est déterminé en dehors du système. En dira qu’un modèle est simultané SSI toutes les relations incluses dans le modèles sont requises pour déterminer la valeur d’au moins une des variables endogène dans le système.

Les modèles à équations simultanée

Embed Size (px)

Citation preview

Page 1: Les modèles à équations simultanée

Les modèles à équations simultanées 1.1 Nature et type de modèles à Equations simultanées (MES) Les MES sont des modèles dans lesquels nous avons plus d’une équation reliée au travers des variables à gauche(VAG) qui se trouve aussi à droite. Un MES est donc une structure entre variables endogènes et exogènes dans laquelle :

Il y a pour chaque variable endogène une équation Chaque équation est reliée aux autres Les variables endogènes sont des variables dépendantes jointes

Les variables dans un MES sont de deux catégories, soit des variables endogènes contemporaines(à expliquer) soit des variables prédéterminées ; les variables prédéterminées comprennent :

Les variables endogènes retardées Les variables exogènes contemporaines Les variables exogènes retardées3

Exemples considérons la fonction macroéconomique suivante :

t t tC Y u Equation de comportement des consommateurs

t t tY C I i= 1, t Identité

Les variables endogènes contemporaines sont C et Y, les variables prédéterminées I et l’intercepte (la constante). C est la consommation, Y le PIB en terme réel et I constitue l’investissement dont il est supposé non stochastique ou du moins indépendamment distribué par rapport à u. ce modèle est appelé modèle structurel. Le modèle est simultané expliquant la consommation la consommation par la première équation et le revenu par la deuxième équation. Ce modèle constitue t il un MES ? Toutes les relations incluses sont requises pour déterminer la valeur des variables endogènes ; C et Y sont des variables dépendantes jointes. En effet si u varie Y et C varient aussi. Donc non seulement C et Y sont des variables dépendantes mais sont corrélées avec u. Ceci, comme on va le voir aura des conséquences sur les propriétés statistiques des estimateurs dans le MES, car les variables de droite Y puisque corrélée avec u don aléatoire ; ceci viole une des hypothèses classiques de modèle de régression. En substituant , on obtient

1

1 1 1

1 1

1 1 1

t t t

t t t

C I u

Y I u

Cette dernière écriture constitue la forme réduite du modèle structurel. La forme réduite montre explicitement comment les variables endogènes sont jointement dépendantes des variables prédéterminées et du terme aléatoire (stochastique) u. Dans notre cas, C et Y sont complètement déterminées par I et u ; I est déterminé en dehors du système. En dira qu’un modèle est simultané SSI toutes les relations incluses dans le modèles sont requises pour déterminer la valeur d’au moins une des variables endogène dans le système.

Page 2: Les modèles à équations simultanée

Exemple Considérant le modèle d’offre et de demande suivant :

0 1 1 1

0 1 2 1

0

0

qt t t

ot t t

d ot t

Q P u

Q P u

Q Q Q

Les variables endogènes sont P et Q ; les variables sont les interceptes (les deux constantes). P et Q sont des variables dépendantes jointes car si u1 varie Qd varie et donc P varie. Si au contraire u2 varie alors Qo varie et donc P varie aussi. Si on régresse

tQ P u cela violerait les hypothèses classiques puisque P est stochastique.

En général, la forme structurelle peut s’écrire :

11 1 12 2 1 11 1 12 2 1 1

21 2 22 2 2 21 1 22 2 2 2

1 1 2

... ...

... ...

........................................................................................

t t M Mt t t k Kt t

t t M Mt t t k Kt t

M M M

Y Y Y X X X u

Y Y Y X X X u

Y

1 1 2 2... ...Mt MM Mt M t M t Mk Kt MtY Y X X X u

1 1 111 12 1 11 12 1

2 2 221 22 2 21 22 2

1 2 1 2

t t tM K

t t tM K

M M MM M M MKMt Kt Mt

Y X u

Y X u

Y X u

Soit ( ) ( 1) ( ) ( ) ( 1)M M t M M K t M K t MB Y C X u (1.1)

Les hypothèses sont d’une manière plus compacte, on peut écrire

(0, )tu N

1 1 11 12 1

2 2 21 22 21 2 ( )

1 2

( ) u u

t t M

t t MTt i t t t Mt M M

M M MMMt Mt

u u

u uu E u u E u

u u

Y = variables endogènes X = variables exogènes u = vecteur aléatoire et les coefficients de la forme structurelles Nous avons donc M variables endogènes et K variables exogènes

t t tBY CX u (1.2)

Qi peut s’écrire lorsque B est inversible

1 1t t t t t tY B CX B u Y X v (1.3)

Ou est la matrice des paramètres de la forme réduite de dimension (MK). la matrice variance covariance de la forme réduite s’écrit

1 1 1 1( ) ( ( ) ) ( )T T T Tt t t tE v v E B u u B B B

Page 3: Les modèles à équations simultanée

Exemple soit le modèle suivant

1 2 3 1

1 2 2

dt t t t

Ot t t

d Ot t

Q P R u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

1 2 3 1

1 2 2

t t t

t t

Q P R u

Q P u

Soit en écriture matricielle

11 32

2 21

-1 - 1

1 - 0 t t

tt t

Q u

RP u

t t tBY CX u

La forme réduite 1 1

t t t t tY B CX B u X v

Ecrite d’une manière détaillée

3 21 2 2 11 11 12 1

2 2 2 2

31 12 21 22 2

2 2 2 2

t t t t t

t t t t t

Q R v R v

P R v R v

Avec 1 1 2 1 2 21

2 2 2 12 2

1t t t t

t t t t

v u u uB

v u u u

Exemple soit le modèle suivant :

0 1 3 1 1t t t tC Y C u Fonction de consommation

0 1 2 1 2t t t tI r I u Fonction d’investissement

0 1 2 3t t t tr Y M u Marché monétaire

Y t t t tY C I G Identité

Yt , Ct, It et rt sont endogènes Ct-1, It-1, Mt et Gt sont des variables prédéterminées

110 2 1

210 2 1

10

11 0 - 0

- 0 0 00 1 0 -

- 0 - 0 00 0 - 1

- 0 0 0 -1-1 -1 1 0

t tt

tt

tt

tt

C uC

I uI

YM

rG

3

0

t

tu

t t tBY X u

La forme réduite 1 1

t t tY B X B u

Page 4: Les modèles à équations simultanée

0 1 1 1 0 1 0 1 2 1 2 1 1 2 1

0 1 1 1 0 1 0 2 1 1 1 2 1 1 1 1 1

0 0 1 0

(1 ) ( )

+(1- )( + (1- ) (1- ) 1

t

t

t

t

C

I

Y

r

1

12 2 1 2

0 0 1 1 0 2 1 2 1 1 2 1

1 1 1

1

1

( ) (1 ) (1- )

1

1

t

t

t

t

C

I

M

G

1 11

1 1 1 1 12

13

1 2 1

(1- ) (1- )

1 1

(1- )

t

t

t

u

u

u

Avec 1 1 1

1 1

1

Remarque1 : nous avons 2

( ) ( ) =

16 + 20 = 36

M M M KB M paramétres C M K paramétres

On a besoin de M(K + M) relations, cependant on a que MK relations, il me faut alors MM restrictions. Remarque2 : supposant le modèle suivant

0 1 2 1

1 1 2

dt t t t

Ot t t

d Ot t

Q P Y u

Q P u

Q Q Q

Comment peut-on interpréter par exemple α1 ? En d’autres termes est ce que α1= dQ/dP ? Pour répondre à cette question et d’autres, on passe à la forme réduite.

1 221 1

1 1 1 1

1 1 1 21 22 2

1 1 1 1

t tt t t t

t tt t t t

u uP Y Y v

u uQ Y Y v

On voit donc que pour répondre à cette question, il nous faut répondre à la question de savoir qu’est ce qui peut bien changer P ? De la forme réduite, on voit qu’il y a trois sources de variations de P ; les sources sont Y, u1 et u2. En d’autres termes : Un changement de Y un changement de demande Un changement de u1 un changement de demande Un changement de u2 un changement de d’offre

Si Y change 1

dQdQ dY

dPdPdY

Page 5: Les modèles à équations simultanée

Si u1 change 21

2

dQdudQdPdPdu

Si u2 change 11

1

dQdudQdPdPdu

On voit que dans un MES il n y a aucun sens de parler de l’effet d’une variable endogène sur une autre sans spécifier l’origine des chocs 1.2 les types des MES 1.2.1 Les systèmes à Equations Simultanées La forme la plus générale d’un modèle à trois équations :

1 0 2 2 3 3 4 1 5 2 1

2 0 1 1 3 3 4 1 5 2 2

3 0 1 1 2 2 4 1 5 2 3

Y Y Y Z Z u

Y Y Y Z Z u

Y Y Y Z Z u

Ce système est interdépendant puisqu’il est impossible de le résoudre pour une variable sans la résolution simultanée pour l’ensemble des variables. Exemple Soit

0 2 3 4 1 5 1

0 3 5 2

t t t t t t

t t t t

t t t t

C I Y C R u

I Y R u

Y C I G

Les variables endogènes sont variables endogènes sont Yt, It et Ct ; les variables prédéterminées sont Ct-1, Gt et Rt. ce modèle est simultané car l’estimation de Ct et de It dans les deux premières équations ne peut se faire à moins que la valeur de Y soit connue ; mais Y est fonction de C et de I dans la troisième équation. La résolution de Y, C et I ne peut se faire que simultanément. 1.2.2 Les systèmes récursifs Un système est dit récursive et non simultané si chaque variable endogène peut etre déterminée séquentiellement. Considérant le modèle suivant :

1 0 4 1 5 2 1

2 0 1 1 4 1 5 2 2

3 0 1 1 2 2 4 1 5 2 3

Y Z Z u

Y Y Z Z u

Y Y Y Z Z u

1 2 1 3 2 3cov( , ) cov( , ) cov( , ) 0u u u u u u

Bien que ce système semble être simultané, en fait, il est récursif. Etant données les valeurs de Z1 et Z2, on peut estimer Y1 puis Y2 et ainsi de suite. Dans les systèmes récursifs la méthode OLS semble appropriée. Pour la première équation, on peut utiliser l’OLS puisque Z1 et Z2 sont exogènes et donc non corrélées avec u1. OLS est aussi appropriées pour la

Page 6: Les modèles à équations simultanée

deuxième équation car Y1 et corrélée avec u2. Finalement, OLS est aussi appropriée pour la troisième équation car Y1 et Y2 sont non corrélées avec u3. Dans les systèmes récursifs la matrice b est triangulaire inférieure. 1.2.3 Les systèmes bloc récursifs Un système Bloc récursif est un groupe d’équations qui peut être subdivisé en blocs d’équations de telle manière que les équations à l’intérieur de chaque bloc sont simultanées mais les blocs d’équations sont récursives.

1 0 2 2 4 1 5 2 1

2 0 1 1 4 1 5 2 2

3 0 1 1 2 2 4 1 5 2 3

Y Y Z Z u

Y Y Z Z u

Y Y Y Z Z u

Les deux premières équations forment un bloc de deux équations simultanées car ils doivent être résolues simultanément pour avoir Y1 et Y2. Une fois Y1 et Y2 obtenues, on peut les substituer dans la troisième équation pour obtenir Y3. Ce modèle particulier est composé de deux blocs. Le premier bloc comporte deux équations simultanées, et le deuxième bloc comporte une équation. Pour estimer ce type de système, il faut estimer le premier bloc, le deuxième bloc peut être estimé via OLS. 1.2.4 Les systèmes Seemingly Unrelated Equations (SUR) Considérant le groupe de fonctions de demande pour des produits reliés

1 0 4 1 5 2 1

2 0 4 3 5 4 2

3 0 4 ( 5 3

Y Z Z u

Y Z Z u

Y Z Z u

Si les erreurs sont non corrélées, alors, il n y a aucune relation entre les trois équations. Dans ce cas on peut utiliser L’OLS. Mais si les erreurs sont reliées, alors on doit recourir à des méthodes d’estimation plus sophistiquées. 1.3 Le Biais de Simultanéité Soit le modèle

t T tC Y u Equation de comportement des consommateurs

t T tY C I Identité

2 2t t

1, 2...

( ) 0 E(u ) E(u ) 0t t j

t T

E u u

Le modèle réduit s’écrit : 1

1 1 1

1 1

1 1 1

t t t

t t t

C I u

Y I u

Page 7: Les modèles à équations simultanée

2 2

1 1( ) ( )

1 1 1

( )( ) ( ) ( ) 0 0 1

1 1

t t t t t

tt t t t t t

E Y I Y E Y u

E uE Y u E Y E Y u E u SSI

Ceci viole évidemment une des hypothèses classiques du modèle de régression qui postule que les variables à droite sont indépendantes des variables à gauche. Ce biais de simultanéité implique que lorsqu’on applique OLS à la fonction de consommation, notre estimateur de β sera in consistant. En effet

2 2 2

ˆt t t t t t t

t t t

c y y u y y u

y y y

2 2

limˆlim( ) lim lim lim

lim

t t t t

t t

y u P y uP P P P

y P y

2 2

lim lim /ˆlim( )

lim lim /

t t t t

t t

P y u P y u TP

P y P y

2 2

2 2

ˆlim( ) de cov(Y,u) sur var(Y)

/(1 ) 1ˆlim( )1Y Y

P ratio

P

Etant donnée que 0<β<1 et σ2 > 0 alors ˆlim( )P , donc ̂ surestime β/ en d’autres

termes, ̂ est biaisé, et ce biais ne disparaît pas même asymptotiquement. 1.4 Le problème d’identification Le problème d’identification concerne la question de savoir si on peut obtenir B, et C quand on connaît la matrice. Le modèle structurel ne peut être estimé par la méthode OLS, mais le modèle réduit peut l’être. Ceci suggère donc que l’on puisse estimer déterminer les coefficients de la forme structurelle à partir de la forme réduite. Evidemment ceci peut être fait à condition que l’on puisse exprimer les coefficients de la forme structurelle en fonction de la forme réduite ; c’est ce que constitue le problème d’identification. Pour illustrer ce problème, considérant l’exemple suivant :

1 2 3 1

1 2 2

dt t t t

Ot t t

d Ot t

Q P R u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

1 2 3 1

1 2 2

t t t

t t

Q P R u

Q P u

Page 8: Les modèles à équations simultanée

La forme réduite s’écrit :

3 21 2 2 11 11 12 1

2 2 2 2

31 12 21 22 2

2 2 2 2

t t t t t

t t t t t

Q R v R v

P R v R v

Prenons l’équation de demande

11 12 1 1 2 3 1

1 2 12 22 2 3 1( )t t t t t t

t t t t

R v Q P R u

R v R u

Les résidus s’éliminent et on obtient :

11 12 1 2 21 2 22 3( )t tR R

Donc 11 1 2 21

12 2 22 3

On a deux équations pour déterminer trois paramètres de la forme structurelle 1 2 3, et . On

dira alors que l’équation de demande est sous identifiée. Quant à l’équation d’offre, on a

11 12 1 1 2 2

1 2 21 22 2 2( )t t t t t

t t t

R v Q P u

R v u

Les résidus s’éliminent et on obtient :

11 12 1 2 21 2 22t tR R

Donc 11 1 2 21

12 2 22

Ici on a deux équations pour déterminer deux coefficient de la forme structurelle : 1 et 2. on dira donc que l’équation d’offre est exactement identifiée (Just identifiée). Il existe une autre méthode pour vérifier si une équation est identifiée ou non. Celle-ci vient de la relation entre forme réduite et forme structurelle. On a :

1 1 0 0B C B C B C

Ou de manière équivalente C 0 0K

B AWI

(1.4)

Avec A de dimension M(M+K) et X de dimension (M+K)K Utilisons cette méthode pour vérifier l’identification du problème précédent. Formons la quantité 0AW Cela nous donne

11 12

2 1 3 21 22

2 1

1 - - - 0

1 - - 0 1 0

0 1

En multipliant cette dernière expression, on voit que l’on obtient exactement les quatres équations obtenues précédemment ; deux pour l’équation de la demande et deux pour l’équation d’offre.

Page 9: Les modèles à équations simultanée

Exemple soit l’exemple suivant : Exemple soit le modèle suivant

0 1 1

0 1 2

dt t t

Ot t t

d Ot t

Q P u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

0 1 1

0 1 2

t t

t t

Q P u

Q P u

La forme réduite est :

0 1

1 2

t t

t t

Q v

P v

Utilisant la forme AW = 0, on obtient :

01 0

11 0

1 - -0

1 - - 1

Faisant les opérations matricielles :

0 1 1 0

0 1 1 0

0

0

On dispose d’une équation pour déterminer les αi, les coefficients de la demande et d’une équation pour déterminer les i. donc ni l’offre ni la demande ne sont identifiée. Proposition : Le problème d’identification fait référence au processus par lequel les paramètres structurels peuvent être obtenus à partir de la forme réduite. Ci ceci peut être vérifié, on dira que l’équation est identifiée, sinon on dira que l’équation et sous identifiée. Une équation identifiée est soit exactement(Just) identifiée soit sur identifiée. 1.5 Les règles d’identification Lorsque le système comporte deux ou trois équations, les calculs d’identification peuvent être effectués par une des deux méthodes décrites plus haut. Mais lorsque le système dépasse trois équations, les calculs deviennent fastidieux. Il serait donc utile de disposer d’une méthode d’identification qui ferait appel a un minimum de calcul. L’objet de cette section est de présenter cette méthode. Revenons à notre système général que l’on peut écrire :

t t tBY CX u

Ceci peut s’écrire comme :

C tt

t

YB u

X

Ou encore t tAZ u

Ou A est de dimension (M(M+K)) et Z est de dimension ((M+K)1). La première équation structurelle peut s’écrire 1 1t tZ u

Page 10: Les modèles à équations simultanée

La deuxième 2 2t tZ u

Et ainsi de suite jusqu’à la dernière

M t MtZ u

La théorie économique place un certain nombre de restrictions. Les plus communes sont les restrictions d’exclusions sur les αi. il existe aussi des restrictions sur la matrice et enfin les restrictions linéaires soit à l’intérieur du même équation soit échelonnées sur plusieurs équations. Concernant les restrictions d’exclusion. Soit Ф une matrice de dimension ((M+K)R) la matrices des restrictions ou R est le nombre de restrictions. On peut alors écrire chaque vecteur ligne de la matrice A sous forme : 1 0

Exemple soit le modèle suivant :

1 2 3 1

1 2 2

dt t t t

Ot t t

d Ot t

Q P R u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

1 2 3 1

1 2 2

t t t

t t

Q P R u

Q P u

En utilisant les notations du système général (1.1) en peut écrire le modèle :

11 12 11 12

21 22 21 22

C

1

t

tt

t

Q

PAZ B

R

D’où 1 11 12 11 12

0

0 0

0

0

2 21 22 21 22

0

0 0

0

1

Soit le modèle

0 1 2 3 1

0 1 2

dt t t t t

Ot t t

d Ot t

Q P Y R u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

0 1 2 3 1

0 1 2

t t t t

t t

Q P Y R u

Q P u

Page 11: Les modèles à équations simultanée

Les restrictions d’exclusions sont γ11 = γ23 = 0

11 12 11 12 13

21 22 21 22 23

C 1

t

t

t

t

t

Q

P

AZ B

Y

R

D’où 1 11 12 11 12 13

0

0

0 0

0

0

2 21 22 21 22 23

0 0

0 0

0 0 0

1 0

0 1

En plus des restrictions de type α1Ф=0, on a aussi des restrictions qui viennent de la relation entre coefficients de la forme réduite et coefficients de la forme structurelle. De la forme réduite, on a :

C 0 0K

B AWI

La première équation structurelle peut s’écrire 1 0W

La deuxième 2 0W

Et ainsi de suite jusqu’à la dernière 0MW

En combinant les restrictions d’exclusions α1Ф=0 avec la relation 1 0W , on peut écrire

1 0W

Les inconnues sont contenues dans les α1 et puisque la matrice W est de dimension

(M+K)(K+R), on aura (K+R) équations. Exemple soit le modèle : Soit le modèle

0 1 2 1

0 1 2

dt t t t t

Ot t t

d Ot t

Q P R u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

0 1 2 1

0 1 2

t t t

t t

Q P R u

Q P u

Prenant la deuxième équation :

Page 12: Les modèles à équations simultanée

21 22 21 22

0

0

0

1

11 12

21 222 21 22 21 22

0

0

1 0 0

0 1 1

W

21 11 22 21 21

21 12 22 22 22

22

0

0

0

Proposition : condition d’ordre (condition nécessaire) : soit m le nombres de variables endogènes et k le nombre de variables exogènes présentes dans une équation donnée. Alors R= (M – m) + (K-k) ≤ M-1 ou de manière équivalente (K-k)≤(m-1) Ou M-m = le nombre de variables endogènes absentes dans une équation donnée K-k = le nombre de variables exogènes absentes dans une équation donnée. Si (K-k) < (m-1) l’équation est sous identifiée Si (K-k) > (m-1) l’équation est sur-identifiée Si (K-k) = (m-1) l’équation est exactement(Just) identifiée Proposition : Condition de rang 1W M K

Exemple

1 1 2 1

2 1 1 1 1 2 2 2

t t t

t t t t t

Y Y u

Y Y X X u

Les restrictions sont γ11 = γ12 = 0 Pour déterminer la condition d’ordre il est commode de construire un tableau d’exclusions inclusions

Y1 Y2 Y3 Y4 Equation 1 0 0 Equation 2

Condition d’ordre K - k M - 1 identification Equation 1 2 1 Sur-identifiée Equation 2 0 1 Sous identifiée

Condition de rang : Equation 1

11 12

21 221 11 12 11 12

0 0

0 0 4 1 3

1 0 1 0

0 1 0 1

W W M K

La première équation est donc sur-identifiée Condition de rang : Equation 1

Page 13: Les modèles à équations simultanée

11 12

21 222 21 22 21 22

2 1 3

1 0

0 1

W W M K

La deuxième équation est donc sous identifiée Les restrictions représentées par αiФ=0, sont des restrictions homogène dans la mesure dans la mesure ou le coefficient ou la combinaison linéaire des coefficients est égal à zéro. Beaucoup de restrictions peuvent cependant être non homogènes. Un exemple de restriction non homogène 11 11 1 . Cette restriction peut être vue comme homogène si on considère la

condition de normalisation 11 0 on peut alors écrire 12 11 11 0 ce qui nous laisse

dire que toutes les restrictions no homogènes peuvent s’écrire sous forme homogène. Les restrictions homogènes et non homogènes que nous avons considérées jusqu’ici s’inscrivent à l’intérieur d’une équation structurelle. Nous avons aussi des restrictions qui s’échelonnent sur plusieurs équations, celle-ci sont appelées restrictions croisées. Par exemple dans le modèle.

1 1 2 1

2 1 1 1 1 2 2 2

t t t

t t t t t

Y Y u

Y Y X X u

On peut avoir la restriction α1 = 1 En présence de restrictions croisées, nous devons considérer le problème d’identification globalement et non plus équation par équation. Le traitement de ce type de restriction dépasse le niveau de ce texte. Finalement ; considérant les restrictions sur la matrice variance-covariance, des résidus structurels. Il s’agit ici de poser des restrictions sur les corrélations contemporaines entre les erreurs appartenant à différentes équations. Ceci constitue une information supplémentaire exploitable pour identifier une équation sous identifiée. Prenons le modèle suivant :

0 1 2 1

0 1 2

dt t t t t

Ot t t

d Ot t

Q P Y u

Q P u

Q Q Q

En utilisant la condition d’équilibre on obtient

0 1 2 1

0 1 2

t t t

t t

Q P Y u

Q P u

On sait déjà que l’équation de demande est sous identifiée et que la fonction d’offre est identifiée. Utilisant la relation entre forme réduite et forme structurelle

C 0 0K

B AWI

Page 14: Les modèles à équations simultanée

On obtient

11 1 21 0

12 1 22 2

11 1 21 0

12 1 22

121

22

0 11 1 21

0

0

0

0

Concernant l’équation de demande, nous avons deux équations pour déterminer trois paramètres de la forme structurelle α0, α1 et α2. Celle-ci est donc sous identifiée. Supposons que nous savons que 12 = 21 = 0. Comme on va le voir, cette information va nous aider à récupérer les α1. Pour cela écrivons la relation entre la matrice de la forme structurelle et la matrice Ψ de la forme réduite.

TB B Avec 1

1

1

1B

Soit donc 2

1 11 12112

1 21 22 1 222

1 1 10

10 a

Les α1 sont à calculer sous la contrainte que 12 = 21 = 0. Par conséquent seuls les éléments au dessus et au dessous de la diagonale principale nous intéressent :

11 1 21 1 12 1 1 22

11 1 21 1 12 1 1 22

0

0

Utilisant l’une ou l’autre des deux équations on peut tire les αi (on obtient le même résultat quelque soit l’équation) :

11 1 121

12 1 22

0 11 1 21

2 12 1 22

1.6 Estimation Différentes méthodes d’estimation des MES ont été présentées dans la littérature. Celle-ci peuvent être classées selon la méthode équation par équation (Méthode à information limitée ou selon la méthode système(méthode è information complète). Dans la première méthode, on estime le système équation par équation utilisant seulement l’information par rapport aux restrictions imposées sur l’équation estimée ; le reste de l’information concernant les autres équations n’est pas utilisée par contre, dans la méthode complète, on estime toutes les équations de manière jointe utilisant toutes les restrictions afférentes à toutes les équations ainsi que les variances covariances des erreurs. Afin de préserver l’esprit des MES, l’idéal serait d’estimer le modèle par la méthode à information complète. Cependant si celle-ci n’est pas très souvent utilisée, c’est tout simplement parce que cette méthode est très sensible aux erreurs de spécification. En d’autres termes, si une erreur de spécification survient dans une équation, cette erreur se transmet à toutes les équations. De plus, la méthode à information complète conduit à des solutions non linéaires des paramètres et par conséquent ceux-ci sont difficilement interprétables. En pratique, la méthode è information limitée est la plus utilisée. Les différentes méthodes d’estimations sont résumées dans le schéma ci-dessous :

Page 15: Les modèles à équations simultanée

ILS = indirect least squares 2SLS = two stage least squares LIML = limited information maximum likelihood 3SLS = three stage least squares FIML = full information maximum likelihood 1.6.1 Méthodes d’Estimation à information limitée 1.6.1.1 la méthode SUR Avant de procéder avec la méthode SUR, nous allons tout d’abord faire un rappel sur l’estimation GLS. Considérons le modèle de régression simple. Y X u

Avec T 2( ) 0 E(uu )E u I

L’estimateur de β est 1ˆ T TX X X Y

Avec 2 1ˆ( ) ( )TV X X

Supposant maintenant qu’au lieu de l’hypothèse T 2 E(uu ) I on fasse l’hypothèse T 2E(uu ) dans ce cas, on démontre que 1ˆ T TX X X Y

a pour

2 1 1ˆ( ) ( ) ( )T T TV X X X X X X Celle-ci n’est pas minimum. Cette information. Cette formule est différente de la formule 1.2.1. la méthode d’estimation GLS consiste à dériver un estimateur de β qui aurait toutes les propriétés désirables même quand les erreurs sont non sphériques. Théorème : Si A une matrice symétrique définie positive, on peut alors trouver une matrice non singulière P tel que : TA PP on 1 1 1 1( ) ( )T T T TX AX X X AXX X X

Où est la matrice diagonale de A TA X X 1

Passons maintenant à la méthode SUR. Supposons que nous avons m équations structurelles de la forme :

1 1 1 1

2 2 2 2

.......................

m m m m

y X u

y X u

y X u

Ou yj est de dimension (T1), uj de dimension (T1), Xj de dimension (Tkj), Zellner 2considère l’estimation jointe des paramètres 1, 2,…, m par GLS sous les hypothèses :

( ) i=1,2,...,m

E(u ) i j(i,j)=1,2,....m

Ti i ii

Ti j ij

E u u I

u I

La première hypothèse stipule l’homoscédasticité et l’absence d’autocorrélation à l’intérieur d’une équation donnée et l’hétéroscédasticité d’une équation à une autre. La deuxième hypothèse stipule l’existence de covariance non nulle d’une équation à une autre.

1 Se référer aux chapitres sur l’autocorélation et hétéroscédasticité 2 A Zellner ‘An Efficient Method of Estimating Seemingly Unrelated regression and tests for Aggregation Bias’ Journal of the American Statistical Association, 1962 pp 348-368

Page 16: Les modèles à équations simultanée

Supposons que nous avons T observations et que les m équations font référence à différentes unités organisées en panel. On peut alors écrire le système (1.19) sous la forme

1 11 1

2 22 2

0 0 .. 0

0 0 0

.. ..................... ..

0 0 0 m mM M

y uX

y uX

y uX

Ou d’une manière équivalente y x u

Y= mT1 x = mTki = ki1 u = mT1

( )TT ij TE uu I I

L’estimateur GLS est

11 1ˆ T Tx I x x I y

En fonction des données (1.24) peut s’écrire : 11 12 1

1 1 1 2 1

21 22 22 1 2 2 2

1 21 2

...

... ˆ.................................................................

...

T T m Tm

T T m Tm

m T m T mm Tm m m m

X X X X X X

X X X X X X

X X X X X X

11

22

.................

j Tj

j Tj

mj Tm j

X y

X y

X y

Ou les ij sont les éléments de -1. On démontre facilement que

11ˆ( ) TV x I x

En pratique n’est pas connu. Pour ce faire, on estime chaque équation du système (1.18) séparément par OLS, ensuite on obtient les résidus ˆiu et enfin on estime

ˆ ˆˆ (i,j)=1,2....,m

Ti j

ij

u u

T

1.6.1.2 Les moindres carrées indirectes OLS ne peut être utilisée que dans le cas de système récursifs. Pour une équation exactement identifiée, la méthode ILS semble la plus appropriée. Dans cette méthode , on applique OLS a la forme réduite et ensuite on dérive les coefficients structurels à partir des coefficients de la forme réduite. Supposons le modèle suivant.

0 1 2 1

0 1 2 1

Demande

offre( 0)T t t t

t t t

Q P X u

Q P u

On sait que la demande est sous identifiée, don celle-ci n’est pas estimable à moins de changer la spécification. Quant à l’offre celle-ci est identifiée. On peut donc utiliser ILS pour obtenir les estimateurs de 0 et 1 de la forme réduite.

C 0K

BI

0 11 1 21

121

22

Appliquant OLS aux équations de la forme réduite

11 12 1

21 22 2

t t t

t t t

Q X v

Q X v

On obtient ILS de 0 et 1 qui sont

Page 17: Les modèles à équations simultanée

0 11 1 21

121

22

ˆ ˆˆ ˆ

ˆˆˆ

¨

Application numérique Soient les données suivantes Tableau 1

année 

indice de la production 

agricole(Q) indice 

des prix (P) 

dépenses de consommationper capita (X) 

1960  93  99  1883 

1961  92  100  1909 

1962  92  103  1969 

1963  96  106  2015 

1964  93  106  2126 

1965  99  103  2239 

1966  95  105  2335 

1967  100  100  2403 

1968  103  101  2486 

1969  104  97  2534 

1970  101  100  2610 

1971  112  107  2683 

1972  113  115  2779 

1973  119  164  2945 

1974  110  212  2846 2

11 12 1

221 22 2

ˆ ˆ 47.2196 0.0228 R 0.8668

(t=9.1740)

ˆ ˆ 9.4283 0.0520 R 0.3376

t t t t

t t t t

Q X v X

Q X v X

(t=2.5750)

Ce qui nous donne les estimateurs ILS de la fonction d’offre

0 11 1 21

121

22

ˆ ˆˆ ˆ 51.354

ˆˆ 0.43846ˆ

La régression ILS est 51.354 0.4386t tQ u

Le coefficient sur P est positif, ce qui devrait être le cas puisque nous avons estimé une fonction de demande3. 3 Remarquons que nous n’avons pas présenté les écarts types et les t-statistiques des coefficients structurels. La raison est que ces coefficients sont des fonction non linéaires des coefficients de la forme réduite et il n’y a pas de méthodes pour obtenir ces écarts types

Page 18: Les modèles à équations simultanée

1.6.1.3 Doubles moindres carrées (2SLS) Cette méthode peut être utilisée soit dans le cas d’une équation sur-identifiée soit dans le cas d’une équation exactement identifiée. Dans le cas de sur-identification, 2SLS nous donne une méthode d’estimation consistante. De plus dans le cas d’une équation exactement identifiée, 2SLS et ILS sont identiques. Nous allons illustrer la méthode via un exemple et ensuite nous donnerons une formulation théorique de la méthode. Soit le modèle suivant :

1 10 11 2 11 1 12 2 1

21 20 21 1 2

t t t t t

t t t

Y Y X X u

Y Y u

Ou Y1 est le revenu, Y2 est le stock de la monnaie, X1 est l’investissement et X2 les dépenses gouvernementales. La fonction de revenu postule une dépense du revenu par rapport à l’offre de monnaie, l’investissement et les dépenses gouvernementales. La fonction de monnaie qui est une fonction d’offre de monnaie postule que le stock de monnaie est contrôlé par la banque centrale sur la base du niveau d’activité. Cette fonction peut donc être interprétée comme une de réaction des autorités monétaires. Appliquant les règles d’identification, la fonction de revenu est sous identifiée et la fonction monétaire est sur-identifiée. On ne peut rien faire pour la fonction de revenu à moins de changer la spécification. Concernant la fonction monétaire, celle-ci ne peut être estimée ni par ILS car on obtiendrait 2 estimateurs pour ni par OLS puisque que la variable à droite Y1 est stochastique et corrélée avec u2t. Supposant que nous pouvons trouver un proxy pour Y1 en ce sens qu’elle serait fortement corrélée avec celle-ci mais qui serait non corrélée avec u2t. si on pouvait trouver un tel proxy alors la fonction monétaire serait estimable.4Comment trouver un tel proxy ? Une réponse nous est fournie par 2SLS développée de manière indépendante par Henri Theil5 et Robert Basmann 6. Comme son nom l’indique, la méthode implique deux applications OLS successives. Première étape : Régresser Y1 contre toutes les variables exogènes du système. Dans le cas présent, on régresse Y1 contre X1 et X2 et on obtient :

1 11 12 1 13 2ˆ ˆ ˆ ˆt t tY X X

Ou d’une manière équivalente 1 1 1ˆ

t t tY Y v

Avec 1 1ˆ( , ) 0t tE Y v Ou v1t est le résidu OLS

Y1t consiste donc en une combinaison linéaire de variables non stochastique, les Xi et une composante stochastique v1t. Deuxième étape : la fonction monétaire peut être écrite comme :

2 20 21 1 2 20 21 1 1 2

20 21 1 21 1 2

ˆ( )

ˆ =

t t t t t t

t t t

Y Y u Y v u

Y v u

Donc on peut écrire *

2 20 21 1̂t t tY Y u

4 Ce proxy est aussi appelé variable instrumentale( Instrumental variable IV) 5 Henri Theil ‘repeated least squares applied to complete Equation Systems’ The Hague : the central planning bureau, the Netherlands, 1953 6 Robert Basmann ‘ generalized classical method of liner estimation of coefficients in a structural equation’ Econometrica, vol 25, pp 77-83 1957

Page 19: Les modèles à équations simultanée

En comparant la fonction monétaire originale avec cette dernière équation, on voit qu’elles

sont similaires en apparence, la différence étant Y1t est maintenant remplacée par 1̂tY 7 quelle

est l’avantage d’utiliser cette dernière équation plutôt que l’équation originale ? On peut montre que bien que la variable Y1t est corrélée avec u2t dans l’équation originale (ce qui rend

la méthode OLS inadéquate), dans la nouvelle formulation 1̂tY est asymptotiquement non

corrélée avec tu .

Application numérique :Nous allons illustrer la méthode 2SLS en considérant le modèle précédent : les données sont en milliards de dollars. Table2

Année PIB=Yt Stock mon = Y2t Invest= X1t Dep Gov =X2t 1960 503,7 144,2 74,8 53,3 1961 520,1 148,7 71,7 57,4 1962 560,3 150,9 83 63,4 1963 590,5 156,5 87,1 64,2 1964 632,4 163,7 94 65,2 1965 684,9 171,3 108,1 66,9 1966 749,9 175,4 121,4 77,8 1967 793,9 186,9 116,6 90,7 1968 864,2 201,7 126 98,8 1969 930,3 208,7 139 98,8 1670 977,1 221,4 136,3 96,2 1971 1054,9 235,3 153,7 97,6 1972 1158 255,8 179,3 104,9 1973 1294,9 271,5 209,4 106,6 1974 1396,7 283,8 208,9 116,4

Première étape : on régresse Y1contre toutes les variables exogènes du système :

1 11 12 1 13 2

21 1 2

ˆ ˆ ˆ

ˆ 44.79 4.93 3.15 R 0.9896

tsta (10.3083) (3.0336)

t t t

t t t

Y X X

Y X X

Deuxième étape :

2 20 21 1

22 1

ˆ ˆˆ ˆ

ˆ ˆ60.78 0.1624 R 0.9781

(47.76)

t t

t t

Y Y

Y Y

tsta

Ou les t statistiques ont été corrigés selon la formule*

2 2

21

*

ˆ

2 21 1

ˆ ˆ ˆ

ˆ ˆˆ

tt t

t

uu u

t tuY Y

A des fins de comparaisons nous donnons les résultats de l’application OLS à l’équation

2 20 21 1 2ˆ ˆ

t t tY Y u

7 Notons que si le R2 obtenu à partir de la première étape est très faible, alors la méthode 2SLS n’a plus aucun sens. La raison est que dans ce cas on remplacerait la variable originale Y1t , dans la deuxième étape par l’erreur obtenue dans la première étape. Au contraire si R2 obtenu dans la première étape est très élevé (>0.80) alors 2SLS= OLS. Dans le cas extrême ou R2 = 1, alors Y1t serait pratiquement non stochastique.

Page 20: Les modèles à équations simultanée

Sans purger la variable stochastique Y1t

2 20 21 1

22 1

ˆ ˆˆ

ˆ 60.36 0.1629 R 0.9944

(48.28)

t t

t t

Y Y

Y Y

tsta

En comparant OLS et 2SLS, on voit que l’on obtient des résidus similaires. Mais cela ne devrait pas trop surprendre car comme on l’a déjà noté, le R2 obtenu dans la première étape

est très proche de un (0.9896). Rendant Y1t et 1̂tY virtuellement identique.