48
Séries chronologiques et prévision L3 Gestion

Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Embed Size (px)

Citation preview

Page 1: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Séries chronologiques et prévision

L3 Gestion

Page 2: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Séries chronologiques et prévisions

IntroductionObjectif : maniement simple de quelques

techniques statistiques (Statistiques descriptives, indices, séries chronologique, moindres carrés ordinaires).

De quelle façon : Sans démonstration et beaucoup d’intuition

Page 3: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Séries chronologiques et prévisions

Plan prévisionnel (15 heures) :Chapitre 1 : Statistiques descriptivesChapitre 2 : Taux de croissance et indicesChapitre 3 : Les moindres carrés ordinaires (mco)Chapitre 4 : Les séries chronologiques- Composantes, - Dessaisonalisation,- Estimation du trend par moyennes mobiles et par les

mco- Estimation des coefficients saisonniers- Prévisions par lissage exponentiel

Page 4: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Chapitre 1 : Statistiques descriptives

On distingue deux types de statistiques résumées : - Les statistiques qui résument la tendance « centrale »

d’une série ( mode, moyenne et médiane) et les statistiques qui résument la dispersion d’une série :

1. Sans référence à aucune statistique de tendance centrale (intervalle interquartile ou interdécile),

2. Qui fait référence à la tendance centrale (variance, écart-type et coefficient de variation).

Page 5: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Il existe aussi des statistiques qui résument la « forme » d’une distribution, mais celles-ci ne sont plus trop utilisées aujourd’hui dans la mesure où il est plus facile d’observer directement le graphique d’une distribution pour en apprécier la forme.

Page 6: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

1. Les statistiques de tendance centrale

A – Le mode

1) Le mode d'une série est la valeur la plus fréquente d'une série. Exemple : Soit la série {8,4,4,3,4,3,8,7,5}

La valeur la plus fréquente de cette série est 4. Le mode est donc égal à 4. L'effectif associé à ce mode est 3.

Page 7: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptivesQuelques remarques à propos du mode a) Une série peut avoir plusieurs modes 

S = {4, 0, 1, 1, 7, 7, 7, 3, 3, 4, 7, 3, 4, 5, 7, 1, 3, 3, 4, 5}, Cette série a 2 modes, elle est bimodale. Ses deux modes sont : 7 et

3. L'effectif associé à chacun de ces modes est 5.

Il existe également des séries multimodales.

b) Le mode n’existe pas forcément C'est le cas lorsque toutes les valeurs ont le même effectif.

Exemple : S = {4, 0, 1, 2, 5, 6}

Page 8: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

c) Le mode n’est pas la valeur la plus élevée. Il ne faut pas confondre le mode, qui est la valeur la plus fréquente, avec la valeur la plus élevée de la série.

d) Les caractères quantitatifs et qualitatifs peuvent avoir un mode

Le mode existe aussi bien dans le cas d’une série de valeurs que dans le cas d’une série de modalités :

la série {A,C,C,D,A,A,C,E,E,B,C} a la modalité C pour mode car c’est la modalité C qui revient le plus souvent.

Page 9: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Chapitre 1

B – La moyenne arithmétique Soit un échantillon de n valeurs observées x1, x7,

….,xi,….,xn d’un caractère quantitatif X, on définit sa moyenne observée comme la moyenne arithmétique des n valeurs :

Exemple avec S= {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5}

x

x

x

n

iix

nx

1

1

Page 10: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Une des propriétés de la moyenne arithmétique est que la somme des écarts à la moyenne est nulle :

n

i 1

(xi −

x ) = 0

Page 11: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Si les données observées xi sont regroupées en k classes d’effectifs ni (variable continue regroupée ou variable discrète), il faut les pondérer par les effectifs correspondants :

Avec

k

iii xn

nx

1

1

k

iinn

1

Page 12: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Exemple précédent regroupé :

Page 13: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

• Remarque : La moyenne obtenue après regroupement des données en classe peut différer légèrement en raison d’une perte d’information.

Exemple : supposons que les données précédentes soient regroupées en classe de la façon suivante :

Page 14: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Pour calculer la moyenne, nous devons déterminer les centres de classe et appliquer la formule où les xi sont les centres de classe (nommés Ci) :

La différence ici est de 0.5 et cette différence dépend de la définition des classes : amplitude et nombres de classes.

k

iii xn

nx

1

1

Page 15: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Décomposition de moyenne :

Soit une population totale de n individus, composée de k groupes. Les groupes sont désignés par des lettres. La population totale est égale à la somme des populations des groupes :

Notons la moyenne de la variable X du groupe m :

Page 16: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

La moyenne globale se calcule ainsi

Ou encore

Page 17: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

La formule s’écrit en définitive :

Exemple : A B C D12 9 10 515 11 12 1214 8 1513 15 16

5 18

9

moyenne de chaque groupe 13,5 9,6 11 13,2effectif de chaque groupe 4 5 2 6 17coefficient de pondération 0,23529412 0,29411765 0,11764706 0,35294118 1moyenne x coefficient 3,17647059 2,82352941 1,29411765 4,65882353 11,9529412

Page 18: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Les effets de structure : les moyennes de chaque classe possèdent des pondérations très différentes

secteurs Prod S1 Prod S2 Prod S3 totalrégions

R1 80 217 90 198R2 113 380 120 191

Total 105 240 110 196

secteursrégions Emploi VA Emploi VA Emploi VA Emploi VA

R1 5 400 60 13000 5 450 70 13850R2 15 1700 10 3800 10 1200 35 6700

Total 20 2100 70 16800 15 1650 105 20550

S1 S2 S3 total

Page 19: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Deux autres moyennes :Moyenne géométrique

Avec les notations précédentes :

est la moyenne géométrique de la série statistique.

G x1n1 ...xn

n pn

Page 20: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

ExempleL’essence a augmenté de 10% l’an dernier

et de 30% cette année. Quelle est le taux d’augmentation annuelle ?

Ce n’est pas 20% ! La moyenne arithmétique ne convient pas. Si t est ce taux, on a bien sûr :

et donc t =0,196=19,6%.

La « bonne » moyenne est ici la moyenne géométrique.

1 t 1,11,3

Page 21: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Moyenne harmonique

Toujours avec les notations précédentes :

est la moyenne harmonique de la série statistique.

H n

ni / x i

i

Page 22: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

ExempleSi je fais un trajet aller-retour avec une vitesse v1 à

l’aller et une vitesse v2 au retour, quelle est ma vitesse moyenne sur l’ensemble du trajet ?

La réponse n’est pas

Mais qui est la moyenne harmonique de v1 et v2.

v1 v2

2

21

v1

1

v2

Page 23: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

C – La médiane

Définition

Si F désigne la fonction des fréquences cumulées, la médiane d’une série statistique sera la plus petite valeur x telle que F(x) ≥ 0,5. Autrement dit : La médiane est la valeur du caractère pour laquelle la fréquence cumulée est égale à 0,5 ou 50 %.

Interprétation :Elle correspond donc au centre de la série statistique classée par ordre croissant, ou à la valeur pour laquelle 50 % des valeurs observées sont supérieures et 50 % sont inférieures.

Page 24: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Avantages

Contrairement à la moyenne, la médiane n’est pas sensible aux valeurs extrêmes.dans une entreprise où les 10 salariés gagnent

chacun 1500€ par mois et le patron 7000€ par mois, le salaire médian mensuel est de 1500€.

La médiane a une signification concrète.

Page 25: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Détermination pratique : caractère discret

Si l’effectif total n est impair, i.e. n = 2k + 1, la médiane sera le k+1ème terme de la série. La médiane est la valeur du milieu. EX : 17, 15, 18. n= 3, k=(n-1)/2=(3-1)/2=1 : k+1ème terme est donc le deuxième => M=15.

Si n est pair, i.e. n = 2k, la médiane sera le kème terme de la série. EX : 17, 15, 16, 18 =>M=15.

Mais, si n est pair, une médiane est aussi une valeur quelconque entre le kème et k+1ème terme de la série (M entre 15 et 16). Dans ce cas il peut être commode de prendre le milieu (15,5).

Page 26: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

On peut déterminer la médiane graphiquement

médiane : détermination graphique

0

10

20

30

40

50

60

70

80

90

100

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Page 27: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Détermination de la médiane : caractère continu

On commence par déterminer la classe médiane, i.e. la première classe où la fréquence cumulée dépasse 0,5.

Ensuite, on calcule la médiane par interpolation linéaire.

Page 28: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Interpolation linéaire (Théorème de Thales)

ABC est un triangle. M se trouve sur le segment [AB] et N sur le segment [AC]. D'après le théorème de Thalès, si les droites (BC) et (MN) sont parallèles, alors on a l'égalité :

Page 29: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Le théorème de Thalès permet de calculer des longueurs. Pour calculer une longueur dans la configuration représentée ci-dessus, il suffit de connaître trois des longueurs figurant dans deux des rapports.

N C

Page 30: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Classes Effectif Fréquences cumulées croissantes

Moins de 25 ans

18 0,06

25≤X <30 54 0,24

30≤X < 35 72 0,48

35≤X <40 84 0,76

40≤X < 45 36 0,88

45≤X < 50 22 0,95

50 ans et plus 14 1

)()()(5.0 ij

ij

i

i

xFxF

xx

xF

xMé

= 35,36

Dans le cas de valeurs groupées, on pose l'hypothèse selon laquelle les valeurs sont uniformément réparties à l'intérieur de chaque classe.

48,076,0

3540

48,05.0

35

Page 31: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Page 32: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

2. a)

2. b)

145120510

50

1020

120170

1015

120

x

x

16)5

3050(10

10

5030

1020

120170

10

120150

xxx

Page 33: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

• Résumé des caractéristiques des indicateurs

Avantages Inconvenients

Moyenne arithmétiqueFacile à calculer, Répond au principe des moindres carrés

sensible aux points abérrants, Représente mal une population hétérogène (bi ou polymodale)

Médiane

Pas sensible aux points ab, Peu sensible aux variations d’amplitudedes classes, Calculable sur des caractères cycliques(saison, etc.) où la moyenne a peu designification.

Se prête mal aux calculs statistiques, Suppose l’équi-répartition des données, Ne représente que la valeur qui séparel’échantillon en 2 parties égales.

Mode

Calculable sur des caractères cycliques, Bon indicateur de population hétérogène.

Se prête mal aux calculs statistiques, Son calcul ne tient compte que desindividus dont les valeurs se rapprochent dela classe modale.

Page 34: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives2. Les indicateurs de dispersionDeux séries statistiques peuvent avoir les mêmes paramètres de

tendance centrale mais pas la même « dispersion ».

Exemple : Notes de Ruby : 7 , 8 , 11 , 12 , 13 , 13 et 13 (moyenne : 11) Notes de Iris : 4 , 7 , 9 , 12 , 13 , 13 et 19 (moyenne 11)

Il est donc nécessaire d’adjoindre à un paramètre de tendance centrale(moment 1), un ou des paramètres de dispersion (moment 2).Ces paramètres ont pour objectif dans le cas d'un caractère quantitatif de caractériser la variabilité des données dans l’échantillon.

Les indicateurs de dispersion fondamentaux sont la variance observée et l’écart-type observé.

Page 35: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Quelques indicateurs de dispersion

n Étendue.

1. L’écart interquartile

2. Écart absolu.

3. La variance et l’écart type.

4. Coefficient de variation

Page 36: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

1. L’étendue L’étendue d’une série statistique est la différence

entre la plus grande valeur de la série et la plus petite.

Remarque

- Très simple à calculer et à interpréter.- Par nature très sensible aux valeurs extrêmes.

Page 37: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

2. L’écart interquartile : Q3-Q1

Si F désigne la fonction des fréquences cumulées, le premier (resp. troisième) quartile d’une série statistique sera la plus petite valeur x telle que F(x) ≥ 0,25 (resp. 0,75) . On le note Q1 (resp. Q3).

Q1 et Q3 se calculent comme la médiane. Q1 est la valeur qui coupe la distribution en deux : 25 % en dessous et 75 % au dessus. Q3 75 % et 25 %.

L’écart interquartile contient au moins 50% des valeurs de la série.

L’écart interquartile mesure la dispersion sans tenir compte des valeurs extrêmes.

Page 38: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Après les quartiles, on peut définir de la même façon les déciles (voire les centiles) d’une série statistique.

Il s’agit de regarder les valeurs de la série correspondant à des fréquences cumulées de 0,1 ; 0,2 … 0,9.

Pour visualiser la dispersion d’une série statistique, on peut alors représenter une « Box plot » (« boîte à moustache »).

Page 39: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

boîte à moustache

Min Max

D1 D9

Q1 Q3Médiane

Page 40: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives3. L’écart absolu moyenmoyenne des valeurs absolues des écarts à la moyenne.

Intérêts

- Paramètre simples à calculer, prenant en compte l’ensemble des données.Très facile d’interprétation.

Inconvénient

Mauvaises propriétés calculatoires (non linéaire).Peu utilisés par les logiciels de statistiques.

e 1

nni x i x

i

Page 41: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

4. Variance et écart-type

On définit la variance comme la moyenne arithmétique des carrés des écarts à la moyenne.

21 i

ix xxn

V

22221xxxx

nV

iix

Page 42: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

• Dans le cas de données regroupées en k classes d'effectif ni (variable continue regroupée en classes ou variable discrète), la formule de la variance est la suivante :

Vx 1

nni x i x

i

2

Page 43: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

• L’écart-type observé correspond à la racine carrée de la variance observée :

• Remarque : De part sa définition, la variance est toujours un nombre positif. Sa dimension est le carré de celle de la variable. Il est toutefois difficile d’utiliser la variance comme mesure de dispersion car le recours au carré conduit à un changement d’unités. Elle n’a donc pas de sens direct contrairement à l'écart-type qui s’exprime dans les mêmes unités que la moyenne.

2ss

Page 44: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

5. Le coefficient de variationLa variance et l’écart-type observée sont des paramètres

de dispersion absolue qui mesurent la variation absolue des données indépendamment de l’ordre de grandeur des données. Le coefficient de variation noté C.V. est un indice de dispersion relatif prenant en compte ce biais et est égal à :

Exprimé en pour cent, il est indépendant du choix des unités de mesure permettant la comparaison des distributions de fréquence d’unité différente.

_

.x

VC

Page 45: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Exercice 1 : La présence des clients dans un magasin

1.Calculer la moyenne et la médiane.

2. Calculer la variance et l’écart-type

Classes effecctif[15,5;20,5[ 200[20,5;25,5[ 500[25,5;30,5[ 1000[30,5;35,5[ 600[35,5;40,5[ 200

2500

Page 46: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

1. Moyenne et médiane- Moyenne : On calcule le centre de chaque

classe ci (i=1,..,5).

min2.282500

70500)38200336002810002350018200(

2500

11

iiicn

nx

Classes effecctif ci Effectif*ci[15,5;20,5[ 200 18 3600[20,5;25,5[ 500 23 11500[25,5;30,5[ 1000 28 28000[30,5;35,5[ 600 33 19800[35,5;40,5[ 200 38 7600

2500 70500

Page 47: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

2. La médiane

On calcule les fréquences et les fréquences cumulées et on détermine la classe médiane

(25.5 ; 30,5). On fait une interpolation linéaire :

min25.2828.068.0

5.255.30

28.05.0

5.25

MéMé

Classes effecctif Fréquence Freq cumul

[15,5;20,5[ 200 0,08 0,08

[20,5;25,5[ 500 0,2 0,28

[25,5;30,5[ 1000 0,4 0,68

[30,5;35,5[ 600 0,24 0,92

[35,5;40,5[ 200 0,08 1

2500 1

Page 48: Séries chronologiques et prévision L3 Gestion. Séries chronologiques et prévisions Introduction Objectif : maniement simple de quelques techniques statistiques

Statistiques descriptives

Exercice 2 : Variation du CAC 40 au cours d’une semaine (en points). Il y a 8 observations journalières.

1. Calculer la moyenne, la variance et l’écart-type2. Sur le nouveau marché, la même semaine on

observait une moyenne de 0.8 et un écart-type de 26,05. Est-il préférable d’investir sur le nouveau marché ? Certains analystes se fient au coefficient de variation. Le calculer pour les 2 marchés. Est-il un bon estimateur du risque ?

Evolution du CAC 40 (X) -20 -10 0 10 20 30effectif 7 9 10 6 5 3