Un type de distribution discrète tronquée

  • Published on
    10-Jul-2016

  • View
    213

  • Download
    1

Transcript

  • 551.501.45:551.577.38

    (Institut t~oyal Mdtdorologique de Belgique, Ucele-Bruxelles)

    Un type de distribution diserbte tronqu6e

    Par

    R. Sneyers

    R~sum~. L'analyse statistique de Ia distribution des p6riodes sgches .~ I-Ieiligenblut sugg6re l'emploi de distributions thdoriques tronqudes pour la reprdsenter. De bons ajustements sont effeetivement obtenus au moyen d'une distribution logarithmique et d'une distribution binomiale ndgative dont les deux premiers termes ont 6td supprimds.

    Zusammenfassung, Die statistische Analyse der I-I/iufigkeitsverteilung der Trockenperioden in tteiligenblut gibt die Grundlage zu einer Betraehtung abgesehnittener Verteilungen. Eine logarithmische und eine negative bino. mime Verteilung, vonder die zwei ersten Glieder weggelassen wurden, geben eine befriedigende l--bereinstimmung.

    Summary. The statistical analysis of the distribution of droughts in Heiligenblut suggests the use of truncated theoretical distributions for its representation. A logarithmic and a negative binomial distribution of which the two first terms have been suppressed give effectively good fits.

    1. Introduction

    Dans une note r6cente [I], I~. STE IN I~IXUSSER a attir6 l 'attention sur le fait qu'aucune distribution th6orique elassique ne permet d~ rendre compte d'une fa~on sa~isfaisante de la r@artition de fr~quences des p~riodes sgches (jours eons~cutifs sans pluie) k I-s

    Cet dehee est assez surprenant puisqu'il r~v~le, ~ premigre rue, des comportements st~tistiques diff6rents des p6riodes sgehes dans l'ouest de l'Europe (Paris St-Maur et Ueele) et sur le versant sud des Alpes orientales, alors que pour les p~riodes pluvieuses, un mgme type de distribution (en l'oeeurenee la distribution binomiale n6gative) donne dans les deux cas une bonne representation des r@artitions de fr~quenees observ6es.

  • 1%. SN~u Un type de distribution disergte tronqu6e 405

    L 'examen des chiffres publids par H. STEINHXVSSE~ montre toutefois (voir [l], p. 53) que les diffieultds proviennent de la disproportion entre valeurs thdoriques et valeurs observdes pour les cinq premieres frdquences et il est curieux de constater ~ ce propos que si, en raison de la relation :

    /0 < 2 h (~) entre les deux premieres frdquences observdes, l 'a justement au moyen d'une distribution logarithmique se trouvait exclu, la distribution bino- miale ndgative ajustde fournit quand m~me une valeur de [o supdrieure au double de [1.

    L 'analyse statistique des donndes complgtes, qui nous ont 6t6 obligeam- ment eommuniqudes, permettent d'ailleurs de faire d'autres constatations.

    En effet, si l 'on ddsigne les frdquences des pdriodes de (i ~- 1) jours consdcutifs sans prdeipitations par // et si ]'on pose (el. [2]) :

    Ni F~ = 2/~., N~ = 2 ]/~-et l~ - ( i - -~) , (2)

    ]>_i i>_i Fi avec i, 7' = 0, 1, 2, . . .

    on obtient, pour la distribution considdrde les valeurs de [i, Fi, Ni et l~ indiqudes au Tableau 1.

    I1 apparalt ainsi, non seulement que les h subissent une croissance r6guli~re, mais encore (par reprdsentation graphique), que les valeurs de log (i + 1) ], et plus encore eelles de log (Fi + Ni) d6croissent lind- airement b~ part ir du 5 e tenne, et ee conformdment 5~ une rdpartition qui serait ddfinie par la relation:

    ~i+1

    o~ K est une constante et 0 < ~ < 1, qui n'est autre que la relation de ddfinition de la distribution logarithmique. I1 s'ensuit qu'au lieu de s'engager dans la vole de la ddeomposition de la sdrie eonsiddrde en deux ou plusieurs distibutions distinctes, il convient tout d'abord de tenter un ajustement au moyen d'une distribution asympto~iquement logarithmique.

    Notons immddiatement, ~ ee propos, que les distributions logarith- miques tronqudes remplissent cette derni~re condition ; de plus, comme une telle distribution peut se ddfinir au moyen de la relation:

    (Zi+ 1 +~o /~K i@l+i0 avee i0~l , (3)

    de laquelle se ddduit la relation:

    /1 1 + i0 /0 - ~'2 + i0'

    on volt sans peine qu'une telle distribution n'est plus incompatible avee l'indgalit6 (1), pourvu que i0 soit suff isamment grand.

  • 406 R. SNEYERS :

    Par ailleurs, l 'emploi d 'une distr ibut ion tronqude pour repr@senter ]a s@rie 6tudi6e trouve sa justif ication d~ns la nature m6me des donndes,

    Tableau 1. Pdriodes de (i + 1) ]ours eonsdcuti]s sans prdcipitations mesurables Heiligenblut. tZrdquences observdes et ]rgquences a]ustdes

    i /i Fi N i I i [,~(~) X-2 ]~(z) X 2

    0 1 2 3 4 5 6 7 8 9

    10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 3O 31 33 35 38 41 45

    629 2254 7661 4,40 402 1625 7661 4,71 298 1223 7259 4,93 212 925 6663 5,20 174 713 6027 5,45 105 539 5331 5,89 91 434 4806 6,07 56 343 4260 6,42 50 287 3868 6,48 36 237 3468 6,63 31 201 3144 6,64 35 170 2834 6,67 16 135 2449 7,14 20 119 2257 6,97 11 99 1997 7,17 20 88 1843 6,94 9 68 1543 7,69 9 59 1399 7,71 3 50 1246 7,92 8 47 1192 7,36 3 39 1040 7,67 5 36 980 7,22 3 31 875 7,23 6 28 809 6,89 3 22 671 7,50 2 19 599 7,53 1 17 549 7,29 1 16 523 6,69 3 15 496 6,07 2 12 412 6,33 1 10 354 6,40 1 9 324 6,00 3 8 293 4,62 2 5 194 4,80 1 3 124 4,33 1 2 86 3,00 1 1 45 1,00

    624,87 0,03 407,73 0,08 283,78 0,71 205,74 0,19 153,42 2,76 116,79 1,19 90,32 0,01 70,72 3,06 55,93 0,63 44,60 1,66 35,82 0,65 28,94 1,27 23,50 2,39 19,17 0,04 15,70 1,41 12,90 3,91 10,63 0,25

    647,02 0,50 401,99 0,00 275,05 1,91 198,58 0,91 148,37 4,43 113,52 0,64 88,39 0,08 69,75 2,71 55,62 0,57 44,74 1,71 36,24 0,76 29,53 1,01 24,19 2,77 19,90 0,00 16,43 1,79 13,61 3,00 11,31 0,47

    8,79 ( 7,28 ] 1,03 6,05 5,03 / 0,00 4,19 } 3,50 1,08 2,93 2,45 / 2,06 1,73 1,45 ] 1,22 1,03 0,43

    5,73 3,18

    9,42( 7,87j 1,62 6,59t 5,53/ 0,10 4,65 3,911 0,39 3,30 2,79 2,36 2,00 1,69 i 1,43 1,211 0,02

    7,01 1,28

    puisque dans eette s@rie on a n@glig6 g la lois les p@riodes sgehes d'une longueur inf@rieure s vingt.-quatre heures et eelles qui, d 'une dur6e de plus de vingt-quatre heures, ont 6ehappg s la classification en raison du fair qu'elles n'englobaient pas un jour m6t6orologique entier.

  • Un type de d i s t r ibut ion d i sc re te t ronqude 407

    2. Ajustement d'une distribution logarithmique tronqude

    En l 'absence de toute indicat ion ~ priori sur la valeur qu'i l convient d 'a t t r ibuer ~ i0, il faudra proedder par essais suecessifs en donnant /t i0 des valeurs de plus en plus grandes, l 'aeeeptat ion ou le rejet des distri- butions eonsiddrdes dtant 6videmment lids ~ la qualitd de l 'a justement obtenu. On notera eependant que pour faire apparai t re l ' ineompatibi l i t6 d 'une distr ibut ion thdorique avee les donn6es observdes, il n 'est pas indispensable de ddvelopper eette distr ibut ion dans son enti~retd.

    On sait, en effet, que pour ehaque frdquenee observde, on peut 6tablir un interval le de eonfianee eomprenant, pour un niveau donn6, la pro- babil itd exaete eorrespondante ; on pourra donc rejeter une distr ibut ion thdorique d~s qu'elle conduit, pour une elasse partieuli~re, ~ une pro- babil itd extdrieure ~ l ' interval le de eonfianee qui lui est attaehde.

    On se souviendra ~ ee propos (eft [3], p. 699) que si / est le nombre de eas observds dans la elasse envisagde, N 6rant le hombre total de eas, il y aura une probabi l i td P que la probabil i t6 exaete 0 eorrespondant / soit comprise dans l ' interval le (0, 0) dont les l imites sont ddfinies par l'dgalit61 :

    2 aresin ~0_0 } = 2 aresin V]~ 89 + uP1 (4) 2 aresin N - - 1 IN '

    (1 - - P ) off P1 = 1 2 et oh up~ est la valeur de la variable normale

    rdduite correspondant 5, P1. En partieulier, dans le eas des pdriodes s~ches de 1 jour (classe 0)

    on a ici /0 = 629 et N = 2254, ee qui donne, en ut i l isant les Tables 3 et 12 de HALI) [4] :

    0 - : 0,298 et 0 = 0,261 ou 0 : 0,304 et 0 = 0,255

    selon que l 'on choisit P = 0,95 ou P = 0,99. I1 s'ensuit que l ' interval le de eonfianee qui doit comprendre la vMeur thdorique de ]0 sera (588,672) ou (575,685) selon que l 'on adopte la premiere ou la seeonde valeur de P.

    Cela ~tant, si on fair i0 z 1 dans (3), on ddduit imm~diatement de relations eonnues 2 (ef. [2], p. 122):

    1 En rdalitd, nous n'avons reproduit ici que la plus simple des deux relations donndes par tIALD, N 6tan~ dans notre cas suffisamment grand pour que les deux relations eonduisent pratiquement au m@me rdsultat.

    2 Quelques erreurs out subsist6 h lap . 122 de notre note [2]. I1 faut er~ effet lire :

    1 2 e ligne : X0=e a, ~= 1- ec~

    15 e l igne : ~ = ~z'~ '~'~ - ~z'~ ~'1 - (~'1) 2 ~'o ~'~ - ( ,a ' l ) 2

    dernigre ligne : ~ = i - K~ ~z'o + ~x'~

    Arch. l~Iet. Oeoph. Biokl. B. Bd. 10, g . 3 28

  • 408 R , SNEYERS;

    Y0 = - -K [~ + log (i - - z)] (5) et :

    No q- F0 = E (i ~- 1)/ i = K [~ (1 - - ~)-1 @ log (1 - - ~)], (6)

    ce qui donne l '6quat ion:

    F0 + No ~ (1 __~)-1 _}_ log (1 - -~) - - I0 - , (7 )

    Fo ~ + log (1 - - oc)

    de laquelle on peut t irer ct. Connaissant ~, on ealeulera K au lnoyen de (5), ee qui d6terminera enti6rement la distr ibut ion eherehge.

    Pour les pdriodes sgehes s Heil igenblut, l0 ~ 4,39885 ; ee qui con- duit s ~ = 0,8876 et K = 1736,38.

    I1 en r6sulte que ~0 = K 2 ~ = 684. Comme eette valeur est pra-

    t iquement 6gale s la l imite supgrieure de l ' interval le de eonfianee ~ 99%, il eonvient de eonsid6rer le d6saeeord eomme trop grand et de rejeter eette premi6re distr ibution.

    Pour i0 = 2, on trouve de la m4me manigre que ei-dessus:

    F0 = - -K e ~- ~ @ log (1 - - : r (8)

    et :

    N0@2Fo= E ( i@2)/i=K ~.(1 - -~) -1 - -~ @log( i - -e ) , (9) i>0

    d'ofi l 'on tire l '6quat ion:

    No Fo l o - -

    Fo

    @ ~(1- -~) -1 @ 2 log (1 - -~) ~2

    + ~ -[- log (1 - -~) (10)

    On obtient ainsi, avec (10) et (8) : c~- 0,8700 et K = 2846,79 ee qui 0~ 3

    donne: /o = K~ = 624,87, valeur qui s'accorde t r ' s bien eette fois

    avec la valeur observ6e. Les antres valeurs de h ont 6t6 d6duites ~ part i r de f0 au moyen de

    la r6currence : i@3

    ,h+l = b~+l / i , off b t+ l=~i@4,

    et figurent 6galement au Tableau 1 dans la eolonne [dl). I1 appara l t de cette fagon que l 'accord reste satisfaisant dans l 'ensemble pnisque la comparaison des valeurs ajust6es aux valeurs observ6es conduit ~ une valeur de Z z = 25,96, avee 9 = 20 degr6s de ]ibert6, pour laquelle le niveau de signification est un pen inf6rieur s 0,20. Par ailleurs, l 'examen des composantes de X 2 indiqu6es au Tableau 1 laisse penser qu'i l n 'y a pas lieu d'escompter des ajustements meilleurs en ehoisissant des valeurs de i0 > 2.

  • Un type de distribution discrete tronqu6e 409

    3. Ajustement d'une distribution binomiale n6gative tronqu6e

    La distr ibut ion binomiale ndgative se t rouvant ddfinie au moyen de deux param~tres (en plus de K qui est un facteur de proportional itd) au lieu d 'un dans le cas de la distr ibut ion logarithmique, on est en droit d'esp6rer avec une telle distr ibut ion un a justement un peu meil leur qu'avec la pr6c6dente.

    Dans t 'hypoth~se oh cette distr ibut ion serait tronqude de ses i0 pre- miers termes, la relat ion de ddfinition devient :

    /~=K~i+i0 F ( i+ io@~) (1 - -~)~ ; i=0 ,1 ,2 . . . . (11) (i + i0) ! r (~)

    de laquelle on ddduit, avec i0 = 1 :

    Fo=K[1- - (1 - -o@] ; No= 2 i/~=E(i+ 1) /~- -E /~ =

    =K ~ Fo

    et : ~t'2~- E i2]i= Z(i@ 1)2 / i - -2Eg/ i - -E / i=

    e~ ~2 ~ (~ @ 1) =K1 ~@K (1 - -e )2 2N0- -F0

    i ' (12)

    I J

    I1 en rdsulte qu'on a les dquations:

    No + Fo ~ lo-- Fo ( l - -g ) [1 - - (1 - - ~)5]

    et ~x'2 @ 2 No @ Fo 1 + c~ No @ Fo 1 - -

    (13)

    qui deviennent pour la sdrie dtudide :

    ~ = 4,39885 et (1 - -~) [1 - - (1 - - ~,)~]

    1 @ c~ ~ _ 9,70640. (14)

    Pour rdsoudre les dquations (14) nous avons fair ~ = 0,87, valeur fournie par le dernier ajustement, et nous l 'avons introduite dans ehacune des 6quations (14). La moyenne des valeurs de ~ ainsi trouv6es a servi ensuite s d6terminer deux nouvelles valeurs de ~. F ina lement on trouve :

    = 0,869 et ~ = 0,310,

    ee qui, avee la premiere des relations (12) donne:

    K = 4821,39 et, de ee fair, /0 = 691,63.

    Comme cette valeur est signifieative m6me pour un niveau de eonfianee de 0,99, eette premi6re distr ibut ion doit ~tre rejet6e.

    Si l 'on suppose alors i0 = 2, on trouve les relations :

    28*

  • 410 R. SNEYE~S:

    [ ~ ~(1--~)~]--2 ~'o I No=K 1- -~ ~ (15) [ ~ ~213(~+ 1) ~( l __~)~]__4No__4Fo , l et ~ '~=K -1--~- + (1 - -~)2

    desquelles on dgduit :

    et

    No + 2 F0 _ 10 -t- 1 = g ~ [1 - - (1 - -~)~+l ] F0 (1 - - ~) [1 - - (1 - - g)~ - - ~ ~ (1 --:~)3]

    Ez'2 + 3No + 2Fo ~. (~ + 1) No+2Fo (1 --0~) [1 - - (1--~)~+1]"

    (l~)

    Saehant qu'iei on a:

    lo@ 1 =5,39885 et ~z%_ + 3No + 2Fo

    No+ 2Fo =8,72331,

    on trouve, en utilisant la m@me m@thode que plus haut, les solutions: = 0,873 et ~ = 0,135, ee qui conduit s K = 14.641,12 et /0 =- 647,02,

    valeur qui, eette lois, est 6galement acceptable. La distribution ainsi d6finie se trouve indiqu6e au Tableau 1 dans

    la eolonne/~(2) et le ealeul de Z ~ r6vgle s nouveau un accord satisfaisant dans l 'ensemble puisque la valeur trouvde, 6gale g 26,67, avee v = 19 degr@s de libert6, a un niveau de signification eompris entre 0,20 et 0,10. De plus, iei aussi les eomposantes du Z 2 permettent de pr@voir qu'aueune am@lioration importante n'est possible en util isant des valeurs de i0 > 2.

    4. Conclusions

    En r6sum6, il semble done bien que l 'emploi d'une distribution tron- qu6e pour repr6senter les p6riodes s6ehes ~ t!eil igenblut air apport6 la r6ponse la plus ad6quate au probl6me pos6.

    En outre, l 'a justement un peu meilleur obtenu au moyen de la distri- bution logarithmique est int6ressant s noter puisque la m6me eonstatation a pu 4bre faite ?~ propos des p6riodes s6ehes K Paris St-Maur. On peut done eroire que la distribution logarithmique est la plus appropri6e pour d6erire la distribution statistique des p6riodes s6ehes, en g6n6ral, du moins, sous nos lalitudes.

    Par eontre, on peut s'6tonner de ee qu'~ Paris St -~aur un bon r6- sultat a pu 6tre obtenu sans faire appel ~ une distribution tronqu6e, mais l 'objeetion n'est qu'apparente, puisque la distribution logarithmique n'est autre qu'une distribution binomiale n6gative pour laquelle ~ = 0 et dont le premie r terme, devenu infini, a 6t6 supprim6.

    Aecessoirement, il reste encore ~ signaler que l 'analyse statistique qui vient d'4tre faite met en 6videnee la persistanee plus aeeus6e des situations atmosph6riques earaet6ris6es par du temps see d~ns 1s r6gion

  • Un type de distribution discrgte tronquge 411

    de ttei l igenblut (versant Sud des Alpes 0rientales) que duns l 'ouest de l 'Europe, lu l imite ~ vers luquelle tend lu probabi l i t4 d 'avoir un jour see de plus par temps de s@eheresse atteignant, en effet, (en moyenne) 0,870 duns le premier eas eontre 0,824 (g Paris St-Maur) s 0,833 (g Ueele) duns le second.

    Bibliographie

    1. STEINtIJ*USSER, ~I. : Trocken- und Niedersehlagsperioden und ihre theo- retisehe Behandlung. Arch. Met. Geoph. Biokl. B 10, 38 (1959).

    2. SXEYERS, R. : Sur l 'analyse des r@artit ions statistiques diser~tes. Areh. Met. Geoph. Biokl. B 7, 117 (1955).

    3. HALo, A. : Statistical Theory with Engineering Applications. New York: Wiley. 1955.

    ~. HAs~D, A.: Statistical Tables and Formulas. New York: Wiley. 1952.

Recommended

View more >