Analyse spatio-temporelle de la natalité en Bretagne entre...

27
Analyse spatio-temporelle de la nata- lité en Bretagne entre 1975 et 2009 Travaux d’été sous la tutelle d’Arthur Charpentier Ewen Gallic 16 juillet 2012 Quantact, Université du Québec à Montréal

Transcript of Analyse spatio-temporelle de la natalité en Bretagne entre...

Page 1: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Analyse spatio-temporelle de la nata-lité en Bretagne entre 1975 et 2009Travaux d’été sous la tutelle d’Arthur Charpentier

Ewen Gallic16 juillet 2012Quantact, Université du Québec à Montréal

Page 2: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

1 Approche temporelleDonnéesModèleRésidus

2 Approche spatialeDensité par noyauPremière estimationEffets de bord

2 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 3: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Présentation des données

Source : INSEE ;Date, commune ;Regroupement par semaine et par commune ;1, 749, 308 observations.

3 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 4: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Présentation des données

Figure 1: Naissances hebdomadaires en Bretagne.

4 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 5: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Le modèle

Il s’agit de données de comptage, aussi il semble naturel d’employer unmodèle de Poisson.

Soit Nx,t le nombre de naissances à un endroit (x) et un temps (t) donnés.

Nx,t ∼ Pois(λ), (1)λ = E(Nx,t) = exp(αx + βt). (2)

5 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 6: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Difficultés computationnelles

Avec le nombre d’observation élevé, il y a des difficultés à effectuer lescalculs, malgré l’utilisation de packages tels biglm ou speedglm.

958 communes + 1826 semaines = 2784 coefficients

6 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 7: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Modèle additif généralisé (GAM)

Le prédicteur devient :

log λ = f1(x) + f2(t), (3)

où fi(.) avec i ∈ {1, 2}, est une fonction de lissage non paramétrique.

7 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 8: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Estimation en deux étapes

Dans un premier temps, on récupère un coefficient temporel communà toutes les villes à chaque instant t ;On introduit ensuite ces coefficients dans la seconde régression, enincluant une variable reflétant le nombre de jours fériés dans la se-maine.

Jours fériés

8 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 9: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Résidus de Pearson

Comme on suppose que les données suivent un processus Poissonnien, lavariance est supposée égale à l’espérance. On peut alors calculer les résidusde type Pearson de la manière suivante :

rPx ,t =rx ,t√V(λ̂x ,t)

=rx ,t√E(λ̂x ,t)

, (4)

9 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 10: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

IdéeÀ partir d’une liste connue a priori de maternités ayant fermé, l’idée estde détecter les changements structurels dans un entourage spatio-temporelproche.

Figure 2: Proximités spatiales.

10 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 11: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Détection

Pour chaque série de résidus concernée :régression linéaire simple sur un trend linéaire :

yt ∼ β0 + β1t

découpage de la série en segments de longueur bn×hc, avec n = 1826et h = 0.15 ;test de Fisher de constance de β.

(Utilisation de la fonction breakpoints du package strucchange.)

11 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 12: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Un exemple

Pour la ville d’Auray (Morbihan), à partir de la série de résidus suivante :

Figure 3: Résidus Auray.

12 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 13: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Figure 4: Chocs structurels autour d’Auray.

13 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 14: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

1 Approche temporelleDonnéesModèleRésidus

2 Approche spatialeDensité par noyauPremière estimationEffets de bord

14 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 15: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

MéthodeL’objectif est d’obtenir une estimation de la fonction de densité.

On peut penser à un équivalent de l’histogramme pour des données biva-riées.

Figure 5: Naissances en Bretagne entre 1975 et 2009.

Le choix de la fenêtre n’est pas adapté.

15 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 16: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Méthode

On considère le couple (Z ,T ) avec Z = (X ,Y ), où X représente unelatitude, Y une longitude et T un temps.

L’estimation de la densité à un point z = (x , y) au temps t est donnéepar :

f̂ (x , y , t) = 1nhX hY hT

n∑i=1

KZ

(x − Xi

hX,

y − YihY

)KT

(t − Ti

hT

), (5)

avec KZ et KT des noyaux (par exemple gaussiens), n le nombre d’obser-vations, hX , hY et hT les largeurs des fenêtres spatiales et temporelles,respectivement.

16 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 17: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Une première estimation

Figure 6: Estimation de la densité de probabilité du nombre de naissances en Bretagne en1990.

17 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 18: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Les points faibles

choix de la fenêtre h exemple :trop petite : bruit important,trop grande : caractère bi-modal de la densité voilé ;

peu adapté aux distributions à longues queues ;problèmes d’effets de bord lorsque les données doivent appartenir àune surface.

18 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 19: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Proposition pour corriger les effets de bordConsidérons des points Z i appartenant à une surface S.

L’estimateur du noyau est

f̂ (z) = 1n

n∑i=1

µZ i (z), (6)

avec µZ i (z) la densité d’un vecteur gaussien par exemple.

Le support de la distribution de Z i étant borné, il en résulte une mauvaiseattribution de poids.

On considère alors un cercle DZ i ,r de centre Z i et de rayon r .L’idée est de donner une approximation de f̂ (z) à l’aide du rapport d’airessuivant :

A(DZ i ,r ∩ S)A(DZ i )

19 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 20: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Proposition pour corriger les effets de bordOn note a la distance entre Z i et le bord.

Figure 7: Intuition pour la correction des effets de bord.

20 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 21: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Résultats

(a) Sans correction (b) Avec correction

Figure 8: Estimation de la densité de probabilité du nombre de naissances en 1990 enBretagne.

21 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 22: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Conclusion

dimension temporelle :changements structurels détectés à l’aide des résidus,identification des impacts proches ;

dimension spatiale :estimation lissée de la densité,introduction d’un moyen de prendre en compte les effets de bords ;

la suite du projet :tenter de quantifier les effets des chocs dans les communes voisines,ajouter une composante temporelle dans l’estimation de la densité.

22 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 23: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Conclusion

dimension temporelle :changements structurels détectés à l’aide des résidus,identification des impacts proches ;

dimension spatiale :estimation lissée de la densité,introduction d’un moyen de prendre en compte les effets de bords ;

la suite du projet :tenter de quantifier les effets des chocs dans les communes voisines,ajouter une composante temporelle dans l’estimation de la densité.

22 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 24: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Conclusion

dimension temporelle :changements structurels détectés à l’aide des résidus,identification des impacts proches ;

dimension spatiale :estimation lissée de la densité,introduction d’un moyen de prendre en compte les effets de bords ;

la suite du projet :tenter de quantifier les effets des chocs dans les communes voisines,ajouter une composante temporelle dans l’estimation de la densité.

22 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 25: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Introduction Approche temporelle Approche spatiale Conclusion

Quelques référencesArthur Charpentier.Davantage de régularité dans les naissances ?http://freakonometrics.blog.free.fr/index.php?post/2010/07/19/Davantage-de-r%C3%A9gularit%C3%A9-dans-les-naissances, 2010.

Trevor Hastie and Robert Tibshirani.Generalized additive models.Statistical Science, 1(3) :pp. 297–310, 1986.

Ronald D. Lee and Lawrence R. Carter.Modeling and forecasting u. s. mortality.Journal of the American Statistical Association, 87(419) :pp. 659–671, 1992.

Loretta O’Brien and Paul Rago.An application of the generalized additive model to groundfish survey data with atlantic cod off the northeast coast of the unitedstates as an example.NAFO [Northwest Atl. Fish. Org.] Sci. Counc. Studies, 28 :pp. 79–95, 1996.

B.W. Silverman.Density Estimation for Statistics and Data Analysis.Monographs on Statistics and Applied Probability. Chapman and Hall, 1986.

Achim Zeileis, Christian Kleiber, Walter Krämer, and Kurt Hornik.Testing and dating of structural changes in practice.Computational Statistics & Data Analysis, 44(1-2) :109 – 123, 2003.Special Issue in Honour of Stan Azen : a Birthday Celebration.

23 / 23Analyse spatio-temporelle de la natalité en Bretagne entre 1975 et 2009

Page 26: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Figure 9: Jours fériés.

Retour Estimation en deux étapes

Page 27: Analyse spatio-temporelle de la natalité en Bretagne entre ...editerna.free.fr/Recherche/nais_spatio_temp.pdf · Analysespatio-temporelledelanata-litéenBretagneentre1975et2009 Travauxd’étésouslatutelled’ArthurCharpentier

Figure 10: Différentes fenêtres (trop petite, optimale, trop grande).

Retour Les points faibles