banner

Nouvelles

Sep 06, 2023

Prédire les performances d'atténuation du climat des villes européennes à l'aide de l'apprentissage automatique

Nature Communications volume 13, Numéro d'article : 7487 (2022) Citer cet article

4466 accès

31 Altmétrique

Détails des métriques

Bien que les villes aient pris de l'importance en tant qu'acteurs du climat, la rareté des données sur les émissions a été le principal défi pour évaluer leurs performances. Ici, nous développons une approche d'apprentissage automatique évolutive et reproductible pour évaluer les performances d'atténuation pour presque toutes les zones administratives locales en Europe de 2001 à 2018. En combinant des données environnementales et socio-économiques spatialement explicites accessibles au public avec des données sur les émissions autodéclarées des villes européennes, nous prévoyons les émissions annuelles de dioxyde de carbone pour explorer les tendances des performances d'atténuation à l'échelle de la ville. Nous constatons que les villes européennes participant aux initiatives transnationales sur le climat ont probablement réduit leurs émissions depuis 2001, avec un peu plus de la moitié susceptibles d'avoir atteint leur objectif de réduction des émissions pour 2020. Les villes qui communiquent des données sur les émissions sont plus susceptibles d'avoir réalisé des réductions plus importantes que celles qui ne communiquent aucune donnée. Malgré ses limites, notre modèle fournit un point de départ reproductible et évolutif pour comprendre les performances d'atténuation des émissions climatiques au niveau de la ville.

Ces dernières années, les villes ont pris de l'importance dans l'agenda mondial des politiques de durabilité, car les chercheurs et les décideurs politiques se sont de plus en plus concentrés sur les juridictions urbaines en tant qu'acteurs politiques puissants à part entière. Plus de 10 000 villes du monde s'engagent à diverses formes d'actions d'atténuation, d'adaptation et de financement du climat, et dans de nombreux cas, ces municipalités participent à de multiples initiatives volontaires transnationales sur le climat1. Dans le cadre des exigences de ces initiatives, conformément aux directives gouvernementales nationales2, ou de leur propre gré, les villes articulent des stratégies et des politiques pour lutter contre l'atténuation du changement climatique et, moins fréquemment, l'adaptation. Les villes proposent principalement des stratégies d'atténuation centrées sur des objectifs de réduction des émissions de gaz à effet de serre, souvent atteints grâce à des politiques axées sur l'augmentation de l'utilisation des transports durables, l'amélioration de l'efficacité de l'éclairage dans les bâtiments publics et municipaux, l'adoption de normes d'efficacité énergétique, la promotion de la sensibilisation au climat pour encourager l'action citoyenne , et d'autres domaines3,4.

Il existe des milliers de stratégies et de politiques actuelles détaillant les efforts d'atténuation en milieu urbain, mais, comme le soulignent Milojevic-Dupont & Creutzig5, les effets de ces actions sont mal compris. Ces lacunes dans les connaissances font que les décideurs politiques sont "désorientés sur les mesures qui sont adéquates et efficaces" dans les zones urbaines et incertains sur les "décisions quotidiennes" concernant la planification ou les investissements dans les infrastructures à prendre pour atteindre les objectifs d'atténuation. On sait peu de choses sur les réductions d'émissions des politiques et stratégies climatiques urbaines communes, un bloc d'informations vitales manquant reconnu dans le chapitre 12 sur les établissements humains du cinquième rapport d'évaluation (AR5) du Groupe d'experts intergouvernemental sur l'évolution du climat (GIEC)5,6.

Les chercheurs ont fait valoir que l'implication des villes dans la gouvernance climatique transnationale "peut accélérer leurs actions pour réduire les émissions de GES sous certaines conditions"7. Les preuves à l'appui de cette affirmation sont rares, ce qui rend difficile de prédire précisément quelles conditions auraient cet effet. Les initiatives climatiques transnationales nécessitent généralement des rapports sur les plans d'action pour le climat et un suivi régulier sous la forme d'inventaires des émissions pour évaluer si les objectifs d'atténuation sont atteints, mais dans la pratique, seule une petite fraction des acteurs infranationaux satisfait à ces exigences8,9. Hsu et al.10 ont constaté que sur plus de 9 000 villes signataires de l'initiative de la Convention des maires de l'UE pour le climat et l'énergie (EUCoM), seulement environ 15 % avaient communiqué des données sur les émissions, et encore moins (environ 11 %) avaient ont signalé à la fois un inventaire de référence des émissions et une année supplémentaire de données d'inventaire sur les émissions nécessaires pour suivre les progrès vers les objectifs de réduction volontaires. Lorsque des données sur les émissions sont disponibles, elles sont souvent incomparables en raison de la disponibilité limitée de points de données, d'un manque général de transparence concernant les méthodologies sous-jacentes et de l'absence d'approches comptables normalisées. Ibrahim et al.11 ont évalué sept protocoles et méthodologies distincts d'inventaire des émissions de gaz à effet de serre à l'échelle de la ville et ont conclu qu'une norme ou une approche commune de déclaration est nécessaire pour les villes. Les différences dans les définitions des diverses normes, par exemple, pour les champs d'émission, en particulier dans les émissions de la chaîne d'approvisionnement du champ d'application 3, doivent être traitées afin que les données sur les émissions des participants puissent être comparées de manière appropriée.

Les progrès récents de l'apprentissage automatique (ML), une classe générale d'approches de modélisation statistique non paramétrique et non linéaire et d'algorithmes de calcul généralement appliqués à des ensembles de données à grande échelle pour simuler l'apprentissage humain, pourraient nous aider à surmonter ces défis délicats liés aux données sur les émissions12. Dans cette étude, nous utilisons une approche axée sur le ML pour estimer et évaluer les performances d'atténuation de presque tous les acteurs locaux et municipaux de l'Union européenne et du Royaume-Uni de 2001 à 2018. Notre méthode développe un processus d'identification des limites spatiales et des prédicteurs géospatiaux. pour chaque gouvernement local et municipal participant à l'EUCoM, l'une des plus grandes initiatives transnationales volontaires de gouvernance climatique, puis en utilisant les données d'inventaire des émissions de carbone autodéclarées d'environ 6000 villes de l'EUCoM comme données de formation dans un modèle de renforcement de gradient extrême. À notre connaissance, notre ensemble de données résultant est l'ensemble de données chronologiques le plus complet utilisé pour évaluer les émissions de carbone au niveau de la ville et les performances d'atténuation. Nous appliquons ces données pour évaluer la performance de trois groupes de villes européennes : les villes « déclarantes » qui ont déclaré au moins un an de données sur les émissions ; les villes « participantes » qui se sont engagées à agir volontairement pour le climat mais n'ont déclaré aucune donnée sur les émissions ; et enfin, les villes « externes » représentant les unités administratives locales (UAL) non participantes.

La figure 1a montre la corrélation entre les variables dépendantes au niveau de la ville (c'est-à-dire les « émissions » autodéclarées) et les variables indépendantes (c'est-à-dire les degrés-jours de chauffage, le CO2 des combustibles fossiles, le PIB par habitant, etc.). Nous avons trouvé une forte corrélation positive entre les données d'inventaire des émissions déclarées et les émissions fixes de CO2 des combustibles fossiles de l'Open-Data Inventory for Anthropogenic Carbon dioxide (ODIAC)13 (r2 = 0,81), ainsi qu'entre les émissions et la population (r2 = 0,89) . Les émissions de CO2 de la population et des combustibles fossiles fixes étaient également fortement corrélées (r2 = 0,79), confirmant des études antérieures qui démontrent, grâce à l'utilisation de l'intensité des lumières nocturnes, les relations entre ces données et la consommation d'énergie, l'activité économique et les émissions de combustibles fossiles14. Notre analyse n'a pas montré de fortes relations entre les données d'émissions autodéclarées et le PIB par habitant (r2 = 0,03) ou avec la pollution atmosphérique par les particules fines (PM2,5 ; r2 = 0). Nous avons déterminé que les émissions de CO2 des combustibles fossiles stationnaires et la population étaient les principaux prédicteurs des données d'émissions autodéclarées des villes avec la contribution ou l'importance la plus élevée pour notre modèle d'émissions (Fig. 1b). La figure 1b montre la valeur de gain de l'importance de chacune des six principales caractéristiques que nous avons considérées. Les valeurs de gain sont déterminées par le degré d'amélioration des performances du modèle par chaque division d'attribut, pondérée par le nombre d'observations pour le nœud. Voir Méthodes pour plus de description sur le processus de recherche de grille et le réglage des paramètres pour déterminer le modèle final.

a Matrices de corrélation montrant la relation entre divers prédicteurs des émissions climatiques urbaines. b Importance de diverses variables prédictives pour le modèle de prévision des émissions. Plus un attribut est utilisé pour prendre des décisions dans le modèle XGBoost, plus son importance est déterminée.

Nous avons prévu des émissions pour environ 92 636 villes ou unités administratives locales (UAL) pour lesquelles nous disposions de données spatiales sous-jacentes (tableau supplémentaire 2). La figure 2 présente des diagrammes de dispersion des données d'émissions autodéclarées des villes par rapport aux données d'émissions prévues de notre modèle. Le r2 = 0,91 qui en résulte indique que notre modèle est globalement fortement prédictif des inventaires d'émissions autodéclarées des villes. Nous avons en outre validé nos émissions prévues avec d'autres études qui rapportent des données sur les émissions pour les villes européennes, y compris Moran et al.15, qui estiment les émissions directes (Scope 1) de 2018 pour plus de 100 000 villes européennes et Nangini et al.16, qui combinent l'auto- inventaires rapportés avec d'autres données pour 343 villes mondiales. Nous avons trouvé une bonne corrélation (r2 = 0,57 avec Moran et al.15 ; r2 = 0,62 avec Nangini et al.16) entre nos données prédites et ces autres études (Fig. 7 supplémentaire). La figure 2b montre également les données d'émissions autodéclarées par rapport aux données d'émissions prévues par pays, ce qui permet un examen plus approfondi des excentricités potentielles dans notre modèle ou les données prévues. Pour certains pays, comme l'Ukraine, notre modèle fonctionne moins bien (r2 = 0,02), et pour certaines villes particulières, les émissions prévues sont supérieures à ce que les villes elles-mêmes ont déclaré. Par exemple, notre modèle prédit des émissions annuelles près de trois fois supérieures aux émissions autodéclarées de Lyon. Une inspection plus approfondie de l'une de ces valeurs aberrantes, Lyon, une ville de 445 000 habitants en France, rapporte un inventaire des émissions d'environ 22 000 tonnes, se traduisant par des émissions par habitant de <0,05 tonne, bien en deçà de la moyenne nationale de 5,4 tonnes par personne17.

Diagramme de dispersion des émissions autodéclarées (n = 6961 points de données sur les émissions autodéclarées des villes faisant rapport à l'EUCoM utilisé dans la formation au modèle) par rapport aux émissions médianes prévues pour chaque acteur à partir du modèle sur une échelle logarithmique. a Tous les inventaires d'émissions auto-déclarés (en logtonnes de CO2) de tous les acteurs par rapport aux données d'émissions prévues (en logtonnes de CO2) ; b Aspects pays par pays des émissions autodéclarées par rapport aux émissions prévues lorsqu'il y avait plus d'un point de données. Le nombre de villes répertoriées dans les panels de pays varie légèrement par rapport au tableau supplémentaire 3 puisque le tableau supplémentaire 3 comprend à la fois les villes déclarant des données sur les émissions et celles qui ne le font pas.

En utilisant les données de séries chronologiques disponibles des prédicteurs sous-jacents, nous avons généré des plages d'émissions annuelles probables pour toutes les villes et unités administratives locales où les données étaient disponibles de 2001 à 2018. Illustrant la sortie de notre modèle, la Fig. 3 montre des séries chronologiques pour trois villes sélectionnées tailles de population : Waimes en Belgique (population : 8932), Tolosa en Espagne (population : 17 575) et Londres au Royaume-Uni (population : 8,9 millions). Ces données ont ensuite été analysées pour déterminer les tendances de la réduction annuelle des émissions par habitant sur la période de 2001 à 2018 pour les villes participant à l'EUCoM qui déclarent des données sur les émissions (villes déclarantes), celles qui ne déclarent pas (villes participantes) et pour toutes les LAU. en Europe (villes extérieures).

Waimes en Belgique, Tolosa en Espagne et Londres au Royaume-Uni ont été sélectionnées pour représenter des villes de tailles de population variables.

Dans l'ensemble, nous constatons que les villes de l'EUCoM ont en moyenne, probablement réduit leurs émissions annuelles par habitant de 2001 à 2018 (−0,96 ± 1,88 %) et de 2005 à 2018 (−0,53 ± 3,3 %), par rapport aux villes externes qui, en moyenne, sont n'ont probablement pas connu beaucoup de changement dans les émissions (0,18 ± 2,5 % de 2001 à 2018 et 0,18 ± 3,2 de 2005 à 2018 ; tableau 1). Alors que 74 % des villes de l'EUCoM sont susceptibles d'avoir réduit leurs émissions, seules 53 % des villes extérieures sont susceptibles d'avoir connu une tendance négative en matière de réduction des émissions. Nous interprétons ces différences de tendances d'émissions entre les villes de l'EUCoM et les LAU externes avec prudence, notant toutefois les différences de population entre l'EUCoM (32 720 ± 181 348 habitants pour les villes déclarantes ; 35 318 ± 171 pour les villes participantes) et les LAU externes, qui tendent à être en moyenne beaucoup plus petite (4 433 ± 16 870 habitants) (tableau complémentaire 2 ; fig. complémentaire 6). Les statistiques descriptives (tableau supplémentaire 2) et les distributions (Fig. 6 supplémentaire) décrivant les trois groupes de villes dans notre analyse illustrent que les villes de l'EUCoM ont tendance à avoir des émissions de dioxyde de carbone fixes de combustibles fossiles plus importantes et à avoir une population et une densité de population plus importantes que les villes externes. villes, ce qui pourrait expliquer les différences dans leurs tendances en matière d'émissions, puisqu'il a été démontré que les grandes villes avec des niveaux de PIB par habitant plus élevés ont des plans climatiques plus ambitieux2,18.

Au sein des villes de l'EUCoM, nous constatons que les données d'inventaire des émissions autodéclarées des villes (75 % des villes de l'EUCoM) sont susceptibles d'avoir réalisé des réductions d'émissions moyennes supérieures à celles des villes participantes qui n'ont pas déclaré d'inventaire de référence ou de surveillance des émissions (−1,3 ± 1,7 contre 0,2 ± 1,9 réductions annuelles d'émissions par habitant entre 2001 et 2018 ; tableau 1). Ces résultats suggèrent que les villes EUCoM participantes sont susceptibles d'avoir atteint la même performance d'atténuation que les villes externes. Les villes de l'EUCoM qui se sont engagées à atteindre des objectifs d'atténuation relativement plus ambitieux, dépassant l'objectif d'atténuation de l'UE pour 2020 de 20 % de réduction par rapport aux niveaux de 1990, sont susceptibles d'avoir réalisé des réductions d'émissions par habitant annualisées plus importantes que les villes ayant un objectif d'atténuation relativement moins ambitieux (−1,4 ± 1,7 vs −0,6 ± 0,20 de 2001 à 2018 ; tableau 1). Enfin, les villes de l'EUCoM susceptibles d'être sur la bonne voie (par exemple, réduire suffisamment les émissions conformément aux émissions requises pour atteindre leur objectif déclaré de réduction des émissions pour 2020, voir Méthodes pour plus de détails) pour atteindre leurs objectifs de réduction des émissions pour 2020 (52 % des villes de l'EUCoM) ont probablement connu les plus fortes réductions d'émissions (−1,8 ± 2,5 vs 0,5 ± 1,6 de 2001 à 2018 ; Tableau 1). Les villes de l'EUCoM qui ne sont pas sur la bonne voie (48 % des villes de l'EUCoM) ont probablement connu une légère croissance des émissions annuelles par habitant.

Bien que nous manquions de contrôles et de données suffisants pour déterminer de manière causale si la participation à l'EUCoM a conduit à ces tendances d'atténuation des émissions, une analyse de séries chronologiques interrompues (ITS), qui modélise si une intervention politique ou un programme peut avoir entraîné un changement mesurable dans une variable de résultat après sa mise en œuvre19,20, peut éclairer la question de savoir si les réductions d'émissions des villes de l'EUCoM se sont produites principalement après leur adhésion à l'initiative, en tenant compte des différences de densité de population, de PIB par habitant, etc. (voir Méthodes pour plus de détails). Nous constatons que chaque année suivant l'adhésion d'une ville à l'initiative EUCoM est associée à une légère variation annuelle en pourcentage de −0,164 (erreur type, ou se : 0,039) des émissions par habitant (Fig. 4). Confirmant notre comparaison entre les groupes de villes (tableau 1), la régression ITS démontre en outre l'importance d'un inventaire des émissions (p < 0,01), où les villes déclarantes ont probablement atteint une variation annuelle en pourcentage de −1,24 (se : 0,396) des émissions par habitant ( Tableau 2). Le niveau de l'objectif de réduction des émissions pour 2020, bien que légèrement significatif (p < 0,05), ne semble pas avoir beaucoup d'effet supplémentaire sur la variation annuelle en pourcentage des émissions par habitant (tableau 2).

Pourcentage annuel de variation par habitant des émissions pour les villes de l'EUCoM (points tracés) avec pourcentage annuel prévu de variation des émissions par habitant déterminé par une analyse de séries chronologiques interrompues (ligne bleue). Les panneaux incluent des données pour les villes qui ont rejoint l'EUCoM cette année-là uniquement, indiquées par les lignes verticales rouges.

On observe des différences de performances selon les pays. Les figures 5 et 6 comparent les performances des villes EUCoM participantes à celles de toutes les autres LAU par pays. Dans certains pays, les villes de l'EUCoM, comme celles de la Suède et du Danemark, ont enregistré en moyenne des tendances de réduction annuelle par habitant plus élevées que leurs homologues externes. Dans d'autres, comme les Pays-Bas et le Royaume-Uni, les villes de l'EUCoM semblent sous-performantes par rapport aux autres villes (Fig. 4), comme en témoigne la comparaison des distributions des réductions d'émissions annuelles par habitant pour les deux groupes de villes. Ce résultat peut refléter le fait que les gouvernements nationaux du Danemark et du Royaume-Uni exigent des municipalités des plans d'action locaux pour le climat2, ce qui suggère que les villes extérieures de ces pays pourraient réduire leurs émissions pour se conformer aux réglementations et exigences nationales. L'Italie et l'Espagne, où se situent la plupart des villes de l'EUCoM, semblent avoir des performances relativement comparables pour les deux groupes (Italie = 64 % ; Espagne = 50 % ; Tableau complémentaire 3). Les pays scandinaves arrivent en tête en termes de pays avec la plus forte proportion de villes sur la bonne voie (80 % au Danemark ; 53 % en Finlande et 70 % en Norvège). L'Espagne compte également une grande proportion de villes en bonne voie, avec 68 %. Les pays où les villes ont des performances similaires sont plus proches de la ligne diagonale de la Fig. 8 supplémentaire, ce qui suggère que les tendances annuelles moyennes de réduction des émissions par habitant sont similaires entre l'EUCoM et les villes extérieures. Les pays au-dessus de la diagonale sont ceux où les villes EUCoM ont réalisé des réductions d'émissions annuelles par habitant plus importantes que leurs homologues non EUCoM et comprennent des pays comme la Finlande, la Slovaquie, la France, l'Allemagne, l'Italie, entre autres.

Tendance annuelle de réduction des émissions par habitant de 2001 à 2018 pour les villes participant à l'EUCoM (à gauche) et toutes les autres villes externes (à droite).

Répartition des réductions d'émissions annuelles par habitant entre les villes de l'EUCoM et les villes extérieures. Les nombres négatifs indiquent des réductions d'émissions et les tendances annuelles moyennes des émissions par habitant pour chaque groupe sont désignées par des lignes verticales dans chaque panneau.

Malgré une augmentation mesurable de la recherche sur la gouvernance climatique urbaine au cours de la dernière décennie, des lacunes dans la compréhension des résultats des initiatives climatiques transnationales ont persisté, en particulier pour les petites villes et de manière systématique21. Une partie de cet écart est due à la disponibilité et à la comparabilité des données, qui limitent la capacité des chercheurs à retracer les impacts causals ou les liens entre les processus et les institutions des initiatives transnationales de gouvernance climatique urbaine jusqu'aux résultats21,22. Pour remédier à cette lacune, cette étude a développé un cadre basé sur l'apprentissage automatique (ML) pour prédire les émissions de plus de 90 000 villes européennes sur une base annuelle de 2001 à 2018 afin d'examiner les tendances probables des performances d'atténuation. En utilisant des variables prédictives globalement maillées et spatialement explicites qui sont mesurées de manière cohérente et régulière et des inventaires d'émissions autodéclarées disponibles, notre modèle basé sur ML est capable d'expliquer 90 % de la variation (r2 = 0,90) entre les données d'inventaire d'émissions autodéclarées de enregistrement des villes EUCoM et des valeurs d'émissions prévues, validées par des comparaisons avec d'autres études qui ont produit des estimations d'émissions de carbone au niveau de la ville pour une seule année. Non sans ses limites (voir Limitations), notre modèle fournit un point de départ reproductible et évolutif pour comprendre les performances d'atténuation des émissions climatiques au niveau de la ville. Il fournit également une méthode d'évaluation et de validation des émissions autodéclarées des villes. Étant donné que certaines villes peuvent déclarer par erreur des inventaires ou choisir de déclarer de manière sélective les sources d'émissions, notre approche peut aider à repérer les valeurs aberrantes ou les problèmes de déclaration potentiels.

À partir des données d'émissions prévues de notre modèle, nous avons examiné les tendances annuelles des émissions par habitant qui ont révélé des informations justifiant une exploration plus approfondie. Premièrement, sur les quelque 8000 villes européennes qui participent à l'une des plus grandes initiatives climatiques transnationales volontaires - la Convention des maires de l'UE pour le climat et l'énergie (EUCoM) - la plupart (74%) sont susceptibles d'avoir réduit leurs émissions de 2001 à 2018, avec un peu plus de la moitié susceptibles d'avoir atteint leur objectif de réduction des émissions pour 2020. Les villes qui déclarent elles-mêmes les données sur les émissions sont susceptibles d'avoir réduit davantage que les villes qui n'ont pas déclaré de données sur les émissions, une conclusion qui pourrait être due au fait que, comme Rivas et al.23 l'ont constaté, les municipalités de l'EUCoM qui surveillent les émissions ont également tendance à avoir ont commencé à mettre en œuvre des plans plus tôt et sont généralement des « précurseurs » avec plus d'expérience en matière d'action climatique23. Les villes ayant des objectifs d'atténuation plus ambitieux et celles qui sont en voie d'atteindre leurs objectifs d'atténuation pour 2020 ont probablement réalisé les plus grandes réductions d'émissions annuelles par habitant par rapport à leurs homologues. Nos conclusions ici font écho aux résultats d'études antérieures sur les villes de l'EUCoM10,23,24. Kona et al.24, par exemple, ont analysé 315 villes déclarantes et ont constaté qu'elles avaient réduit leurs émissions de 23 % en moyenne, alors que nos résultats sont comparables (~1 % d'émissions annualisées par habitant de 2001 à 2018). Dans notre étude de 2020 portant sur 1066 villes de l'EUCoM déclarant au moins deux inventaires d'émissions, nous avons trouvé 60 % d'entre elles en bonne voie pour atteindre leurs objectifs de réduction des émissions, tandis que cette étude a trouvé des résultats similaires avec 52 % des villes de l'EUCoM susceptibles d'avoir atteint leurs objectifs d'atténuation de 2020. Rivas et al.23 suggèrent que l'ambition et la surveillance peuvent être liées - les municipalités qui ont tendance à être plus ambitieuses dans leurs objectifs ont tendance à ne pas avoir déclaré d'inventaires de surveillance, faisant écho à Hsu et al.10 en trouvant un décalage entre l'ambition et la performance.

Bien que notre étude ne traite pas des mécanismes de causalité des tendances d'émissions prévues, ni de l'existence de conditions endogènes pouvant expliquer pourquoi les villes de l'EUCoM ont connu en moyenne des réductions annuelles par habitant légèrement supérieures à celles de leurs homologues externes non EUCoM, elle suggère quelques idées. pertinent pour la gouvernance climatique urbaine et les initiatives climatiques transnationales. Premièrement, étant donné que les inventaires des émissions et les protocoles de surveillance sont considérés comme les caractéristiques des plans efficaces d'atténuation des changements climatiques des gouvernements locaux25, la capacité de surveiller et de déclarer les émissions est probablement un indicateur de capacité et de réussite. Nous avons mesuré des différences significatives dans les réductions d'émissions annualisées par habitant entre les villes déclarantes et les villes participantes qui ne déclarent aucune donnée sur les émissions, qui sont susceptibles d'être plus similaires aux villes extérieures de l'UE dans leurs trajectoires d'émissions par rapport aux villes déclarantes. Deuxièmement, bien que l'évaluation des tendances des émissions en tant que variable de résultat ne fournisse pas une "mesure de l'effort"26 ni ne décrive la myriade d'intrants et de facteurs qui ont conduit à un résultat particulier, la surveillance et la communication des inventaires des émissions indiquent un "moyen de mise en œuvre"26 pour évaluer les progrès d'une entité vers un résultat politique tel que l'atténuation du changement climatique. Ces conclusions concernant les liens entre la surveillance et la performance ont des implications pour l'amélioration de l'atténuation du climat au niveau infranational, ce qui suggère que les investissements dans la surveillance sont un prédicteur probable du succès. Rivas et al.23 ont constaté que les probabilités de surveillance des émissions sont 2,24 fois plus élevées lorsqu'une autorité locale apporte un soutien financier à la mise en œuvre d'un plan climatique.

Les données décrivant les résultats d'atténuation permettent ensuite d'identifier les « conditions générales d'une mise en œuvre réussie » et de procéder à l'ingénierie inverse des voies de causalité qui ont conduit aux réductions d'émissions. Notre ensemble de données et notre cadre ML reproductible et évolutif peuvent ensuite fournir une première étape pour déterminer quelles mesures spécifiques, ou aucune, ont conduit aux réductions d'émissions observées. Étant donné que nous étions limités aux données sur la population des villes, le PIB, la pollution de l'air et les émissions de CO2 des combustibles fossiles, notre analyse ne peut pas tenir compte d'autres différences structurelles sous-jacentes (par exemple, la variation des institutions de gouvernance, etc.) qui peuvent élucider davantage les différences d'émissions. résultats, puisque l'action et les politiques sur le changement climatique sont "profondément liées à d'autres programmes politiques".

Étant donné que la disponibilité des données d'inventaire des émissions autodéclarées au niveau infranational est principalement limitée à l'Europe, les études futures doivent élargir la recherche d'ensembles de données et de proxys pertinents qui peuvent combler cette lacune, en particulier pour les entités à capacité et ressources limitées dans les pays du Sud29. ,30,31. Les acteurs de ces pays sont confrontés à des limites (par exemple, l'expertise, le manque de rôles clairement définis dans les agences gouvernementales compétentes pour la production d'inventaires, une documentation et des systèmes d'archivage insuffisants) et des problèmes techniques (par exemple, des données d'activité incomplètes ou inexistantes ou le manque de données expérimentales pour développer pays ou facteurs d'émission spécifiques à la technologie) pour produire des inventaires d'émissions10,32. Notre prochaine étape consiste à étendre notre approche à un ensemble de juridictions infranationales en dehors de l'Europe afin de produire un ensemble de données mondial pour les villes participant à des initiatives climatiques transnationales, tel qu'enregistré dans l'ensemble de données de Hsu et al.1 de plus de 10 000 villes et gouvernements régionaux. Nous trouvons des preuves convaincantes que des ensembles de données géospatiales à grande échelle peuvent être appliqués pour estimer les émissions de dioxyde de carbone au niveau de la ville, même pour les petits acteurs urbains qui constituent la majorité des participants à l'EUCoM, bien que davantage de données et une portée élargie puissent mieux tester le stress. l'applicabilité du modèle au-delà de l'Europe. Notre méthode comble le fossé entre ces ensembles de données géospatiales dérivées de la télédétection disponibles dans le monde entier et les acteurs à l'échelle de la ville, une lacune que Pan et al.33 notent dans les ensembles de données sur le CO2 des combustibles fossiles comme l'inventaire ODIAC, qui distribue principalement les émissions nationales de CO2 des combustibles fossiles. spatialement basées sur des mesures satellitaires de l'intensité lumineuse, et qui peuvent ne pas attribuer correctement les émissions aux acteurs infranationaux. Enfin, davantage de recherches évaluant en profondeur les politiques d'atténuation que différents groupes de villes adoptent pour obtenir des réductions d'émissions et des résultats d'atténuation sont nécessaires pour éclairer la planification urbaine et l'élaboration future de politiques climatiques est nécessaire.

Cette étude n'est certainement pas sans limites. Il existe quelques zones d'incertitude qui pourraient affecter la validité de nos prévisions et de nos résultats. Tout d'abord, nous supposons que les inventaires d'émissions autodéclarés des acteurs de l'EUCoM sont une source valide de données pour former notre modèle et prédire les émissions des autres. Nous avons utilisé l'ensemble de données « vérifié » des données d'émissions autodéclarées pour 6 200 villes qui avaient déclaré des données d'inventaire des émissions évaluées par le Centre commun de recherche de la Commission européenne34. Bien que Kona et al.34 aient appliqué une série de vérifications statistiques pour valider ces inventaires d'émissions déclarés, ils notent plusieurs limites. Étant donné que l'EUCoM se concentre sur les émissions de gaz à effet de serre liées aux secteurs sur lesquels une autorité locale a le pouvoir d'influencer par le biais de mesures sectorielles et politiques, les villes participantes ne déclarent que les émissions provenant de sources sélectionnées (par exemple, la consommation d'énergie pour les bâtiments, les transports et la production d'énergie locale, les sources industrielles non encore couvertes par le système d'échange de quotas d'émission de l'UE, et les déchets/eaux usées35. émissions déjà incluses dans les initiatives de contrôle à l'échelle nationale, telles que les mécanismes du système d'échange de quotas d'émission (ETS) de l'UE." Par conséquent, une deuxième limitation est qu'il existe des sources et des secteurs d'émissions qui pourraient manquer dans les inventaires des villes de l'EUCoM, en particulier si une ville ne n'ont pas la capacité de mesurer ces émissions ou considèrent que certaines sources d'émissions n'ont pas d'importance matérielle à des fins de gestion. Troisièmement, l'utilisation par les villes de différents facteurs d'émissions, de méthodologies d'estimation et de limites de déclaration ajoute de l'incertitude à l'utilisation de leurs inventaires comme données de formation, et nous avons constaté que certaines « valeurs aberrantes » de prédiction pourraient être attribuées au fait que l'autodéclaration initiale les données sur les émissions pourraient être le résultat d'erreurs de calcul ou de déclaration par la ville elle-même23. Rivas et al.23 notent cette limitation, en particulier en ce qui concerne les données parfois rapportées avec des facteurs d'émissions manquants, qui doivent ensuite être remplis avec des facteurs nationaux ou régionaux et pourraient affecter la précision de l'estimation finale23. Quatrièmement, nous supposons que les limites spatiales de l'EUCoM et des villes externes restent statiques au cours de la période, alors qu'elles peuvent avoir changé au fil du temps. Si les limites ont changé ou sont incorrectement identifiées ou associées à une ville, leurs prédictions pourraient être inexactes. Cinquièmement, bien que nous ayons observé des différences significatives entre les émissions des différentes villes, il peut y avoir des différences fondamentales entre ces groupes de villes qui expliqueraient les performances d'atténuation que notre modèle est incapable de démêler (par exemple, si les villes déclarantes de l'EUCoM sont fondamentalement différentes des villes non -villes déclarantes ou non participantes en termes de géographie, de culture ou de gouvernement qui détermineraient leurs tendances en matière d'émissions).

Enfin, il existe des limites aux approches basées sur l'apprentissage automatique pour la prédiction, qui ont été identifiées et classées par Kapoor et Narayanan36. Étant donné que les approches d'apprentissage automatique sont intrinsèquement stochastiques37, l'introduction du caractère aléatoire pour améliorer la généralisabilité du modèle, qui est considérée comme un avantage des approches ML par rapport aux méthodes de régression gaussienne traditionnelles, met en péril la reproductibilité potentielle d'un modèle36. Nos estimations ne représentent donc qu'un niveau d'émissions médian amorcé probable en utilisant les paramètres spécifiques réglés sur le sous-échantillon d'apprentissage et définis à une graine ou une initialisation particulière par l'environnement informatique. En particulier, nos prédictions des LAU qui ne rapportent aucune donnée sur les émissions doivent être interprétées avec la principale mise en garde que nous supposons que les relations entre les prédictions sous-jacentes que notre modèle a découvertes pour les villes qui déclarent des données sur les émissions sont valables pour ces autres villes. Nous reconnaissons, cependant, qu'il s'agit d'une mise en garde majeure à nos résultats, mais que l'objectif principal de notre étude est d'explorer les forces et les limites potentielles d'une approche ML pour développer un modèle de prédiction généralisable pour les émissions au niveau de la ville qui pourrait être appliqué en dehors de l'Europe, compte tenu des données supplémentaires sur les émissions des villes non européennes.

Malgré ces limites, cette recherche est un premier pas vers la résolution du « manque de connaissances systématiques sur les contributions globales des villes à l'Accord de Paris »25, qui reconnaît le rôle de « tous les niveaux de gouvernement »38 et recherche des informations spécifiques concernant leurs impacts39. Peu d'acteurs urbains participant à des initiatives climatiques transnationales rapportent des données de surveillance et d'inventaire, et même les grandes villes revendiquant le leadership climatique mondial sont absentes des rapports9,10,25,40. Notre étude fournit une approche cohérente et des données de séries chronologiques pour étudier les tendances et les performances d'atténuation à l'échelle de la ville, avec un potentiel d'élargissement de la portée à des zones en dehors de l'Europe.

Des données comparables et généralisées sur les émissions sont essentielles pour soutenir le mode "facilitateur et catalytique" de l'Accord de Paris41 et son mécanisme "engagement et examen et cliquet" conçu pour évaluer en permanence les progrès et les contributions des acteurs nationaux et infranationaux aux efforts mondiaux d'atténuation42. Pour que des cycles vertueux et catalytiques soutenant ce processus se produisent, des données sur les émissions sont nécessaires pour évaluer quelles actions sont efficaces pour stimuler l'atténuation et quelles entités parviennent à des réductions.

Les données des villes participant à l'EUCoM ont été collectées à partir de deux sources : Kona et al.34, qui fournit une "version vérifiée et harmonisée" des données de l'EUCoM pour 6200 villes membres à la fin de 2019, et le site Web de l'EUCoM lui-même. L'ensemble de données de Kona et al.34 pour les villes de l'EUCoM comprend des données d'émissions autodéclarées (par exemple, des inventaires d'émissions de référence ou de surveillance), ainsi que d'autres données caractéristiques des villes de l'Agence statistique européenne. Nous avons complété cet ensemble de données avec des données plus récentes pour les villes du site Web de l'EUCoM, qui ont été extraites à l'aide du package Beautiful Soup Python43 en février 2021. Nous avons principalement collecté des informations sur la date d'adhésion de chaque ville à l'initiative EUCoM, l'année d'émissions de référence, les émissions de référence ( en tonnes d'émissions de dioxyde de carbone ou tCO2), l'objectif de réduction des émissions, l'année cible et toutes les émissions d'inventaire déclarées (c'est-à-dire les données d'émissions déclarées une année ultérieure à une année de référence définie, à partir de la page Progress de chaque ville). Nous avons également extrait des informations concernant la population des villes et les coordonnées géographiques (latitude/longitude) du site Web de l'EUCoM, le cas échéant. Étant donné que Kona et al.34 appliquent une série de techniques statistiques pour valider leur ensemble de données, nous avons donné la priorité aux données d'émissions autodéclarées de cette source s'il y avait des données disponibles pour une ville à la fois dans Kona et al.34 et sur le site Web de l'EUCoM. La Fig. 1 supplémentaire montre un nuage de points des données enregistrées sur les émissions du site Web de l'EUCoM et de Kona et al.34, qui illustre une forte corrélation (r2 = 0,986). Au total, notre ensemble de données contenait les noms de 7805 villes participant à l'initiative EUCoM, dont 6114 rapportant des informations sur les émissions. Nous avons également imputé un objectif de réduction des émissions de 20 % d'ici 2020 si aucun objectif spécifique de réduction des émissions n'a été signalé dans Kona et al.34 ou sur le site Web de l'EUCoM aux fins de l'analyse de suivi des progrès décrite dans notre étude précédente10.

Une première étape importante dans la construction de notre modèle prédictif d'émissions a consisté à déterminer un ensemble de prédicteurs sous-jacents des émissions de carbone au niveau de la ville qui seraient universellement disponibles pour toutes les villes EUCoM et les LAU en Europe. Nous avons évalué plusieurs prédicteurs d'émissions urbaines de gaz à effet de serre à inclure comme prédicteurs dans notre modèle, sur la base de la littérature existante concernant les principales sources et moteurs des profils d'émissions des villes6,44,45,46. En termes de sources d'émissions, le secteur de l'énergie, en particulier la conversion de l'énergie en électricité, est la plus grande source d'émissions urbaines de gaz à effet de serre, représentant environ la moitié à 65 % des émissions urbaines totales, suivi du secteur des transports (15 à 20 %) 44. Étant donné que les sources fixes n'expliquent pas les émissions de gaz à effet de serre des villes dans leur intégralité, nous avons également étudié d'autres variables indirectes pour les principales sources d'émissions, y compris la demande de chauffage et de refroidissement, et les variables de pollution de l'air telles que la pollution atmosphérique par les particules fines, qui dans les villes résulte principalement du transport (~ 25%47), poussières et oxydes de soufre (SO2, SO4). Nous avons également inclus la population et le produit intérieur brut (PIB) en tant que facteurs socio-économiques pertinents des émissions climatiques urbaines6, et évalué quelques prédicteurs au niveau des pays, sur la base de notre étude précédente10 qui a révélé que les réductions des émissions au niveau national étaient des prédicteurs de la performance au niveau des villes en matière de changement climatique. , y compris la tendance des émissions de CO2 au niveau national (2000-2018)17 et l'intensité carbone de la production d'électricité pour l'Union européenne48.

Étant donné que les données à haute résolution sur les émissions résultant de la production et de la consommation d'électricité ne sont pas disponibles pour la grande majorité des villes incluses dans notre analyse, nous nous sommes appuyés sur la base de données Open-Data Inventory for Anthropogenic Carbon Dioxide (ODIAC), qui fournit une grille mondiale , données annuelles de résolution spatiale de 1 km × 1 km sur les émissions de dioxyde de carbone provenant de la combustion de combustibles fossiles, de la production de ciment et du torchage du gaz de 2000 à 201949. Nous avons sélectionné l'ensemble de données ODIAC sur la base d'une évaluation préalable de sa pertinence pour l'analyse des émissions de carbone au niveau urbain, comme décrit dans Hsu et al.10.

En tant qu'indicateurs de la consommation d'énergie des bâtiments due au chauffage et au refroidissement, nous avons téléchargé des données mensuelles moyennes (0,5 × 0,625 degré ou 55,5 × 69,375 km) sur la température de la surface terrestre à partir du produit de température MERRA-2 de la NASA50, puis nous avons calculé les degrés-jours de chauffage et de refroidissement. (HDD et CDD, respectivement) sur la base du nombre de mesures moyennes mensuelles qui s'écartent d'une température de référence, \({T}_{{base}}\), qui ont ensuite été multipliées en fonction du nombre de jours de chaque mois respectif (c'est-à-dire, en supposant le même disque dur ou CDD pour chaque jour du mois) puis additionné sur une année, selon les équations. (1–2) ci-dessous :

où \({T}_{{base}}=\)15,5 degrés C pour le disque dur et \({T}_{{base}}\)= 22 degrés C pour le CDD41 et \({m}\) est le mois. Pour le modèle de l'UE, nous avons exclu les degrés-jours de refroidissement puisque 99 % des villes européennes avaient 0 cdd.

Nous avons inclus des données sur la pollution de l'air extraites des ressources de télédétection par satellite. Nous avons inclus l'exposition annuelle quadrillée (~1 km) à la pollution par les particules fines (PM2,5) pour les années 2001 à 202051, puisque la pollution par les PM2,5 est générée à partir de sources similaires aux émissions de carbone dans les zones urbaines, principalement la combustion de combustibles fossiles à partir de l'électricité. production et transport52. Nous avons également extrait plusieurs variables pertinentes de pollution de l'air du capteur MERRA-2, y compris la concentration de masse de surface de poussière (DUSMASS), la concentration de masse de surface de noir de carbone (BCSMASS), la concentration de masse de surface de dioxyde de soufre (SO2SMASS) et la concentration de masse de surface de sulfate (SO4SMASS) .

Nous avons évalué quelques prédicteurs au niveau national, sur la base d'une étude précédente10 qui a révélé que les réductions d'émissions au niveau national étaient des prédicteurs de la performance du changement climatique au niveau de la ville, y compris la tendance des émissions de CO2 au niveau national (2000-2018)17 et l'intensité carbone de l'électricité- génération pour l'Union européenne53, bien que notre modèle final n'ait pas inclus ces variables, car elles ne contribuaient pas de manière significative à l'importance des caractéristiques pour notre modèle (Fig. 1b).

Nous avons en outre pris en compte la population et le produit intérieur brut (PIB) en tant que facteurs socio-économiques pertinents des émissions climatiques urbaines6. Pour la population, nous avons utilisé l'ensemble de données Gridded Population of the World (GPW)54, qui fournit des estimations de la population à une résolution spatiale de 1 km pour des incréments de cinq ans de 2000 à 2020. Nous avons calculé les estimations annuelles de la population en interpolant linéairement entre ces cinq années incréments. Pour le PIB, nous avons utilisé des données de PIB par habitant maillées annuellement à l'échelle mondiale à une résolution spatiale de 1 km de Kummu et al.55, qui fournissent des données de 1990 à 2015. Nous avons joint spatialement chaque LAU à sa Nomenclature des unités territoriales correspondantes pour les statistiques. ou NUTS (niveau 3), pour l'Union européenne son unité territoriale internationale, pour dériver un produit régional brut (PRB) de l'Agence statistique européenne56. Étant donné que les valeurs GRP NUTS3 sont légèrement plus larges qu'une LAU, nous avons utilisé le taux de variation annuel de 2016 à 2018 appliqué aux données du PIB de Kummu pour chaque LAU afin de faire correspondre les séries chronologiques des autres prédicteurs spatiaux.

Étant donné que le format original de ces variables prédictives (par exemple, les émissions de CO2 des combustibles fossiles) sont toutes des données spatiales maillées, nous avons fusionné ces ensembles de données pour chaque ville EUCoM par le biais de jointures spatiales. Nous avons d'abord recueilli la latitude et la longitude du centroïde de chaque ville telles que fournies par les différentes sources de données. Lorsque les centroïdes de la ville n'étaient pas disponibles auprès de Kona et al.34, site Web de la Convention des maires de l'UE, ou que nous déterminions des erreurs dans les coordonnées géographiques de l'une ou l'autre de ces sources, nous avons extrait les centroïdes de la ville via le site Web GeoHack de Wikipedia.

Pour déterminer les limites spatiales de chaque ville, nous avons utilisé des approches distinctes décrites ci-dessous. Pour la plupart des villes, nous avons collecté des données pour les unités administratives locales (LAU), qui sont définies comme des « divisions administratives de bas niveau d'un pays en dessous de celles d'une province, d'une région ou d'un État », pour les 28 pays de l'Union européenne de l'Union européenne. Agence statistique de l'Union57. Les données LAU ont été jointes spatialement à notre cadre de données de ville EUCoM en Python à l'aide du package geopandas58 pour associer chaque ville à une limite LAU afin de faire correspondre des variables prédictives supplémentaires. Nous avons mis en place une série de contrôles de qualité pour nous assurer que les jointures spatiales ont été effectuées correctement et pour identifier tout problème dans les coordonnées géographiques qui pourraient avoir été incorrectement spécifiés sur le site Web de l'EU Covenant. Ces contrôles de qualité incluent (1) évaluer si les villes ont les mêmes coordonnées géographiques mais sont identifiées avec des noms distincts ; (2) en comparant la population rapportée sur le site Web de Kona et al.34 ou de l'EUCoM pour un acteur individuel et la population interpolée après la jointure spatiale ; (3) examiner toute ville dont les émissions par habitant autodéclarées sont <0,2 tonne par personne ou >40 tonnes par personne ; (4) le taux de croissance annuel composé des émissions est >−50 % et <50 %. Ces vérifications nous ont permis de déterminer s'il y avait des erreurs dans la jointure spatiale ou les données sous-jacentes collectées pour les villes de l'EUCoM à partir de Kona et al.34 ou du site Web de l'EUCoM.

Lorsque les corrections manuelles des LAU n'ont pas non plus abouti à des jointures spatiales correctes, nous avons utilisé OpenStreet Map (OSM)59 pour obtenir la limite correcte, en particulier pour les grandes villes qui peuvent englober plus d'une LAU. La Fig. 2 supplémentaire illustre quelques exemples de résultats de jointure spatiale incorrects et de limites fixes avec OSM. Après avoir vérifié les limites des villes, nous avons ensuite appliqué des statistiques zonales à l'aide du package Python rasterstats version 0.15.060, où chaque variable prédictive a été résumée pour chaque ville à l'aide de sa limite spatiale. Sur la base de la définition des variables prédictives, nous avons calculé les valeurs moyennes, à l'exception de la population, où nous avons calculé la somme de tous les pixels qui se croisent avec chaque limite de ville ou de LAU.

Les villes participant à l'EUCoM sont tenues de soumettre un plan d'action pour l'énergie durable (et le climat) (SE(C)AP) qui comprend un inventaire de référence des émissions et un inventaire de suivi tous les deux ans par la suite. Pourtant, au moment de la collecte des données collecte en février 2021, sur près de 10 000 signataires répertoriés sur le site, seuls 6114 acteurs avaient déclaré des données d'émissions et seuls 1400 avaient déclaré plus d'un an de données de surveillance des émissions. Nous n'avons inclus que les données des villes avec une population interpolée supérieure inférieur au 5e centile (374 habitants) de la répartition de la population des villes. Au total, 329 villes avaient des populations inférieures à ce seuil et n'ont pas été incluses dans les ensembles de données d'entraînement ou de prédiction. Conformément à Hsu et al. (2020), nous avons également filtré les points de données qui ont déclaré <0,2 tonnes de CO2 par personne ou >40 tonnes de CO2 par personne. La période pour les données sur les émissions autodéclarées allait de 1990 à 2020, mais nous n'avons utilisé que des données > 2 000 (5 880 acteurs uniques avec 6 961 points de données sur les émissions) pour l'entraînement du modèle puisqu'il s'agit de la période de temps disponible pour les variables prédictives.

Nous avons ensuite divisé nos données en trois sous-ensembles : le premier sous-ensemble utilisé comme données de formation comprend toutes les villes de l'EUCoM qui ont au moins une année de données sur les émissions déclarées, qu'il s'agisse de leurs émissions de référence ou d'une année d'inventaire ultérieure des données déclarées (EUCoM, 2021) ; un deuxième sous-ensemble comprend les villes participant à l'EUCoM mais n'ayant communiqué aucune donnée sur les émissions ; le troisième sous-ensemble comprend les villes ne participant pas à l'EUCoM. Le premier sous-ensemble de données sur les émissions déclarées à l'EUCoM est utilisé comme données d'entraînement pour prédire les émissions des deux derniers sous-ensembles de données. Nous avons appliqué le modèle construit avec le premier ensemble de données à ces villes et prédit leur émission probable d'une année donnée. La figure 3 supplémentaire fournit un organigramme des étapes de traitement décrites ci-dessus. Nos ensembles de données de formation et de test ont été générés sur la base d'une répartition standard 80/20 des données tout en préservant la représentation sous-jacente des pays (c'est-à-dire qu'un peu plus de la moitié des données de formation disponibles proviennent de villes d'Italie (52 %), suivies de l'Espagne (26 %).

Nous avons évalué plusieurs modèles de régression, notamment la régression multilinéaire, la forêt aléatoire, le SVM et l'amplification de gradient extrême (XGBoost). Le modèle multilinéaire provient de la bibliothèque de base R ; la forêt aléatoire et la SVM proviennent du package R caret version 6.0-8661 ; et XGBoost du package XGBoost R version 1.3.2.162. Nous avons choisi l'erreur quadratique moyenne (RMSE) et r2 comme matrice de comparaison de modèles pour examiner les performances de chaque modèle sur les ensembles de données d'apprentissage et de test. Pour les modèles de forêt aléatoire, SVM et XGBoost qui sont contrôlés par un ensemble d'hyperparamètres, nous avons appliqué une recherche de grille avec une validation croisée quintuple aux modèles pour obtenir les meilleurs paramètres qui se traduisent par le RMSE le plus bas. Le tableau supplémentaire 6 montre les hyperparamètres que nous avons utilisés dans ces trois modèles. Les valeurs manquantes dans les variables indépendantes sont un problème courant dans les modèles basés sur ML, et les modèles que nous avons évalués gèrent les valeurs manquantes de différentes manières. Le modèle XGBoost est capable de gérer les valeurs manquantes sans aucune imputation. Par conséquent, après avoir formé un modèle XGboost avec des données complètes dans toutes les variables indépendantes (appelées XGBoost-w/o NA), nous avons également formé le modèle XGBoost avec les données pouvant avoir des valeurs NA dans les variables indépendantes (appelées XGBoost-w /-NA dans les sections suivantes. Notez que toutes les valeurs NA sont supprimées après avoir divisé les données en ensembles d'entraînement et de test, de sorte que tous les ensembles de données d'entraînement et de test sont exactement les mêmes pour les modèles autres que XGBoost-w/NA. Le tableau supplémentaire 6 montre le train et le test RMSE et r2 des modèles les mieux réglés.La forêt aléatoire et le modèle XGBoost sont des modèles de régression basés sur des arbres, et nos résultats suggèrent que les modèles basés sur des arbres fonctionnent mieux que les autres modèles pour notre ensemble de données (tableau supplémentaire 6). De plus, le modèle XGBoost-w/NA est formé avec 357 points de données supplémentaires avec des valeurs NA dans les variables indépendantes et atteint : RMSE = 155865,63 et r2 = 0,90.

Sur la base des résultats de la formation du modèle et de la capacité à gérer les valeurs manquantes, nous avons décidé de procéder avec XGBoost. XGBoost signifie "amplification de gradient extrême" et a gagné en popularité en raison de ses hautes performances dans les compétitions d'apprentissage automatique telles que Kaggle63. Les modèles d'amplification de gradient comme XGBoost effectuent des tâches de régression supervisées grâce à une approche itérative pour prédire une variable cible (c'est-à-dire les émissions), optimisant les performances prédictives en combinant plusieurs arbres "faibles" pour s'adapter à de nouveaux modèles qui sont des prédicteurs plus précis d'une variable de réponse64,65. L'un des avantages des modèles d'apprentissage automatique à gradient tels que XGBoost est qu'ils sont robustes aux problèmes qui préoccupent les techniques typiques basées sur la régression, y compris les problèmes de multicolinéarité66,67. Un arbre de décision se compose de divisions - des sélections itératives de caractéristiques qui séparent les données en deux groupes, puis déterminent quelle est la «division» optimale sur une caractéristique en fonction du score. Si deux caractéristiques ou variables sont corrélées, une seule sera sélectionnée et l'algorithme n'utilisera pas les informations de la caractéristique corrélée puisqu'elle a déjà été capturée par la première. Le modèle d'amplification de gradient XGBoost a été largement utilisé dans la surveillance de la qualité de l'air65,68,69 et l'estimation des émissions de gaz à effet de serre (GES)70 pour sa grande efficacité, sa flexibilité et sa portabilité. Si et Du65 notent en outre des avantages supplémentaires de XGBoost, qui nécessite moins de prétraitement des données et a moins d'hyperparamètres, paramètres qu'un modèle ML utilise pour contrôler le processus d'apprentissage pour le réglage71.

Nous avons utilisé l'élimination récursive des caractéristiques (RFE)72, une technique d'apprentissage automatique qui aide à la sélection des caractéristiques pour identifier les caractéristiques optimales pour un problème de prédiction ou de classification en éliminant les caractéristiques « les plus faibles » dans un ensemble de données73. Bien que les approches RFE puissent être plus pertinentes pour les ensembles de données qui incluent plusieurs dizaines ou centaines de variables, nous avons implémenté RFE en utilisant le package FeatureTerminatoR74 dans R, qui suggérait l'inclusion des degrés-jours de chauffage, des émissions de CO2 des combustibles fossiles (odiac), de la pollution par les particules fines ( pm25), pib par habitant, population, densité de population, latitude, longitude, concentration de la masse de poussière et année d'émissions. Nous avons évalué des spécifications de modèle alternatives qui incluaient des variables supplémentaires collectées (par exemple, les concentrations d'émissions de dioxyde de soufre), mais leur inclusion n'a pas amélioré de manière significative la précision de la prédiction de notre modèle et nous nous sommes trompés sur la parcimonie du modèle dans notre spécification de modèle finale75 (Fig. 5 supplémentaire et Supplémentaire). Tableau 7).

Notre implémentation de XGBoost est déterminée par un ensemble d'hyperparamètres, qui sont des paramètres que le modèle d'apprentissage automatique utilise pour contrôler le processus d'apprentissage71. Ceux-ci comprenaient la profondeur maximale de l'arbre, le taux d'apprentissage, la somme minimale de poids dans un nœud, la réduction minimale des pertes et le pourcentage de lignes à utiliser dans chaque arbre qui sont les hyperparamètres standard inclus dans l'implémentation de XGBoost dans R76. Pour obtenir les meilleurs hyperparamètres définis pour le modèle et évaluer les performances du modèle, nous avons d'abord divisé notre ensemble de données avec un échantillonnage divisé 80/20 entre les pays, ce qui signifie que nous avons utilisé 80 % des données comme données d'apprentissage pour prédire les 20 % restants. jeu de données65. Nous avons ensuite effectué une recherche de grille (tableau supplémentaire 4) sur les hyperparamètres avec une validation croisée quintuple pour déterminer le modèle avec l'erreur quadratique moyenne la plus faible. Le tableau supplémentaire 4 montre les plages d'hyperparamètres et les valeurs optimisées. Suite à la recherche de grille d'hyperparamètres, nous avons formé le modèle avec l'ensemble de données d'entraînement avec le meilleur résultat de la recherche de grille d'hyperparamètres. Nous avons ensuite testé la précision du modèle à l'aide des données de test.

Le modèle final a été construit avec l'ensemble de paramètres optimal à partir de la recherche de grille, qui est le processus de construction de modèles avec toutes les combinaisons de paramètres possibles et de recherche du meilleur ensemble de paramètres avec lequel le modèle fonctionne le mieux sur des échantillons d'apprentissage. Comme le décrit le tableau supplémentaire 4, le résultat optimal pour le modèle est atteint lorsque la profondeur maximale = 13, le poids minimal de l'enfant = 1, eta (taux d'apprentissage) = 0,5, gamma = 1, et entraîne le modèle avec 40 tours, ce qui a atteint une moyenne erreur absolue en pourcentage entre la formation et les valeurs prédites de 8 %, et r2 = 0,88 pour les données de test. Voir la Fig. 4 supplémentaire pour les diagrammes de dispersion des performances du modèle. Le tableau supplémentaire 7 montre les résultats de quelques spécifications de modèles alternatives sélectionnées qui ont été évaluées mais qui n'ont finalement pas été sélectionnées pour les prévisions des autres années et de toutes les autres LAU. La Fig. 4 supplémentaire montre des diagrammes de dispersion des émissions autodéclarées et prévues pour les ensembles de données de formation et de test. Nous avons utilisé la fonction intégrée xgb.importance du package XGBoost R pour déterminer l'importance des caractéristiques du modèle final (c'est-à-dire quels prédicteurs ont le plus grand pouvoir prédictif ou explicatif)76.

Après avoir construit le modèle final avec des paramètres et une évaluation optimaux, nous avons appliqué notre modèle à (1) les villes EUCoM qui ne déclarent pas les émissions (c'est-à-dire les villes participantes) ; et (2) toutes les LAU externes en Europe qui ne participent pas à l'EUCoM. Nous avons amorcé 1 000 intervalles d'émissions prévues pour chaque année pour chaque acteur afin de garantir des estimations médianes robustes. En plus des paramètres optimaux de la grille de recherche, nous avons utilisé le paramètre "sous-échantillon" pour introduire un caractère aléatoire dans le modèle. Ce paramètre détermine le pourcentage de lignes de notre ensemble de données à utiliser dans chaque arbre. Nous avons défini cette valeur sur 0,90 et, ainsi, le modèle est construit avec 90 % de l'ensemble de données total. Nous avons ensuite calculé le 5e centile, le 95e centile, la valeur moyenne et la valeur médiane pour chaque estimation des émissions prévues pour chaque acteur et chaque année.

Nous avons calculé plusieurs mesures de performance (par exemple, la tendance linéaire des émissions prévues entre 2001 et 2018, la variation annuelle en pourcentage des émissions et le pourcentage annualisé de réduction des émissions par habitant) en utilisant les données d'émissions prévues pour chaque acteur et les avons évaluées avant d'utiliser le pourcentage annualisé de réduction. en émissions par habitant (tendance des émissions annuelles par habitant) comme principal paramètre d'évaluation, conformément à Hsu et al.10, comme décrit dans l'équation. 3.

Conformément à Hsu et al.10, nous avons déterminé si une ville est « sur la bonne voie » pour atteindre son objectif de réduction des émissions déclaré ou non, nous avons calculé le rapport entre la réduction réelle (c.-à-d. atteinte) des émissions par habitant au cours de l'année d'inventaire et la réduction ciblée. réduction des émissions par habitant au cours de l'année d'inventaire, à la fois par rapport à l'année de référence, en supposant que la réduction des émissions entre l'année de référence et l'année cible est calculée au prorata linéairement (c'est-à-dire une réduction constante des émissions d'une année à l'autre). Plus précisément, nous définissons \(\rho\) à travers les équations suivantes. (4–7) :

où:

\({{Predemissions}}_{\min ({year})}\) correspond aux émissions prévues par habitant de la ville au cours de l'année minimale pour laquelle des données prédictives sont disponibles. Pour la plupart des villes, c'était l'année 2001;

\({{Predemissions}}_{\max ({year})}\) correspond aux émissions prévues par habitant de la ville au cours de l'année maximale pour laquelle des données prédictives sont disponibles. Pour la plupart des villes, c'était l'année 2018;

où:

\({{Year}}_{\min }\) est l'année minimale pour laquelle les données d'émissions prévues sont disponibles

\({{Année}}_{\max }\) est l'année maximale pour laquelle les émissions prévues sont disponibles

\({{Année}}_{{cible}}\) est l'année à laquelle les réductions d'émissions engagées doivent être atteintes

où:

\({Target}\) est la réduction d'émissions engagée de la ville (pourcentage).

Pour déterminer si la participation à l'EUCoM est associée à une modification des émissions d'une ville, nous avons utilisé une approche de modélisation de séries temporelles interrompues (ITS)20 pour comparer les tendances des émissions annuelles par habitant des villes de l'EUCoM avant et après leur année d'adhésion. Les conceptions STI évaluent un résultat pour un échantillon de population exposé à une intervention avant et après, en utilisant des observations répétées à intervalles réguliers19,77. Bien qu'il existe une forte validité interne d'une conception ITS, il existe des limites en termes de validité externe faible potentielle dans la mesure où les résultats peuvent ne pas être généralisables à d'autres groupes en raison du fait que ITS ne peut pas exclure la possibilité de facteurs non mesurables ou incontrôlés conduisant à un changement dans la variable de résultat.

Nous estimons les variations annuelles en pourcentage des réductions d'émissions par habitant (\({pct}.{chg}\)) de 2001 à 2018 pour chaque ville (\(i\)) du pays (\(c\)) pour chaque année ( \(t\)) avec l'équation suivante. (8):

où \({Time}\) est une variable qui indique le nombre d'années écoulées depuis qu'une ville a adhéré à l'initiative EUCoM ; \({Joined}\) est une variable fictive qui indique si l'observation se réfère à avant (0) ou après (1) la ville adhérant ; \({TSJ}\) est le temps écoulé depuis qu'une ville a rejoint l'EUCoM en années. Nous contrôlons également les différences entre la densité de population des villes, le PIB par habitant, les émissions par habitant prévues par notre modèle d'apprentissage automatique, l'objectif de réduction en pourcentage pour 2020 et si la ville a adopté un plan d'atténuation ou effectué un inventaire des émissions. Nous incluons également des indicatrices de pays (\({\gamma }_{C}\)) pour contrôler les facteurs non observés et invariants dans le temps communs aux villes d'un pays et des effets fixes annuels (δt) pour contrôler les caractéristiques exogènes qui peuvent influencer les émissions dans une année donnée.

Le grattage des données et le traitement des données géospatiales ont été effectués à l'aide de python (version 3.68), du package Beautiful Soup (version 4.8.2), de geopandas (version 0.9.0), de la version rasterio (1.0.21) et de rasterstats (version 0.15.0) et l'environnement de programmation statistique R (version 3.6.2). Le modèle d'apprentissage automatique a été développé et réalisé en R à l'aide du package XGBoost (version 1.6.0.1)76. Les figures ont été réalisées à l'aide du package de visualisation de données ggplot278 (version 3.3.6) et les cartes ont été réalisées dans QGIS (version 3.16).

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données générées dans cette étude ont été déposées dans le référentiel Data-Driven EnviroLab Dataverse (https://doi.org/10.15139/S3/NRJ5ZO). Les données brutes collectées, traitées et utilisées pour cette étude comprennent : la base de données Open-Data Inventory for Anthropogenic Carbon Dioxide (ODIAC) (https://doi.org/10.17595/20170411.001) ; Produit de température mensuel MERRA-2 de la NASA (https://doi.org/10.5067/KVIMOMCUO83U) ; NASA MERRA-2 masse volumique moyenne mensuelle des composants des aérosols (noir de carbone, poussière, sel marin, sulfate et carbone organique), concentration massique en surface des composants des aérosols (https://doi.org/10.5067/FH9A0MLJPC7N) ; PM2,5 de surface du Groupe d'analyse et de composition atmosphérique de l'Université de Washington à St. Louis (https://doi.org/10.1021/acs.est.1c05309) ; Ensemble de données Gridded Population of the World54 (https://doi.org/10.7927/H4F47M2C) Données maillées mondiales sur le produit intérieur brut (PIB) de Kummu et al.55 (https://doi.org/10.1038/sdata.2018.4) ; Produit intérieur brut (PIB) d'Eurostat aux prix courants du marché par région NUTS 2 (http://data.europa.eu/88u/dataset/egT31kJF7IArVLXu1rTkQ); Kona et al.34 Global Covenant of Mayors, un ensemble de données sur les émissions de gaz à effet de serre de 6200 villes d'Europe et des pays du sud de la Méditerranée (https://doi.org/10.5194/essd-13-3551-2021) ; d'autres données pour les villes de la Convention des maires de l'UE ont été collectées à partir de (https://www.covenantofmayors.eu/) ; Unités administratives locales de la base de données d'Eurostat56 (https://ec.europa.eu/eurostat/web/nuts/local-administrative-units) ; les limites administratives des villes d'OpenStreetMap (https://planet.openstreetmap.org); les centroïdes des villes ont été extraits via le site Web GeoHack de Wikipedia (https://www.mediawiki.org/wiki/GeoHack).

Le code utilisé pour cette étude est disponible sur la page Data-Driven EnviroLab GitHub (www.github.com/datadrivenvirolab/citiesML) ou sur demande raisonnable de l'auteur correspondant.

Hsu, A. et al. ClimActor, données transnationales harmonisées sur la participation des gouvernements municipaux et régionaux au réseau climatique. Sci. Données 7, 1–8 (2020).

Article Google Scholar

Reckien, D. et al. Comment les villes envisagent-elles de réagir au changement climatique ? Évaluation des plans climat locaux de 885 villes de l'UE-28. J. Propre. Prod. 191, 207–219 (2018).

Hsu, A. & Rauber, R. Divers acteurs climatiques montrent une coordination limitée dans une analyse textuelle à grande échelle des documents de stratégie. Commun. Terre Environ. 2, 1–12 (2021).

Article Google Scholar

Hsu, A., Cheng, Y., Weinfurter, A., Xu, K. & Yick, C. Suivre les engagements climatiques des villes et des entreprises. Nature 532, 303–305 (2016).

Milojevic-Dupont, N. & Creutzig, F. Apprentissage automatique pour l'atténuation géographiquement différenciée du changement climatique dans les zones urbaines. Soutenir. Soc. 64, 102526 (2021).

Article Google Scholar

Groupe d'experts intergouvernemental sur l'évolution du climat et Groupe d'experts intergouvernemental sur l'évolution du climat. Établissements humains, infrastructure et aménagement du territoire. dans Changement climatique 2014 Atténuation du changement climatique (2015).

Stehle, F., Hickmann, T., Lederer, M. & Höhne, C. Politique climatique urbaine dans les économies émergentes : une perspective de gouvernance à plusieurs niveaux. (2020).

Boehnke, R., Hoppe, T., Brezet, H. & Blok, K. Bonnes pratiques dans l'action locale d'atténuation du climat par les petites et moyennes villes ; explorer le sens, la mise en œuvre et le lien avec la réduction réelle des émissions de carbone dans treize municipalités aux Pays-Bas. J. Propre. Prod. 207, 630–644 (2019).

Domorenok, E., Acconcia, G., Bendlin, L. & Campillo, XR Experiments in EU Climate Governance: The Unfulfilled Potential of the Covenant of Mayors. Glob. Environ. Politique. 20, 122–142 (2020).

Article Google Scholar

Hsu, A. et al. Les déterminants de la performance montrent que les villes européennes obtiennent des résultats en matière d'atténuation du changement climatique. Nat. Clim. Chang. 10, 1015-1022 (2020).

Ibrahim, N., Sugar, L., Hoornweg, D. & Kennedy, C. Émissions de gaz à effet de serre des villes : comparaison des cadres d'inventaire internationaux. Environ local. 17 (2012).

Rolnick, D. et al. Lutter contre le changement climatique avec l'apprentissage automatique. ACM Computing Surveys (CSUR), 55, 1–96 (2022).

Oda, T. et al. Erreurs et incertitudes dans un inventaire maillé des émissions de dioxyde de carbone. Mitig. Adapter. Stratég. Glob. Chang. 24, 1007-1050 (2019).

Article Google Scholar

Raupach, MR, Rayner, PJ & Paget, M. Variations régionales de la structure spatiale des veilleuses, de la densité de population et des émissions de CO2 des combustibles fossiles. Politique énergétique 38, 4756–4764 (2010).

Article Google Scholar

Moran, D. et al. Estimation des émissions de CO2 pour 108 000 villes européennes. Terre Syst. Sci. Données 14, 845–864 (2022).

Annonces d'article Google Scholar

Nangini, C. et al. Un ensemble de données mondial sur les émissions de CO2 et des données auxiliaires liées aux émissions pour 343 villes. Sci. Données 6, 180280 (2019).

Institut des ressources mondiales (WRI). Veille climat 2020. (2020).

Salvia, M. et al. Les ambitions d'atténuation climatique mèneront-elles à la neutralité carbone ? Une analyse des plans locaux de 327 villes de l'UE. Renouveler. Soutenir. Énergie Rev. 135, 110253 (2021).

Article Google Scholar

Bernal, JL, Cummins, S. & Gasparrini, A. L'utilisation de contrôles dans les études de séries chronologiques interrompues d'interventions de santé publique. Int. J. Épidémiol. 47, 2082-2093 (2018).

Article Google Scholar

Shadish, WR, Cook, TD & Campbell, DT Plans expérimentaux et quasi-expérimentaux pour l'inférence causale généralisée. (2002).

van der Heijden, J. Étudier la gouvernance climatique urbaine : par où commencer, quoi rechercher et comment apporter une contribution significative à la recherche et à la pratique. Terre Syst. Gov. 1, 100005 (2019).

Article Google Scholar

Gordon, DJ & Johnson, CA City-networks, la gouvernance climatique mondiale et la route vers 1,5 °C. Courant. Avis. Environ. Durabilité 30, 35–41 (2018).

Article Google Scholar

Rivas, S., Urraca, R., Palermo, V. & Bertoldi, P. Convention des maires 2020 : Moteurs et obstacles au suivi des plans d'action pour le climat. J. Propre. Prod. 332, 130029 (2022).

Article Google Scholar

Kona, A. et al. Convention des maires : Réalisations et projections des émissions de gaz à effet de serre. publications.jrc.ec.europe.eu (2016).

Boehnke, RF, Hoppe, T., Brezet, H. & Blok, K. Bonnes pratiques dans l'action locale d'atténuation du climat par les petites et moyennes villes ; explorer le sens, la mise en œuvre et le lien avec la réduction réelle des émissions de carbone dans treize municipalités aux Pays-Bas. J. Propre. Prod. 207, 630–644 (2019).

Article Google Scholar

Aldy, JE Le rôle crucial de la surveillance des politiques dans la politique climatique internationale. Clim. Modification 126, 279–292 (2014).

Annonces d'article Google Scholar

Bulkeley, H. Les villes peuvent-elles réaliser leur potentiel climatique ? Réflexions sur la COP21 Paris et au-delà. Environ local. 20, 1405–1409 (2015).

Article Google Scholar

Hale, TN et al. Action climatique infra-étatique et non-étatique : un cadre pour évaluer les progrès, la mise en œuvre et l'impact. Clim. Politique 21, 406–420 (2021).

Article Google Scholar

Bulkeley, H. et al. Gouverner le changement climatique à l'échelle transnationale : évaluer les preuves à partir d'une base de données de soixante initiatives. Environ. Plan. C. Politique gouvernementale 30, 591–612 (2012).

Article Google Scholar

Chan, S., Falkner, R., Goldberg, M. & van Asselt, H. Université d'Easte. Efficace et géographiquement équilibré ? Une évaluation basée sur les résultats des actions climatiques non étatiques. Taylor Fr. 18, 24–35 (2018).

Kuramochi, T. et al. Au-delà de l'action climatique nationale : l'impact des engagements des régions, des villes et des entreprises sur les émissions mondiales de gaz à effet de serre. 20, 275-291 (2020).

Ogle, SM et al. Faire progresser les inventaires nationaux des gaz à effet de serre pour l'agriculture dans les pays en développement : améliorer les données sur les activités, les facteurs d'émission et la technologie logicielle. Environ. Rés. Lett. 8, 015030 (2013).

Pan, G., Xu, Y. & Ma, J. Le potentiel de la surveillance par satellite du CO2 pour la gouvernance climatique : un examen. J. Environ. Géré. 277, 111423 (2021).

Article CAS Google Scholar

Kona, A. et al. Global Covenant of Mayors, un ensemble de données sur les émissions de gaz à effet de serre pour 6200 villes d'Europe et des pays du sud de la Méditerranée. Terre Syst. Sci. Données 13, 3551–3564 (2021).

Annonces d'article Google Scholar

Convention des maires de l'UE. Lignes directrices de la Convention des maires pour les rapports sur le climat et l'énergie. https://www.covenantofmayors.eu/IMG/pdf/Covenant_ReportingGuidelines.pdf (2016).

Kapoor, S. & Narayanan, A. Les fuites et la crise de reproductibilité dans la science basée sur le ML. Préimpression sur https://arxiv.org/abs/2207.07048 (2022).

Sabuncu, MR L'intelligence joue aux dés : la stochasticité est essentielle pour l'apprentissage automatique. https://doi.org/10.48550/arxiv.2008.07496 (2020).

CCNUCC. Accord de Paris, Convention-cadre des Nations Unies sur les changements climatiques. 21e Conférence des Parties (2015) FCCC/CP/2015/L.9.

CCNUCC. Document non officiel révisé pour les consultations d'information - préparation du premier Bilan mondial. https://unfccc.int/topics/global-stocktake/inputs. (2021).

Brooks, S. Non, les villes ne sont pas réellement à l'avant-garde en matière de climat. Assez avec le Mindless Cheerleading. Green Tech Media https://www.greentechmedia.com/articles/read/hard-truths-about-city-failures-with-clean-energy (2017).

Hale, T. "Tous sur le pont": L'accord de Paris et l'action climatique non étatique. Glob. Environ. Politique. 16, 12-22 (2016).

Article Google Scholar

Hale, T. Coopération catalytique. Glob. Environ. Politique. 20, 73–98 (2020).

Article Google Scholar

Richardson, L. Belle soupe. https://pypi.org/project/beautifulsoup4 (2019).

Marcotullio, PJ, Sarzynski, A., Albrecht, J. & Schulz, N. La géographie des émissions urbaines de gaz à effet de serre en Asie : une analyse régionale. Glob. Environ. Chang. 22, 944–958 (2012).

Article Google Scholar

Dodman, D. Blâmer les villes pour le changement climatique ? Une analyse des inventaires des émissions urbaines de gaz à effet de serre. 21, 185-201 (2009).

Rosa, EA & Dietz, T. Facteurs humains des émissions nationales de gaz à effet de serre. Nat. Clim. Chang. 2012 28 2, 581–586 (2012).

CAS Google Scholar

Karagulian, F. et al. Contributions aux particules ambiantes (PM) des villes : une revue systématique des contributions des sources locales au niveau mondial. Atmos. Environ. 120, 475–483 (2015).

Article ADS CAS Google Scholar

Agency, EE Émissions de gaz à effet de serre par secteur agrégé. Eurostat (2019).

Oda, T. & Maksyutov, S. Un inventaire mondial des émissions de CO2 de combustibles fossiles à très haute résolution (1 km × 1 km) dérivé d'une base de données de sources ponctuelles et d'observations par satellite des lumières nocturnes. Atmos. Chim. Phys. 11, 543–556 (2011).

Article ADS CAS Google Scholar

Bosilovich , MG , Lucchesi , R. & MS MERRA-2 : Spécification de fichier . (2015).

Van Donkelaar, A., Martin, RV, Li, C. & Burnett, RT Estimations régionales de la composition chimique des particules fines à l'aide d'une méthode géoscientifique-statistique combinée avec des informations provenant de satellites, de modèles et de moniteurs. Environ. Sci. Technol. 53, 2595-2611 (2019).

Annonces d'article Google Scholar

Engel-Cox, J., Kim Oanh, NT, van Donkelaar, A., Martin, RV & Zell, E. Vers la prochaine génération de surveillance de la qualité de l'air : les particules. Atmos. Environ. 80, 584-590 (2013).

Article ADS CAS Google Scholar

Agence européenne pour l'environnement. Émissions de gaz à effet de serre par secteur agrégé. Eurostat (2019).

CIESIN. Population maillée du monde, version 4. (2016).

Kummu, M., Taka, M. & Guillaume, JHA Ensembles de données mondiales maillées pour le produit intérieur brut et l'indice de développement humain sur la période 1990-2015. Sci. Données 5, (2018).

Eurostat. Produit intérieur brut (PIB) aux prix courants du marché par régions NUTS 2. https://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=nama_10r_2gdp (2022).

Eurostat. Glossaire : Unité administrative locale (UAL) - Statistics Explained. Eurostat https://ec.europa.eu/eurostat/statistics-explained/index.php?title=Glossary:Local_administrative_unit_(LAU) (2018).

Jordahl, K. geopandas : outils Python pour les données géographiques. (2014).

Haklay, M., informatique, PW-IP & 2008, indéfini. Openstreetmap : cartes routières générées par l'utilisateur. ieeexplore.ieee.org (2008).

Perry, M. rasterstats 0.16.0. (2021).

Kuhn, M. Création de modèles prédictifs dans R à l'aide du package caret. J. Stat. Logiciel 28, 1–26 (2008).

Article Google Scholar

Chen, T. & Guestrin, C. XGBoost : un système de boost d'arbre évolutif. dans Proc. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining vols 13-17-Aug 785–794 (Association for Computing Machinery, 2016).

Nielsen, D. Tree Boosting avec XGBoost Pourquoi XGBoost remporte-t-il "tous" les concours d'apprentissage automatique ?

Seyedzadeh, S., Pour Rahimian, F., Oliver, S., Rodriguez, S. & Glesk, I. Modélisation de l'apprentissage automatique pour prédire la performance énergétique des bâtiments non domestiques : un modèle pour soutenir la prise de décision en matière de rénovation énergétique profonde. Appl. Énergie 279, 115908 (2020).

Article Google Scholar

Si, M. & Du, K. Développement d'un modèle prédictif d'émissions à l'aide d'une méthode d'apprentissage automatique à renforcement de gradient. Environ. Technol. Innov. 20, 101028 (2020).

Article CAS Google Scholar

Alova, G. & Caldecott, B. Un modèle d'apprentissage automatique pour étudier les facteurs contribuant à la transition énergétique des secteurs des services publics et des producteurs d'électricité indépendants à l'échelle internationale. iScience 24, 102929 (2021).

Annonces d'article Google Scholar

Hastie, TJ Modèles additifs généralisés. dans Modèles statistiques en S (2017).

Joharestani, MZ, Cao, C., Ni, X., Bashir, B. & Talebiesfandarani, S. PM2.5 Prédiction basée sur la forêt aléatoire, XGBoost et l'apprentissage en profondeur à l'aide de données de télédétection multisources. Atmos. 2019, vol. 10, page 373 10, 373 (2019).

Google Scholar

Pan, B. Application de l'algorithme XGBoost dans la prévision de la concentration horaire de PM2,5. Conf. Ser. Terre Environ. Sci. 113, 012127 (2018).

Article Google Scholar

Li, Y. & Sun, Y. Modélisation et prévision des émissions de CO 2 au niveau de la ville à l'aide de données en libre accès et d'apprentissage automatique. Environ. Sci. Pollution. Rés. 28, 19260–19271 (2021).

Article CAS Google Scholar

Yang, L. & Shami, A. Sur l'optimisation des hyperparamètres des algorithmes d'apprentissage automatique : théorie et pratique. Neuroinformatique 415, 295–316 (2020).

Article Google Scholar

Yan, K. & Zhang, D. Sélection et analyse de caractéristiques sur des données de capteurs de gaz corrélées avec élimination de caractéristiques récursives. Sens. Actionneurs, B Chem. 212, 353–363 (2015).

Article CAS Google Scholar

Ketu, S. Indice spatial de qualité de l'air et prévision de la concentration de polluants atmosphériques à l'aide de l'élimination récursive de caractéristiques basée sur la régression linéaire avec régression forestière aléatoire (RFERF) : une étude de cas en Inde. Nat. Dangers 1–30 (2022).

Hutson, G. CRAN - Package FeatureTerminatoR. (2021).

Rasmussen, C. & Ghahramani, le rasoir de Z. Occam. Adv. Information neuronale. Processus. Syst. 13, (2000).

Chen, T. & Guestrin, C. XGBoost : un système de boost d'arbre évolutif. dans Actes de la conférence internationale ACM SIGKDD sur la découverte des connaissances et l'exploration de données, vols 13-17-août 785–794 (ACM, 2016).

Kleck, G. & Patterson, EB L'impact du contrôle des armes à feu et des niveaux de possession d'armes à feu sur les taux de violence. J.Quant. Criminol. 9, 249-287 (1993).

Article Google Scholar

Wickham, H. ggplot2 Graphiques élégants pour l'analyse des données. Journal de la Royal Statistical Society : Série A (Statistics in Society) (2016).

Télécharger les références

Cette recherche a été soutenue par une subvention de la Fondation IKEA (Grant No. A19051; AH) et une bourse de recherche en début de carrière de l'Université nationale de Singapour 2018 (Grant No. NUS_ECRA_FY18_P15; AH) décernée à AH Nous remercions Zhi Yi Yeo et Vasu Namdeo de Yale- NUS College pour son aide dans la collecte de données. Nous remercions également Glenn Sheriff (Arizona State University), Joe Aldy (Harvard Kennedy School of Government) et Evan Johnson (University of North Carolina-Chapel Hill) pour leurs commentaires sur une version antérieure de cette ébauche.

Département de politique publique, Université de Caroline du Nord à Chapel Hill, Chapel Hill, États-Unis

Angel Hsu et Xuewei Wang

EnviroLab axé sur les données, Université de Caroline du Nord à Chapel Hill, Chapel Hill, États-Unis

Angel Hsu et Xuewei Wang

Institute for the Environment, Université de Caroline du Nord à Chapel Hill, Chapel Hill, États-Unis

Angel Hsu et Xuewei Wang

Yale-NUS College, Singapour, Singapour

Jonas Tan et Wayne Toh

Faculté de technologie, politique et gestion, Université de technologie de Delft, Delft, Pays-Bas

Nihit Goyal

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

AH a conçu et co-conçu une étude, collecté des données, effectué une modélisation et une analyse statistique, réalisé des chiffres et rédigé l'article. XW a collecté des données, effectué une modélisation et une validation statistiques, réalisé des chiffres et contribué à la rédaction de l'article. JT a aidé à la sélection et à la mise en œuvre du modèle ML. WT a aidé à la collecte et à la fusion des données. NG a aidé à concevoir et à concevoir l'étude, à collecter et à traiter les données et à interpréter les résultats.

Correspondance avec Angel Hsu.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Zhi Qiao, Monica Salvia et Yanwei Sun pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Hsu, A., Wang, X., Tan, J. et al. Prédire les performances d'atténuation du climat des villes européennes à l'aide de l'apprentissage automatique. Nat Commun 13, 7487 (2022). https://doi.org/10.1038/s41467-022-35108-5

Télécharger la citation

Reçu : 14 mars 2022

Accepté : 18 novembre 2022

Publié: 05 décembre 2022

DOI : https://doi.org/10.1038/s41467-022-35108-5

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.

PARTAGER