Données et Méthodologie

Transparence, rigueur et open data

22

Sources open data

35 000

Communes couvertes

20M+

Données agrégées

2023–2026

Données actualisées

Notre approche

100% données publiques

Toutes nos sources sont des données ouvertes publiées par des organismes officiels (DGFiP, ADEME, INSEE, Ministères).

Mises à jour régulières

Les synchronisations sont quotidiennes (DPE), semestrielles (DVF) ou annuelles (REI) selon la fréquence de publication de chaque source.

Méthodologie documentée

Chaque indicateur est calculé selon une méthode explicite. Pas de boîte noire : nous détaillons les formules et les filtres appliqués.

Sources de données

Demandes de Valeurs Foncières (DVF)

Cerema / Etalab — DGFiP

data.gouv.fr — DVF

Toutes les transactions immobilières enregistrées par les notaires depuis 2019 : ventes d'appartements, maisons, terrains. Prix, surfaces, dates et localisation précise.

France entière — plus de 3 millions de mutations
Màj semestrielle (juin et décembre)
Prix de venteSurface habitableType de bienDate de mutationAdresseCode postalCoordonnées GPS

Méthodologie de traitement

Les mutations sont géocodées via la BAN, puis agrégées par commune et code postal pour calculer les prix médians au m², les tendances trimestrielles et les volumes de ventes. Les ventes atypiques (prix < 1 000 € ou > 50 000 €/m²) sont exclues des statistiques médianes.

Diagnostics de Performance Énergétique (DPE)

ADEME — Open Data Fair

data.ademe.fr — DPE

Les diagnostics énergétiques de plus de 14 millions de logements existants et neufs : étiquettes énergie (A à G), émissions de gaz à effet de serre, type de chauffage, année de construction.

14,2 M de logements existants + logements neufs
Màj quotidienne (sync incrémentale ademe)
Étiquette énergie (A-G)Étiquette GESConsommation kWh/m²/anType de chauffageAnnée de constructionSurface habitableCode postal

Méthodologie de traitement

Les DPE sont synchronisés quotidiennement depuis l'API ADEME. Pour chaque commune, nous calculons la répartition des étiquettes (A à G), la consommation énergétique médiane, les types de chauffage dominants et l'année médiane de construction. Le baromètre énergétique identifie les passoires thermiques (F-G) et les logements performants (A-B).

Annuaire de l'Éducation nationale

Ministère de l'Éducation nationale — data.education.gouv.fr

data.education.gouv.fr

Répertoire de tous les établissements scolaires de France : écoles maternelles, élémentaires, collèges, lycées. Effectifs, statut (public/privé), coordonnées.

Tous les établissements scolaires de France
Màj annuelle (rentrée scolaire)
Nom de l'établissementType (maternelle, élémentaire, collège, lycée)Statut (public/privé)EffectifsAdresseCoordonnées GPS

Méthodologie de traitement

Les établissements sont géolocalisés et rattachés à chaque commune. Pour chaque ville, nous calculons le nombre d'écoles par niveau, la répartition public/privé et les effectifs totaux. La proximité des établissements est prise en compte dans le score d'attractivité.

Annuaire Santé

Assurance Maladie — Opendatasoft

annuaire.sante.fr

Répertoire des professionnels de santé : médecins généralistes et spécialistes, pharmacies, hôpitaux, cliniques. Spécialités, adresses, secteurs de conventionnement.

Tous les professionnels de santé en exercice
Màj mensuelle
Nom du professionnelSpécialitéSecteur de conventionnementAdresseType de structureCoordonnées GPS

Méthodologie de traitement

Les professionnels de santé sont rattachés à chaque commune par code postal et géolocalisation. Nous calculons la densité médicale (nombre de médecins pour 10 000 habitants), identifions les spécialités disponibles et les éventuels déserts médicaux.

Élections Municipales 2026

Ministère de l'Intérieur — data.gouv.fr

data.gouv.fr — Municipales 2026

Candidatures officielles au 1er tour des municipales 2026 : listes candidates, nuances politiques, maires sortants, sièges à pourvoir (conseil municipal et communautaire), population légale.

34 958 communes — 49 976 listes candidates
Màj ponctuelle (publication officielle des candidatures)
Listes candidatesNuance politiqueTête de liste (nom, sexe)Maire sortantSièges au Conseil MunicipalSièges au Conseil CommunautairePopulation

Méthodologie de traitement

Les fichiers CSV de candidatures (888 000 lignes) et XLSX des sièges à pourvoir sont croisés par code commune INSEE. Pour chaque commune, nous consolidons les listes avec leur nuance, identifions les maires sortants et calculons les statistiques nationales de parité et de répartition politique.

Parlementaires (Députés et Sénateurs)

Assemblée nationale et Sénat — Open Data

data.assemblee-nationale.fr

Les élus de la représentation nationale rattachés à chaque département : députés et sénateurs, groupes politiques, commissions, mandats en cours.

577 députés + 348 sénateurs
Màj hebdomadaire
Nom et prénomCirconscription / départementGroupe politiqueCommissionDate de mandatPhoto

Méthodologie de traitement

Les données sont extraites des API ouvertes de l'Assemblée nationale (format JSON) et du Sénat (format CSV). Chaque parlementaire est rattaché à son département, ce qui permet d'afficher les élus locaux sur les fiches communes.

Taux de Taxe Foncière (REI 2024)

DGFiP — fichier REI (Recensement des Éléments d'Imposition)

data.gouv.fr — REI

Les taux réels votés par chaque commune pour la taxe foncière : taux communal, intercommunal, TEOM, GEMAPI et TASA. Données 2024 couvrant 34 940 communes.

34 940 communes — taux 2024
Màj annuelle (publication dgfip)
Taux communalTaux intercommunalité (EPCI)Taux TEOMTaux GEMAPITaux TASACode INSEE

Méthodologie de traitement

Les taux sont extraits du fichier REI officiel et appliqués à une valeur locative cadastrale (VLC) estimée par département et type de bien (coefficients ANIL 2025). Le simulateur calcule la base d'imposition (VLC - 50% d'abattement), applique les taux, puis ajoute les frais de gestion de l'État (8% FDL, 3% TEOM, 9% taxes spéciales).

Répertoire SIRENE

INSEE — API Recherche Entreprises

recherche-entreprises.api.gouv.fr

Le répertoire officiel des entreprises et établissements français. Utilisé pour identifier les entreprises locales, les activités économiques dominantes et le dynamisme entrepreneurial de chaque commune.

France entière — toutes les entreprises actives
Màj quotidienne (api en temps réel)
Raison socialeCode NAF / activitéAdresseEffectif salariéDate de créationStatut juridique

Méthodologie de traitement

L'API SIRENE est interrogée par code commune pour lister les établissements actifs. Les entreprises sont catégorisées par secteur d'activité (NAF) et classées par taille d'effectif pour identifier les principaux employeurs locaux.

Répertoire National des Associations (RNA)

data.gouv.fr — recherche-entreprises.api.gouv.fr

recherche-entreprises.api.gouv.fr

Le répertoire officiel de toutes les associations déclarées en France : associations loi 1901, fédérations, fondations. Nom, objet social, date de création, adresse du siège.

Plus de 1,5 million d'associations actives
Màj quotidienne (sync api)
Nom de l'associationObjet socialCatégorie juridiqueDate de créationAdresse du siègeN° SIREN

Méthodologie de traitement

Les associations sont récupérées en temps réel via l'API Recherche Entreprises, filtrées par nature juridique (codes 92XX) et par code commune INSEE. Pour chaque commune, nous affichons la liste complète des associations locales avec pagination.

Sécurité — Délinquance & Zones de compétence

SSMSI — Ministère de l'Intérieur / data.gouv.fr

data.gouv.fr — SSMSI

Statistiques de délinquance enregistrée par la police et la gendarmerie nationales au niveau communal : 16 catégories d'infractions, taux pour 1 000 habitants, population de référence. Complété par les zones de compétence territoriale (police nationale vs gendarmerie).

~35 000 communes — France entière
Màj annuelle (ssmsi) + mise à jour quotidienne des zones
Catégorie d'infractionNombre de faitsTaux pour 1 000 hab.PopulationAnnéeZone police/gendarmerieNom du service/brigade

Méthodologie de traitement

Les données de délinquance sont importées depuis le CSV du SSMSI, avec les 16 catégories officielles (cambriolages, vols, violences physiques, sexuelles, stupéfiants, escroqueries, etc.). Les zones de compétence sont issues du fichier de compétence territoriale PN/GN. Pour chaque commune, les taux sont comparés aux moyennes nationales et départementales.

Connectivité Fibre FTTH (ARCEP)

ARCEP — data.gouv.fr

data.gouv.fr — ARCEP THD

Taux de raccordabilité à la fibre optique (FTTH) par commune : nombre total de locaux, locaux raccordables au très haut débit (> 1 Gbit/s), taux de couverture. Données trimestrielles issues des opérateurs télécoms.

~35 000 communes — France entière
Màj trimestrielle (arcep)
Code INSEETotal locauxLocaux raccordables FTTHTaux de couverture (%)Trimestre

Méthodologie de traitement

Le fichier CSV trimestriel de l'ARCEP est téléchargé et filtré sur le type « all » (ensemble des locaux). Le taux FTTH est calculé comme le ratio locaux raccordables THD (>1G) / total locaux × 100. Les données sont stockées par commune et trimestre pour suivre l'évolution de la couverture fibre.

Communes limitrophes (Adjacences OSM)

OpenStreetMap France — Christian Quest

data.gouv.fr — Adjacences

Liste des communes voisines pour chaque commune de France, avec direction (cap en degrés). Permet de comparer les prix immobiliers, la couverture santé et les services entre communes adjacentes.

~35 000 communes — géométries 2022
Màj annuelle
Code INSEECommunes voisines (codes INSEE)Noms des voisinesDirection (cap)Nombre de voisins

Méthodologie de traitement

Le fichier CSV des adjacences est traité pour extraire chaque paire commune→voisine. Les directions sont exprimées en degrés (0=Nord, 90=Est, etc.). Ces données alimentent les comparaisons de prix m² entre communes limitrophes affichées sur le hub communal.

Contours communaux (GeoJSON)

API Géo — geo.api.gouv.fr

geo.api.gouv.fr

Polygones des frontières communales au format GeoJSON, utilisés pour la carte interactive OpenStreetMap. Les contours sont récupérés en temps réel depuis l'API Géo officielle et mis en cache 24h.

Toutes les communes avec géométrie disponible
Màj temps réel (cache 24h)
Polygone GeoJSONGéométrie (contour)Code INSEE

Méthodologie de traitement

Les contours sont récupérés à la demande via l'endpoint geo.api.gouv.fr/communes/{code}?format=geojson&geometry=contour. Un cache HTTP de 24h (s-maxage=86400) est appliqué côté serveur. Les polygones sont affichés sur la carte Leaflet avec un style émeraude cohérent avec l'identité Urbaa.

Météo locale (Open-Meteo)

Open-Meteo — Modèles Météo-France AROME & ARPEGE

open-meteo.com

Données météorologiques en temps réel pour chaque commune : température actuelle, conditions, vent, et prévisions à 4 jours. Basé sur les modèles haute résolution de Météo-France (AROME 1,3 km).

Toutes les communes avec coordonnées GPS
Màj temps réel (cache 30 min)
Température actuelleCode météo WMOVitesse du ventPrévisions min/maxConditions 4 jours

Méthodologie de traitement

Les coordonnées GPS de la commune (latitude/longitude stockées en base) sont envoyées à l'API Open-Meteo qui retourne les données du modèle AROME de Météo-France. Les résultats sont mis en cache 30 minutes côté serveur pour limiter les appels API.

Base Adresse Nationale (BAN)

Etalab — api-adresse.data.gouv.fr

adresse.data.gouv.fr

La base de référence pour la géolocalisation en France : adresses, coordonnées GPS, codes postaux. Utilisée pour le géocodage des transactions DVF, des DPE et la recherche par adresse.

25 millions d'adresses en France
Màj quotidienne
Adresse complèteCoordonnées GPS (lat/lon)Code postalCode INSEEType de voie

Méthodologie de traitement

La BAN est utilisée comme service de géocodage pour positionner les mutations DVF et les DPE sur la carte. Le géocodage par lot (bulk) permet de traiter plusieurs millions d'adresses. En cas d'échec au niveau de l'adresse, un fallback par nom de commune est utilisé.

Qualité de l'eau potable (Hub'Eau)

Ministère de la Santé — Hub'Eau / SISE-Eaux

hubeau.eaufrance.fr

Résultats d'analyses de la qualité de l'eau potable par commune : paramètres physico-chimiques (nitrates, plomb, pesticides, pH, turbidité), taux de conformité et dernier prélèvement. Données issues du système SISE-Eaux du Ministère de la Santé.

Toutes les communes raccordées à un réseau d'eau potable
Màj temps réel (api hub'eau, cache 24h)
Paramètre analyséMoyenneMin/MaxLimite réglementaireConformitéNombre d'analysesDate du dernier prélèvement

Méthodologie de traitement

L'API Hub'Eau est interrogée par code commune pour récupérer les résultats d'analyses des 3 dernières années. Pour chaque paramètre clé (nitrates, plomb, pesticides, bactériologie), nous calculons la moyenne, les valeurs min/max et le taux de conformité par rapport aux limites réglementaires. Un verdict global (conforme / vigilance / attention) est déterminé automatiquement.

Données démographiques (INSEE)

INSEE — Recensement de la population

insee.fr — Recensement

Indicateurs démographiques par commune : population légale, pyramide des âges (5 tranches), âge moyen, nombre de ménages, part des familles, superficie et densité de population.

~35 000 communes — France entière
Màj annuelle (données du recensement)
Population légaleÂge moyenPyramide des âges (5 tranches)Nombre de ménagesPart des famillesSuperficieDensité

Méthodologie de traitement

Les données INSEE sont importées par commune et stockées en base. La pyramide des âges est calculée en 5 tranches (< 20 ans, 20-39, 40-59, 60-74, 75+). La densité est calculée en divisant la population par la superficie en km². Ces données alimentent la section démographie de la page Cadre de vie.

Logements vacants (LOVAC)

Cerema — data.gouv.fr

data.gouv.fr — LOVAC

Fichier national des logements vacants du parc privé, issu du croisement des fichiers fiscaux (Fidéli / DGFIP). Nombre de logements vacants par commune, dont les vacants de longue durée (plus de 2 ans), et taille du parc privé. Historique 2020-2025.

~35 000 communes — 6 années (2020-2025)
Màj annuelle
Nombre de logements vacantsVacants > 2 ansParc privé totalCode INSEEAnnée

Méthodologie de traitement

Le fichier LOVAC agrégé par commune est importé année par année (2020 à 2025). Les valeurs secrétisées (marquées « s ») sont stockées comme NULL. Pour chaque commune, nous affichons l'évolution sur 6 ans du nombre de logements vacants et de la part de vacance longue durée (> 2 ans), ainsi que le taux de vacance rapporté au parc privé quand disponible.

Balances comptables des communes

DGFiP — data.economie.gouv.fr

data.economie.gouv.fr

Comptes détaillés de chaque commune : recettes et dépenses de fonctionnement et d'investissement, encours de dette, capacité d'autofinancement. Données issues des balances comptables officielles transmises par les comptables publics.

34 802 communes — année 2024
Màj annuelle (publication décembre n+1)
Recettes fonctionnementDépenses fonctionnementRecettes investissementDépenses investissementEncours de detteCapacité d'autofinancement

Méthodologie de traitement

Le fichier CSV des balances comptables (~7 millions de lignes) est parsé ligne par ligne. Seules les lignes du budget principal (cbudg=1, catégorie « Commune ») sont retenues. Les comptes sont agrégés par classe : classe 7 → recettes de fonctionnement, classe 6 → dépenses de fonctionnement, classe 2 → dépenses d'investissement, classe 1 (hors 16) → recettes d'investissement, classe 16 → encours de dette. La capacité d'autofinancement est calculée comme la différence recettes - dépenses de fonctionnement.

Dépenses culturelles des communes

Ministère de la Culture — data.gouv.fr

data.gouv.fr — Dépenses culturelles

Budget consacré à la culture par chaque commune : dépenses totales, fonctionnement et investissement, montant par habitant et part dans le budget communal. Couvre les communes de plus de 3 500 habitants.

3 254 communes — année 2023
Màj annuelle
Dépenses totales (K€)Fonctionnement (K€)Investissement (K€)€/habitant% du budget total% fonctionnement% investissement

Méthodologie de traitement

Le CSV est téléchargé et les montants en K€ sont convertis en euros. Les dépenses par habitant et les pourcentages du budget sont directement issus du fichier source. La moyenne nationale (~97 €/hab.) est calculée pour permettre la comparaison. Les données alimentent la section « Dépenses culturelles » de la page Économie & Finances.

Logement social — loi SRU

Ministère du Logement — data.gouv.fr

data.gouv.fr — Bilan SRU

Bilan triennal SRU : taux de logement social par commune soumise à l'article 55, objectif légal (20 ou 25 %), nombre de logements sociaux, statut (conforme, déficitaire, carencé, exempté) et prélèvement financier annuel.

2 196 communes soumises à la loi SRU
Màj triennale (bilan sru)
Taux SRU (%)Taux cible (%)Nb logements sociauxDéficitaireCarencéeExemptéePrélèvement net (€)

Méthodologie de traitement

Les données du bilan triennal SRU sont importées par commune. Pour chaque ville, nous affichons le taux de logement social, l'objectif légal, la distance au seuil, et le prélèvement financier en cas de non-conformité. Un code couleur indique le statut : vert (conforme), orange (déficitaire), rouge (carencée), gris (exemptée).

Sites Patrimoniaux Remarquables (SPR)

Ministère de la Culture — data.gouv.fr

data.gouv.fr — SPR

Liste officielle des Sites Patrimoniaux Remarquables (ex secteurs sauvegardés, ZPPAUP, AVAP). Ces périmètres de protection encadrent les travaux d'urbanisme pour préserver le caractère historique et architectural des centres anciens.

1 082 communes avec au moins un SPR
Màj ponctuelle (mise à jour par le ministère)
Nombre de SPRType de plan (AVAP, ZPPAUP, PSMV, LCAP)Date de créationNuméro du SPR

Méthodologie de traitement

Le CSV est parsé et agrégé par commune : nombre de SPR, types de plans en vigueur et date de création la plus ancienne. Les types de plans sont traduits en libellés complets (AVAP = Aire de Valorisation de l'Architecture et du Patrimoine, etc.). Les données sont affichées dans la section Patrimoine protégé de la page Cadre de vie.

Intelligence artificielle (UrbIA)

Urbaa intègre un assistant IA (UrbIA) propulsé par Google Gemini. Cet assistant permet d'interroger les données en langage naturel : estimer un bien, comparer des communes, simuler un crédit ou explorer les candidatures électorales.

UrbIA ne génère pas de données : il exploite exclusivement les données open data décrites ci-dessus via un système de tool-calling (appels de fonctions). Chaque réponse est traçable et fondée sur des données réelles. Les descriptions de communes générées par IA sont basées sur des instantanés de données factuelles (population, prix/m², DPE, écoles).

Score d'attractivité

Méthodologie de calcul — note sur 10

Le score d'attractivité est un indicateur composite noté sur 10 qui synthétise la qualité de vie dans une commune. Il est calculé automatiquement pour les 34 900+ communes de France à partir de données officielles, sans aucune composante subjective.

Le score agrège 10 dimensions pondérées. Chaque dimension est normalisée sur une échelle 0-10 en utilisant les percentiles P5 et P95 de la distribution nationale, ce qui permet de comparer équitablement les communes entre elles tout en écartant les valeurs extrêmes.

Sécurité

20%
inversé

Taux de délinquance pour 1 000 habitants (somme des 16 catégories SSMSI). Plus le taux est bas, meilleur est le score.

Source : SSMSI — Ministère de l'Intérieur

Éducation

13%

Nombre d'établissements scolaires pour 1 000 habitants (maternelles, élémentaires, collèges, lycées). Mesure la proximité de l'offre éducative.

Source : Annuaire Éducation nationale

Connectivité

12%

Taux de couverture FTTH (fibre optique) de 0% à 100%. Une commune 100% fibrée obtient le score maximum.

Source : ARCEP

Pression fiscale

13%
inversé

Taux global d'imposition foncière (communal + intercommunal + TEOM + GEMAPI + TASA). Plus les taxes sont basses, meilleur est le score.

Source : DGFiP — fichier REI

Capacité d'autofinancement

8%

CAF par habitant : capacité de la commune à financer ses investissements sans emprunter. Un indicateur de bonne gestion financière.

Source : DGFiP — Balances comptables 2024

Endettement

8%
inversé

Encours de dette par habitant. Plus l'endettement par habitant est faible, meilleur est le score.

Source : DGFiP — Balances comptables 2024

Dépenses culturelles

8%

Dépenses culturelles par habitant. Indicateur de l'offre culturelle locale (bibliothèques, spectacles, patrimoine). Disponible pour 2 500 communes.

Source : Observatoire des finances locales

Ensoleillement

7%

Heures d'ensoleillement annuelles cumulées (moyenne 2020-2024). Plus la commune est ensoleillée, meilleur est le score.

Source : Open-Meteo — Archives ERA5 (résolution 0.25°)

Douceur du climat

6%

Température moyenne annuelle (moyenne 2020-2024). Les communes au climat plus doux obtiennent un meilleur score.

Source : Open-Meteo — Archives ERA5 (résolution 0.25°)

Logement social (bonus)

5%

Taux de logements sociaux SRU. Indicateur de mixité sociale et d'accessibilité du logement. Disponible pour 2 196 communes soumises à la loi SRU.

Source : DHUP — Bilan SRU triennal

Formule de calcul

Pour chaque commune, le score est la moyenne pondérée des dimensions disponibles :

Score = Σ (note_dimension × poids) / Σ poids_disponibles

Chaque dimension est normalisée entre 0 et 10 avec la formule : note = (valeur - P5) / (P95 - P5) × 10, bornée entre 0 et 10. Les dimensions inversées (sécurité, fiscalité, endettement) utilisent note = (1 - normalisé) × 10 : plus la valeur est basse, meilleure est la note.

Si une donnée n'est pas disponible pour une commune (ex. : culture ou SRU), la dimension est exclue et le poids est redistribué automatiquement sur les dimensions disponibles. Toutes les communes disposant d'au moins une dimension reçoivent un score.

Interprétation du score

  • 8 à 10 — Très attractive : commune qui excelle sur la plupart des dimensions
  • 6 à 8 — Attractive : bonne qualité de vie globale, quelques points d'amélioration
  • 4 à 6 — Dans la moyenne : profil équilibré avec des forces et des faiblesses
  • 2 à 4 — En retrait : plusieurs dimensions sous la moyenne nationale
  • 0 à 2 — Peu attractive : difficultés significatives sur plusieurs indicateurs

Limites et transparence

Le score est un indicateur synthétique, pas un jugement de valeur. Il ne prend pas en compte les préférences individuelles (proximité mer/montagne, taille de ville, cadre de vie subjectif). Les données santé seront intégrées prochainement pour enrichir le calcul. Le climat (ensoleillement et température) est intégré depuis mars 2026 avec une couverture de 100% des communes.

Urbaa : une plateforme d'intelligence urbaine fondée sur l'open data

Urbaa.app est une plateforme d'intelligence urbaine qui agrège et analyse les données ouvertes (open data) de 22 sources officielles pour couvrir les 35 000 communes de France. Immobilier (DVF, LOVAC, SRU), performance énergétique (DPE ADEME), éducation, santé, entreprises (SIRENE), fiscalité locale (REI DGFiP), budgets communaux (balances comptables), dépenses culturelles, qualité de l'eau (Hub'Eau), patrimoine protégé (SPR), élections municipales 2026 et parlementaires : chaque donnée est sourcée, datée et documentée.

Notre engagement : zéro donnée propriétaire. Toutes les informations affichées proviennent de jeux de données publiés sous licence ouverte par des organismes publics français (DGFiP, ADEME, INSEE, Ministères de l'Intérieur, de l'Éducation, de la Santé, de la Culture, Assemblée nationale, Sénat, ARCEP, Cerema). Les traitements appliqués (agrégation, géocodage, calcul de médianes) sont documentés pour chaque source sur cette page.

Les mises à jour suivent le rythme de publication de chaque source : synchronisation quotidienne pour les DPE, semestrielle pour les transactions immobilières DVF, annuelle pour les budgets communaux et la démographie, triennale pour les bilans SRU. L'objectif est de fournir une vision fiable, actualisée et comparable de chaque commune française.