Transparence, rigueur et open data
22
Sources open data
35 000
Communes couvertes
20M+
Données agrégées
2023–2026
Données actualisées
Toutes nos sources sont des données ouvertes publiées par des organismes officiels (DGFiP, ADEME, INSEE, Ministères).
Les synchronisations sont quotidiennes (DPE), semestrielles (DVF) ou annuelles (REI) selon la fréquence de publication de chaque source.
Chaque indicateur est calculé selon une méthode explicite. Pas de boîte noire : nous détaillons les formules et les filtres appliqués.
Cerema / Etalab — DGFiP
Toutes les transactions immobilières enregistrées par les notaires depuis 2019 : ventes d'appartements, maisons, terrains. Prix, surfaces, dates et localisation précise.
Méthodologie de traitement
Les mutations sont géocodées via la BAN, puis agrégées par commune et code postal pour calculer les prix médians au m², les tendances trimestrielles et les volumes de ventes. Les ventes atypiques (prix < 1 000 € ou > 50 000 €/m²) sont exclues des statistiques médianes.
ADEME — Open Data Fair
Les diagnostics énergétiques de plus de 14 millions de logements existants et neufs : étiquettes énergie (A à G), émissions de gaz à effet de serre, type de chauffage, année de construction.
Méthodologie de traitement
Les DPE sont synchronisés quotidiennement depuis l'API ADEME. Pour chaque commune, nous calculons la répartition des étiquettes (A à G), la consommation énergétique médiane, les types de chauffage dominants et l'année médiane de construction. Le baromètre énergétique identifie les passoires thermiques (F-G) et les logements performants (A-B).
Ministère de l'Éducation nationale — data.education.gouv.fr
Répertoire de tous les établissements scolaires de France : écoles maternelles, élémentaires, collèges, lycées. Effectifs, statut (public/privé), coordonnées.
Méthodologie de traitement
Les établissements sont géolocalisés et rattachés à chaque commune. Pour chaque ville, nous calculons le nombre d'écoles par niveau, la répartition public/privé et les effectifs totaux. La proximité des établissements est prise en compte dans le score d'attractivité.
Assurance Maladie — Opendatasoft
Répertoire des professionnels de santé : médecins généralistes et spécialistes, pharmacies, hôpitaux, cliniques. Spécialités, adresses, secteurs de conventionnement.
Méthodologie de traitement
Les professionnels de santé sont rattachés à chaque commune par code postal et géolocalisation. Nous calculons la densité médicale (nombre de médecins pour 10 000 habitants), identifions les spécialités disponibles et les éventuels déserts médicaux.
Ministère de l'Intérieur — data.gouv.fr
Candidatures officielles au 1er tour des municipales 2026 : listes candidates, nuances politiques, maires sortants, sièges à pourvoir (conseil municipal et communautaire), population légale.
Méthodologie de traitement
Les fichiers CSV de candidatures (888 000 lignes) et XLSX des sièges à pourvoir sont croisés par code commune INSEE. Pour chaque commune, nous consolidons les listes avec leur nuance, identifions les maires sortants et calculons les statistiques nationales de parité et de répartition politique.
Assemblée nationale et Sénat — Open Data
Les élus de la représentation nationale rattachés à chaque département : députés et sénateurs, groupes politiques, commissions, mandats en cours.
Méthodologie de traitement
Les données sont extraites des API ouvertes de l'Assemblée nationale (format JSON) et du Sénat (format CSV). Chaque parlementaire est rattaché à son département, ce qui permet d'afficher les élus locaux sur les fiches communes.
DGFiP — fichier REI (Recensement des Éléments d'Imposition)
Les taux réels votés par chaque commune pour la taxe foncière : taux communal, intercommunal, TEOM, GEMAPI et TASA. Données 2024 couvrant 34 940 communes.
Méthodologie de traitement
Les taux sont extraits du fichier REI officiel et appliqués à une valeur locative cadastrale (VLC) estimée par département et type de bien (coefficients ANIL 2025). Le simulateur calcule la base d'imposition (VLC - 50% d'abattement), applique les taux, puis ajoute les frais de gestion de l'État (8% FDL, 3% TEOM, 9% taxes spéciales).
INSEE — API Recherche Entreprises
Le répertoire officiel des entreprises et établissements français. Utilisé pour identifier les entreprises locales, les activités économiques dominantes et le dynamisme entrepreneurial de chaque commune.
Méthodologie de traitement
L'API SIRENE est interrogée par code commune pour lister les établissements actifs. Les entreprises sont catégorisées par secteur d'activité (NAF) et classées par taille d'effectif pour identifier les principaux employeurs locaux.
data.gouv.fr — recherche-entreprises.api.gouv.fr
Le répertoire officiel de toutes les associations déclarées en France : associations loi 1901, fédérations, fondations. Nom, objet social, date de création, adresse du siège.
Méthodologie de traitement
Les associations sont récupérées en temps réel via l'API Recherche Entreprises, filtrées par nature juridique (codes 92XX) et par code commune INSEE. Pour chaque commune, nous affichons la liste complète des associations locales avec pagination.
SSMSI — Ministère de l'Intérieur / data.gouv.fr
Statistiques de délinquance enregistrée par la police et la gendarmerie nationales au niveau communal : 16 catégories d'infractions, taux pour 1 000 habitants, population de référence. Complété par les zones de compétence territoriale (police nationale vs gendarmerie).
Méthodologie de traitement
Les données de délinquance sont importées depuis le CSV du SSMSI, avec les 16 catégories officielles (cambriolages, vols, violences physiques, sexuelles, stupéfiants, escroqueries, etc.). Les zones de compétence sont issues du fichier de compétence territoriale PN/GN. Pour chaque commune, les taux sont comparés aux moyennes nationales et départementales.
ARCEP — data.gouv.fr
Taux de raccordabilité à la fibre optique (FTTH) par commune : nombre total de locaux, locaux raccordables au très haut débit (> 1 Gbit/s), taux de couverture. Données trimestrielles issues des opérateurs télécoms.
Méthodologie de traitement
Le fichier CSV trimestriel de l'ARCEP est téléchargé et filtré sur le type « all » (ensemble des locaux). Le taux FTTH est calculé comme le ratio locaux raccordables THD (>1G) / total locaux × 100. Les données sont stockées par commune et trimestre pour suivre l'évolution de la couverture fibre.
OpenStreetMap France — Christian Quest
Liste des communes voisines pour chaque commune de France, avec direction (cap en degrés). Permet de comparer les prix immobiliers, la couverture santé et les services entre communes adjacentes.
Méthodologie de traitement
Le fichier CSV des adjacences est traité pour extraire chaque paire commune→voisine. Les directions sont exprimées en degrés (0=Nord, 90=Est, etc.). Ces données alimentent les comparaisons de prix m² entre communes limitrophes affichées sur le hub communal.
API Géo — geo.api.gouv.fr
Polygones des frontières communales au format GeoJSON, utilisés pour la carte interactive OpenStreetMap. Les contours sont récupérés en temps réel depuis l'API Géo officielle et mis en cache 24h.
Méthodologie de traitement
Les contours sont récupérés à la demande via l'endpoint geo.api.gouv.fr/communes/{code}?format=geojson&geometry=contour. Un cache HTTP de 24h (s-maxage=86400) est appliqué côté serveur. Les polygones sont affichés sur la carte Leaflet avec un style émeraude cohérent avec l'identité Urbaa.
Open-Meteo — Modèles Météo-France AROME & ARPEGE
Données météorologiques en temps réel pour chaque commune : température actuelle, conditions, vent, et prévisions à 4 jours. Basé sur les modèles haute résolution de Météo-France (AROME 1,3 km).
Méthodologie de traitement
Les coordonnées GPS de la commune (latitude/longitude stockées en base) sont envoyées à l'API Open-Meteo qui retourne les données du modèle AROME de Météo-France. Les résultats sont mis en cache 30 minutes côté serveur pour limiter les appels API.
Etalab — api-adresse.data.gouv.fr
La base de référence pour la géolocalisation en France : adresses, coordonnées GPS, codes postaux. Utilisée pour le géocodage des transactions DVF, des DPE et la recherche par adresse.
Méthodologie de traitement
La BAN est utilisée comme service de géocodage pour positionner les mutations DVF et les DPE sur la carte. Le géocodage par lot (bulk) permet de traiter plusieurs millions d'adresses. En cas d'échec au niveau de l'adresse, un fallback par nom de commune est utilisé.
Ministère de la Santé — Hub'Eau / SISE-Eaux
Résultats d'analyses de la qualité de l'eau potable par commune : paramètres physico-chimiques (nitrates, plomb, pesticides, pH, turbidité), taux de conformité et dernier prélèvement. Données issues du système SISE-Eaux du Ministère de la Santé.
Méthodologie de traitement
L'API Hub'Eau est interrogée par code commune pour récupérer les résultats d'analyses des 3 dernières années. Pour chaque paramètre clé (nitrates, plomb, pesticides, bactériologie), nous calculons la moyenne, les valeurs min/max et le taux de conformité par rapport aux limites réglementaires. Un verdict global (conforme / vigilance / attention) est déterminé automatiquement.
INSEE — Recensement de la population
Indicateurs démographiques par commune : population légale, pyramide des âges (5 tranches), âge moyen, nombre de ménages, part des familles, superficie et densité de population.
Méthodologie de traitement
Les données INSEE sont importées par commune et stockées en base. La pyramide des âges est calculée en 5 tranches (< 20 ans, 20-39, 40-59, 60-74, 75+). La densité est calculée en divisant la population par la superficie en km². Ces données alimentent la section démographie de la page Cadre de vie.
Cerema — data.gouv.fr
Fichier national des logements vacants du parc privé, issu du croisement des fichiers fiscaux (Fidéli / DGFIP). Nombre de logements vacants par commune, dont les vacants de longue durée (plus de 2 ans), et taille du parc privé. Historique 2020-2025.
Méthodologie de traitement
Le fichier LOVAC agrégé par commune est importé année par année (2020 à 2025). Les valeurs secrétisées (marquées « s ») sont stockées comme NULL. Pour chaque commune, nous affichons l'évolution sur 6 ans du nombre de logements vacants et de la part de vacance longue durée (> 2 ans), ainsi que le taux de vacance rapporté au parc privé quand disponible.
DGFiP — data.economie.gouv.fr
Comptes détaillés de chaque commune : recettes et dépenses de fonctionnement et d'investissement, encours de dette, capacité d'autofinancement. Données issues des balances comptables officielles transmises par les comptables publics.
Méthodologie de traitement
Le fichier CSV des balances comptables (~7 millions de lignes) est parsé ligne par ligne. Seules les lignes du budget principal (cbudg=1, catégorie « Commune ») sont retenues. Les comptes sont agrégés par classe : classe 7 → recettes de fonctionnement, classe 6 → dépenses de fonctionnement, classe 2 → dépenses d'investissement, classe 1 (hors 16) → recettes d'investissement, classe 16 → encours de dette. La capacité d'autofinancement est calculée comme la différence recettes - dépenses de fonctionnement.
Ministère de la Culture — data.gouv.fr
Budget consacré à la culture par chaque commune : dépenses totales, fonctionnement et investissement, montant par habitant et part dans le budget communal. Couvre les communes de plus de 3 500 habitants.
Méthodologie de traitement
Le CSV est téléchargé et les montants en K€ sont convertis en euros. Les dépenses par habitant et les pourcentages du budget sont directement issus du fichier source. La moyenne nationale (~97 €/hab.) est calculée pour permettre la comparaison. Les données alimentent la section « Dépenses culturelles » de la page Économie & Finances.
Ministère du Logement — data.gouv.fr
Bilan triennal SRU : taux de logement social par commune soumise à l'article 55, objectif légal (20 ou 25 %), nombre de logements sociaux, statut (conforme, déficitaire, carencé, exempté) et prélèvement financier annuel.
Méthodologie de traitement
Les données du bilan triennal SRU sont importées par commune. Pour chaque ville, nous affichons le taux de logement social, l'objectif légal, la distance au seuil, et le prélèvement financier en cas de non-conformité. Un code couleur indique le statut : vert (conforme), orange (déficitaire), rouge (carencée), gris (exemptée).
Ministère de la Culture — data.gouv.fr
Liste officielle des Sites Patrimoniaux Remarquables (ex secteurs sauvegardés, ZPPAUP, AVAP). Ces périmètres de protection encadrent les travaux d'urbanisme pour préserver le caractère historique et architectural des centres anciens.
Méthodologie de traitement
Le CSV est parsé et agrégé par commune : nombre de SPR, types de plans en vigueur et date de création la plus ancienne. Les types de plans sont traduits en libellés complets (AVAP = Aire de Valorisation de l'Architecture et du Patrimoine, etc.). Les données sont affichées dans la section Patrimoine protégé de la page Cadre de vie.
Urbaa intègre un assistant IA (UrbIA) propulsé par Google Gemini. Cet assistant permet d'interroger les données en langage naturel : estimer un bien, comparer des communes, simuler un crédit ou explorer les candidatures électorales.
UrbIA ne génère pas de données : il exploite exclusivement les données open data décrites ci-dessus via un système de tool-calling (appels de fonctions). Chaque réponse est traçable et fondée sur des données réelles. Les descriptions de communes générées par IA sont basées sur des instantanés de données factuelles (population, prix/m², DPE, écoles).
Méthodologie de calcul — note sur 10
Le score d'attractivité est un indicateur composite noté sur 10 qui synthétise la qualité de vie dans une commune. Il est calculé automatiquement pour les 34 900+ communes de France à partir de données officielles, sans aucune composante subjective.
Le score agrège 10 dimensions pondérées. Chaque dimension est normalisée sur une échelle 0-10 en utilisant les percentiles P5 et P95 de la distribution nationale, ce qui permet de comparer équitablement les communes entre elles tout en écartant les valeurs extrêmes.
Taux de délinquance pour 1 000 habitants (somme des 16 catégories SSMSI). Plus le taux est bas, meilleur est le score.
Source : SSMSI — Ministère de l'Intérieur
Nombre d'établissements scolaires pour 1 000 habitants (maternelles, élémentaires, collèges, lycées). Mesure la proximité de l'offre éducative.
Source : Annuaire Éducation nationale
Taux de couverture FTTH (fibre optique) de 0% à 100%. Une commune 100% fibrée obtient le score maximum.
Source : ARCEP
Taux global d'imposition foncière (communal + intercommunal + TEOM + GEMAPI + TASA). Plus les taxes sont basses, meilleur est le score.
Source : DGFiP — fichier REI
CAF par habitant : capacité de la commune à financer ses investissements sans emprunter. Un indicateur de bonne gestion financière.
Source : DGFiP — Balances comptables 2024
Encours de dette par habitant. Plus l'endettement par habitant est faible, meilleur est le score.
Source : DGFiP — Balances comptables 2024
Dépenses culturelles par habitant. Indicateur de l'offre culturelle locale (bibliothèques, spectacles, patrimoine). Disponible pour 2 500 communes.
Source : Observatoire des finances locales
Heures d'ensoleillement annuelles cumulées (moyenne 2020-2024). Plus la commune est ensoleillée, meilleur est le score.
Source : Open-Meteo — Archives ERA5 (résolution 0.25°)
Température moyenne annuelle (moyenne 2020-2024). Les communes au climat plus doux obtiennent un meilleur score.
Source : Open-Meteo — Archives ERA5 (résolution 0.25°)
Taux de logements sociaux SRU. Indicateur de mixité sociale et d'accessibilité du logement. Disponible pour 2 196 communes soumises à la loi SRU.
Source : DHUP — Bilan SRU triennal
Pour chaque commune, le score est la moyenne pondérée des dimensions disponibles :
Chaque dimension est normalisée entre 0 et 10 avec la formule : note = (valeur - P5) / (P95 - P5) × 10, bornée entre 0 et 10. Les dimensions inversées (sécurité, fiscalité, endettement) utilisent note = (1 - normalisé) × 10 : plus la valeur est basse, meilleure est la note.
Si une donnée n'est pas disponible pour une commune (ex. : culture ou SRU), la dimension est exclue et le poids est redistribué automatiquement sur les dimensions disponibles. Toutes les communes disposant d'au moins une dimension reçoivent un score.
Le score est un indicateur synthétique, pas un jugement de valeur. Il ne prend pas en compte les préférences individuelles (proximité mer/montagne, taille de ville, cadre de vie subjectif). Les données santé seront intégrées prochainement pour enrichir le calcul. Le climat (ensoleillement et température) est intégré depuis mars 2026 avec une couverture de 100% des communes.
Urbaa.app est une plateforme d'intelligence urbaine qui agrège et analyse les données ouvertes (open data) de 22 sources officielles pour couvrir les 35 000 communes de France. Immobilier (DVF, LOVAC, SRU), performance énergétique (DPE ADEME), éducation, santé, entreprises (SIRENE), fiscalité locale (REI DGFiP), budgets communaux (balances comptables), dépenses culturelles, qualité de l'eau (Hub'Eau), patrimoine protégé (SPR), élections municipales 2026 et parlementaires : chaque donnée est sourcée, datée et documentée.
Notre engagement : zéro donnée propriétaire. Toutes les informations affichées proviennent de jeux de données publiés sous licence ouverte par des organismes publics français (DGFiP, ADEME, INSEE, Ministères de l'Intérieur, de l'Éducation, de la Santé, de la Culture, Assemblée nationale, Sénat, ARCEP, Cerema). Les traitements appliqués (agrégation, géocodage, calcul de médianes) sont documentés pour chaque source sur cette page.
Les mises à jour suivent le rythme de publication de chaque source : synchronisation quotidienne pour les DPE, semestrielle pour les transactions immobilières DVF, annuelle pour les budgets communaux et la démographie, triennale pour les bilans SRU. L'objectif est de fournir une vision fiable, actualisée et comparable de chaque commune française.