Skip to content

Modélisation et déploiement d'une base de donnée PostgreSQL sur des données de l'INSEE.

Notifications You must be signed in to change notification settings

Hisqkq/INSEE-Database

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

36 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projet de base de données relationnelles

Ce projet consiste à construire et manipuler une base de données relationnelles avec un grand volume de données réelles provenant du site de l'INSEE. Nous avons modélisé et construit une base de données en 3FN pour gérer les régions, les départements et les villes françaises. Nous avons également importé la population de chaque commune depuis les séries historiques 2020 et les statistiques régionales et départementales sur les mariages en 2021.

Schema de la base de données

Voici la version finale de notre schéma de base de données. Quelques modifications par rapport à la première version on était nécessaires pour le bon fonctionnement de notre projet:

  1. Ajout de colonne année 2 dans la table statistiques_population pour gérer les intervalles
  2. Modificatioe de la clef primaire de la table statistiques_population: au lieu de créer un ID on utilise année, godgeo et type statistique comme clef primaire
  3. On a supprimé l'ancienne table mariage pour la remplacer par plusieurs tables à cause des variables types qui n'était et pas compatible
  4. Créer 4 tables mariage: statistiques_mariage_mensuelle, statistiques_mariage_origine, statistiques_mariage_age, statistiques mariage_etat_matrimoniale

Prérequis

  • PostgreSQL
  • Python 3
  • Jupyter Notebook
  • Bibliothèque Python psycopg2

Installation

  1. Installer PostgreSQL et créer une base de données vide.
  2. Ouvrir le fichier rapport.ipynb dans Jupyter Notebook (et mettez à jour le fichier config.ini si nécessaire).
  3. Utiliser le programme fourni pour importer les données dans la base de données PostgreSQL.

Utilisation

Le fichier rapport.ipynb contient toutes les commandes principales pour interroger la base de données et afficher les résultats de façon lisible et compréhensible. Les requêtes incluent :

  • Liste des départements d'une région donnée.
  • Liste des communes de plus de X habitants d'un département donné.
  • La région la plus/la moins peuplée.

Le fichier rapport.ipynb contient également des instructions pour créer des vues, des procédures stockées et des triggers pour automatiser les calculs de population et bloquer les modifications sur certaines tables. Il contient également des exemples de plans d'exécution et d'utilisation d'index pour optimiser les requêtes.

Contribution

Les contributions sont les bienvenues. Si vous souhaitez contribuer à ce projet, veuillez ouvrir une pull request.

Auteurs

  • [Théo Lavandier]
  • [Hamad Tria]

About

Modélisation et déploiement d'une base de donnée PostgreSQL sur des données de l'INSEE.

Resources

Stars

Watchers

Forks

Contributors 2

  •  
  •