Projet de base de données relationnelles

Ce projet consiste à construire et manipuler une base de données relationnelles avec un grand volume de données réelles provenant du site de l'INSEE. Nous avons modélisé et construit une base de données en 3FN pour gérer les régions, les départements et les villes françaises. Nous avons également importé la population de chaque commune depuis les séries historiques 2020 et les statistiques régionales et départementales sur les mariages en 2021.

Voici la version finale de notre schéma de base de données. Quelques modifications par rapport à la première version on était nécessaires pour le bon fonctionnement de notre projet:

Ajout de colonne année 2 dans la table statistiques_population pour gérer les intervalles
Modificatioe de la clef primaire de la table statistiques_population: au lieu de créer un ID on utilise année, godgeo et type statistique comme clef primaire
On a supprimé l'ancienne table mariage pour la remplacer par plusieurs tables à cause des variables types qui n'était et pas compatible
Créer 4 tables mariage: statistiques_mariage_mensuelle, statistiques_mariage_origine, statistiques_mariage_age, statistiques mariage_etat_matrimoniale

Prérequis

PostgreSQL
Python 3
Jupyter Notebook
Bibliothèque Python psycopg2

Installation

Installer PostgreSQL et créer une base de données vide.
Ouvrir le fichier rapport.ipynb dans Jupyter Notebook (et mettez à jour le fichier config.ini si nécessaire).
Utiliser le programme fourni pour importer les données dans la base de données PostgreSQL.

Utilisation

Le fichier rapport.ipynb contient toutes les commandes principales pour interroger la base de données et afficher les résultats de façon lisible et compréhensible. Les requêtes incluent :

Liste des départements d'une région donnée.
Liste des communes de plus de X habitants d'un département donné.
La région la plus/la moins peuplée.

Le fichier rapport.ipynb contient également des instructions pour créer des vues, des procédures stockées et des triggers pour automatiser les calculs de population et bloquer les modifications sur certaines tables. Il contient également des exemples de plans d'exécution et d'utilisation d'index pour optimiser les requêtes.

Contribution

Les contributions sont les bienvenues. Si vous souhaitez contribuer à ce projet, veuillez ouvrir une pull request.

Auteurs

[Théo Lavandier]
[Hamad Tria]

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
__pycache__		__pycache__
data		data
init_db		init_db
.gitignore		.gitignore
README.md		README.md
config.ini		config.ini
db.py		db.py
rapport.ipynb		rapport.ipynb
schema_bd_1.png		schema_bd_1.png
schema_bd_2.png		schema_bd_2.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet de base de données relationnelles

Prérequis

Installation

Utilisation

Contribution

Auteurs

About

Uh oh!

Contributors 2

Uh oh!

Languages

Hisqkq/INSEE-Database

Folders and files

Latest commit

History

Repository files navigation

Projet de base de données relationnelles

Prérequis

Installation

Utilisation

Contribution

Auteurs

About

Resources

Uh oh!

Stars

Watchers

Forks

Contributors 2

Uh oh!

Languages