Alimentation d’un Data Lake en temps réel grâce à PostgreSQL et Debezium
Meetup PostgreSQL Lille
Gwendoline ROTROU, Julien RIOU
25 Janvier 2024
Speakers
Gwendoline ROTROU
Squad Lead Data Unit
gwendolinerotrou
Julien RIOU
Tech Lead Databases
https://julien.riou.xyz
@jriou
@hachyderm.io
Sommaire
Qui sommes-nous ?
Bases de données interne
Data Lake
ETL
CDC
Autre utilisations
La suite
Qui sommes-nous ?
Bases de données interne
Quelques chiffres
3
DBMS (MySQL, MongoDB, PostgreSQL)
7
infrastructures autonomes dans le monde entier
500+
serveurs
2000+
bases de données
100+
clusters
Environnements hautement sécurisés
Exemple de cluster
Environnement mutualisé
Besoin d’analyse
Recette
Stratégie de l’entreprise
KPIs
Détection de fraude
Consommation électrique
Exploitation des meta données (Jira)
Calcul du temps de travail pour le support
Mélange de workloads