Alimentation d’un Data Lake en temps réel grâce à PostgreSQL et Debezium

intro_logo

Meetup PostgreSQL Lille

Gwendoline ROTROU, Julien RIOU

25 Janvier 2024

Speakers

Gwendoline Rotrou
Julien Riou

Sommaire

  • Qui sommes-nous ?
  • Bases de données interne
  • Data Lake
  • ETL
  • CDC
  • Autre utilisations
  • La suite

Qui sommes-nous ?

OVHcloud logo OVHcloud univers

Bases de données interne

OVHcloud univers pointant vers PostgreSQL

Quelques chiffres

  • 3 DBMS (MySQL, MongoDB, PostgreSQL)
  • 7 infrastructures autonomes dans le monde entier
  • 500+ serveurs
  • 2000+ bases de données
  • 100+ clusters
  • Environnements hautement sécurisés

Exemple de cluster

cluster example

Environnement mutualisé

mutualized databases

Besoin d’analyse

  • Recette
  • Stratégie de l’entreprise
  • KPIs
  • Détection de fraude
  • Consommation électrique
  • Exploitation des meta données (Jira)
  • Calcul du temps de travail pour le support

Mélange de workloads