talk-data.com talk-data.com

Filter by Source

Select conferences and events

People (5 results)

See all 5 →
Showing 8 results

Activities & events

Title & Speakers Event
Yingjun Wu – Speaker @ RisingWave Labs

At first, streaming Postgres changes into Iceberg feels like a no-brainer. You spin up Debezium or Kafka Connect, point it at Iceberg, and it all looks boringly straightforward. The surprise comes once the pipeline hits production. Replication slots vanish and start filling up WAL space, LSNs don't line up and cause duplicates or gaps, and Iceberg sinks fail in ways that push back all the way to your primary database. Then you throw in schema changes, backfills, and compaction, and suddenly the \"boring\" pipeline becomes a source of late-night firefights. In this talk, I'll share real stories from running Postgres to Iceberg CDC pipelines in production. We'll look at the unexpected problems that show up, why they happen, and the strategies that actually helped keep things stable. If you've ever thought of Postgres -> Iceberg as just plumbing, this session will show you why it's not so boring after all.

postgresql Iceberg
Melvyn Peignon – Principal Product Manager @ ClickHouse

En regardant certaines des premières pull requests dans le repository ClickHouse, vous verrez un fort accent mis sur l’intégration avec des systèmes externes. Au fil du temps, ClickHouse est devenu un puissant pont entre les data lakes et les data warehouses, prenant en charge les files d’attente, les bases de données et les object stores, avec une compatibilité pour plus de 60 formats d’entrée et de sortie. Cette polyvalence permet aux utilisateurs de bénéficier de la flexibilité d’un data lake tout en conservant les performances de requêtes en temps réel.

Dans cette session, nous discuterons de la manière dont nos utilisateurs exploitent ClickHouse et Iceberg, ainsi que de certaines fonctionnalités en cours de développement pour faciliter cette mouvance.

ClickHouse Iceberg
Victor Coustenoble – Staff Solution Architect and SEMEA Team Lead @ Starburst

Plongez au cœur du connecteur Trino pour Apache Iceberg ! Au-delà des bases, nous vous invitons à découvrir les dernières nouveautés et les fonctionnalités les plus avancées. À travers des démonstrations en direct, nous explorerons des sujets clés : La gestion des branches et des tags liés aux instantanés (snapshots). Les options de maintenance pour vos tables Iceberg. Le support étendu des métastores (catalogues). Ce talk est l'occasion de maîtriser des aspects souvent méconnus pour optimiser vos tables Iceberg avec Trino.

Trino apache iceberg
Victor Coustenoble – Staff Solution Architect and SEMEA Team Lead @ Starburst

Zoom détaillé sur les projets Apache Iceberg et Trino avec Julien Thiaw-Kine et Victor Coustenoble. Tour d'horizon, les acteurs, les promesses et pourquoi la combinaison Iceberg et Trino a du sens. La séparation du compute et du storage avec Iceberg change la façon dont on pense les architectures data. L'approche multi-engine permet de traiter tout type de workload en utilisant le moteur adéquat. Cas d'usage et retour d'expérience de l'utilisation de Iceberg & Trino chez OVHcloud.

apache iceberg Trino multi-engine architecture

Comment étendre les fonctionnalités d'une plateforme composable pour créer un AI Lakehouse, supporter des applications d'IA batch et temps réel en production, gérer les LLMs tout en assurant la gouvernance et la sécurité des données. Au travers d'exemples concrets comme la conception d'un système de recommandation style TikTok, Lex Avstreikh débat d'une vision d'avenir et de la façon dont les plateformes data doivent évoluer pour répondre aux exigences croissantes de l'ère AI.

ai lakehouse llms gouvernance des donnu00e9es su00e9curitu00e9 des donnu00e9es
Olivier HUBER – Senior Partner Solution Architect @ Aiven

Replay du meetup OVHcloud & Aiven du 3 avril 2025. Stéphane Ligneul, Olivier Huber & Stéphane Heckel démarrent la première session de discussion autour de trois principes clés d'une plateforme data: composabilité, portabilité et programmabilité. Exploration de l'architecture multi-engines intégrant des moteurs de traitement modulaires et des OTFs (open table format). Combinaison des infrastructures cloud, on-prem et hybrides pour une stratégie de données portable et souveraine. Automatisation des plateformes et maîtrise des coûts. Autant de questions que nous allons couvrir lors de ce premier échange.

open table format (otf) multi-engine architecture

Nous avons le plaisir de nous retrouver dans les nouveaux locaux d'OVHcloud ( 42 Av. de la Prte de Clichy, 75017 Paris ) le jeudi 3 avril 2025 dès 18h00 pour le prochain meetup Modern Data Stack sur le thème des plateformes data, et nous remercions les sociétés OVHcloud et aiven qui sponsorisent cet événement.

A quoi ressemble une plateforme data idéale ?

Inscription définitive à cet événement via le site OVHcloud : https://evdr.co/meet-up-data

👉 On démarre à 18h30. Discussion avec Stéphane Ligneul, Olivier Huber & Stéphane Heckel autour de trois principes clés : composabilité, portabilité et programmabilité d'une plateforme data. Exploration de l'architecture multi-engines intégrant des moteurs de traitement modulaires et des OTFs (open table format). Combinaison des infrastructures cloud, on-prem et hybrides pour une stratégie de données portable et souveraine. Automatisation des plateformes et maîtrise des coûts. Autant de questions que nous allons couvrir lors de ce premier échange.

👉 On enchaine vers 19h00 en faisant un zoom plus détaillé sur les projets Apache Iceberg et Trino avec Julien Thiaw Kine et Victor Coustenoble. Tour d'horizon, les acteurs, les promesses et pourquoi la combinaison Iceberg et Trino a du sens. La séparation du compute et du storage avec Iceberg change la façon dont on pense les architectures data. L'approche multi-engine permet de traiter tout type de workload en utilisant le moteur adéquat. Cas d'usage et retour d'expérience Iceberg & Trino..

👉 19h30. On termine avec Lex Avstreikh. Comment étendre les fonctionnalités d'une plateforme composable pour créer un Lakehouse AI, supporter des applications d'IA batch et temps réel en production, gérer les LLMs tout en assurant la gouvernance et la sécurité des données ? Au travers d'exemples concrets comme la conception d'un système de recommandation style TikTok, on débat d'une vision d'avenir et de la façon dont les plateformes data doivent évoluer pour répondre aux exigences croissantes de l'ère AI.

👉 De 20h00 à 21h00 drinks & causeries au coin de la DATA (merci à nos sponsors OVHcloud et aiven).

Renseignements : stephane (at) datanosco.com

Vous souhaitez participer ? Merci de laisser un commentaire ou un like sur le post d'invitation LinkedIn pour soutenir l'initiative !

Inscription définitive à cet événement via le site OVHcloud : https://evdr.co/meet-up-data

A savoir, clôture des inscriptions 24h avant l'événement. Une carte d'identité vous sera demandée à l'entrée.

Construire la plateforme DATA idéale avec OVHcloud, aiven, Starburst, Hopsworks

REPLAY - Apache Iceberg\, un nouveau standard ? Présentation de la techno Apache Iceberg, replay de l'interview de Victor Coustenoble (environ 35mn).

REMARQUE : cet événement ONLINE est un premier test de retransmission sur LinkedIn Live Event d'un contenu préenregistré. Nous serons cependant connectés avec vous pour évaluer la qualité du système de retransmission, sa facilité d'utilisation et tester le système de questions/réponses.

Le lien de diffusion sur LinkedIn s'affichera une fois enregistré au meetup. Ca reste un live avec tous les aléas possibles ;-)).

à propos de Iceberg Iceberg is a high-performance format for huge analytic tables. Iceberg brings the reliability and simplicity of SQL tables to big data, while making it possible for engines like Spark, Trino, Flink, Presto, Hive and Impala to safely work with the same tables, at the same time.

TEST / REPLAY - Apache Iceberg, un nouveau standard ?
Showing 8 results