talk-data.com
People (5 results)
See all 5 →Activities & events
| Title & Speakers | Event |
|---|---|
|
Postgres -> Iceberg: The Pipeline Everyone Thinks Is Boring (But Isn't) (EN)
2025-09-17 · 19:25
Yingjun Wu
– Speaker
@ RisingWave Labs
At first, streaming Postgres changes into Iceberg feels like a no-brainer. You spin up Debezium or Kafka Connect, point it at Iceberg, and it all looks boringly straightforward. The surprise comes once the pipeline hits production. Replication slots vanish and start filling up WAL space, LSNs don't line up and cause duplicates or gaps, and Iceberg sinks fail in ways that push back all the way to your primary database. Then you throw in schema changes, backfills, and compaction, and suddenly the \"boring\" pipeline becomes a source of late-night firefights. In this talk, I'll share real stories from running Postgres to Iceberg CDC pipelines in production. We'll look at the unexpected problems that show up, why they happen, and the strategies that actually helped keep things stable. If you've ever thought of Postgres -> Iceberg as just plumbing, this session will show you why it's not so boring after all. |
|
|
Escalader l'iceberg avec ClickHouse
2025-09-17 · 19:20
Melvyn Peignon
– Principal Product Manager
@ ClickHouse
En regardant certaines des premières pull requests dans le repository ClickHouse, vous verrez un fort accent mis sur l’intégration avec des systèmes externes. Au fil du temps, ClickHouse est devenu un puissant pont entre les data lakes et les data warehouses, prenant en charge les files d’attente, les bases de données et les object stores, avec une compatibilité pour plus de 60 formats d’entrée et de sortie. Cette polyvalence permet aux utilisateurs de bénéficier de la flexibilité d’un data lake tout en conservant les performances de requêtes en temps réel. Dans cette session, nous discuterons de la manière dont nos utilisateurs exploitent ClickHouse et Iceberg, ainsi que de certaines fonctionnalités en cours de développement pour faciliter cette mouvance. |
|
|
Nouveautés et tout ce que vous ne savez pas sur le connecteur Trino pour Apache Iceberg
2025-09-17 · 18:15
Victor Coustenoble
– Staff Solution Architect and SEMEA Team Lead
@ Starburst
Plongez au cœur du connecteur Trino pour Apache Iceberg ! Au-delà des bases, nous vous invitons à découvrir les dernières nouveautés et les fonctionnalités les plus avancées. À travers des démonstrations en direct, nous explorerons des sujets clés : La gestion des branches et des tags liés aux instantanés (snapshots). Les options de maintenance pour vos tables Iceberg. Le support étendu des métastores (catalogues). Ce talk est l'occasion de maîtriser des aspects souvent méconnus pour optimiser vos tables Iceberg avec Trino. |
|
|
Zoom détaillé sur les projets Apache Iceberg et Trino
2025-07-11 · 09:00
Victor Coustenoble
– Staff Solution Architect and SEMEA Team Lead
@ Starburst
Zoom détaillé sur les projets Apache Iceberg et Trino avec Julien Thiaw-Kine et Victor Coustenoble. Tour d'horizon, les acteurs, les promesses et pourquoi la combinaison Iceberg et Trino a du sens. La séparation du compute et du storage avec Iceberg change la façon dont on pense les architectures data. L'approche multi-engine permet de traiter tout type de workload en utilisant le moteur adéquat. Cas d'usage et retour d'expérience de l'utilisation de Iceberg & Trino chez OVHcloud. |
|
|
AI Lakehouse: étendre les fonctionnalités d'une plateforme composable
2025-07-11 · 09:00
Comment étendre les fonctionnalités d'une plateforme composable pour créer un AI Lakehouse, supporter des applications d'IA batch et temps réel en production, gérer les LLMs tout en assurant la gouvernance et la sécurité des données. Au travers d'exemples concrets comme la conception d'un système de recommandation style TikTok, Lex Avstreikh débat d'une vision d'avenir et de la façon dont les plateformes data doivent évoluer pour répondre aux exigences croissantes de l'ère AI. |
|
|
A quoi ressemble une plateforme data idéale ?
2025-07-11 · 09:00
Olivier HUBER
– Senior Partner Solution Architect
@ Aiven
Replay du meetup OVHcloud & Aiven du 3 avril 2025. Stéphane Ligneul, Olivier Huber & Stéphane Heckel démarrent la première session de discussion autour de trois principes clés d'une plateforme data: composabilité, portabilité et programmabilité. Exploration de l'architecture multi-engines intégrant des moteurs de traitement modulaires et des OTFs (open table format). Combinaison des infrastructures cloud, on-prem et hybrides pour une stratégie de données portable et souveraine. Automatisation des plateformes et maîtrise des coûts. Autant de questions que nous allons couvrir lors de ce premier échange. |
|
|
Nous avons le plaisir de nous retrouver dans les nouveaux locaux d'OVHcloud ( 42 Av. de la Prte de Clichy, 75017 Paris ) le jeudi 3 avril 2025 dès 18h00 pour le prochain meetup Modern Data Stack sur le thème des plateformes data, et nous remercions les sociétés OVHcloud et aiven qui sponsorisent cet événement. A quoi ressemble une plateforme data idéale ? Inscription définitive à cet événement via le site OVHcloud : https://evdr.co/meet-up-data 👉 On démarre à 18h30. Discussion avec Stéphane Ligneul, Olivier Huber & Stéphane Heckel autour de trois principes clés : composabilité, portabilité et programmabilité d'une plateforme data. Exploration de l'architecture multi-engines intégrant des moteurs de traitement modulaires et des OTFs (open table format). Combinaison des infrastructures cloud, on-prem et hybrides pour une stratégie de données portable et souveraine. Automatisation des plateformes et maîtrise des coûts. Autant de questions que nous allons couvrir lors de ce premier échange. 👉 On enchaine vers 19h00 en faisant un zoom plus détaillé sur les projets Apache Iceberg et Trino avec Julien Thiaw Kine et Victor Coustenoble. Tour d'horizon, les acteurs, les promesses et pourquoi la combinaison Iceberg et Trino a du sens. La séparation du compute et du storage avec Iceberg change la façon dont on pense les architectures data. L'approche multi-engine permet de traiter tout type de workload en utilisant le moteur adéquat. Cas d'usage et retour d'expérience Iceberg & Trino.. 👉 19h30. On termine avec Lex Avstreikh. Comment étendre les fonctionnalités d'une plateforme composable pour créer un Lakehouse AI, supporter des applications d'IA batch et temps réel en production, gérer les LLMs tout en assurant la gouvernance et la sécurité des données ? Au travers d'exemples concrets comme la conception d'un système de recommandation style TikTok, on débat d'une vision d'avenir et de la façon dont les plateformes data doivent évoluer pour répondre aux exigences croissantes de l'ère AI. 👉 De 20h00 à 21h00 drinks & causeries au coin de la DATA (merci à nos sponsors OVHcloud et aiven). Renseignements : stephane (at) datanosco.com Vous souhaitez participer ? Merci de laisser un commentaire ou un like sur le post d'invitation LinkedIn pour soutenir l'initiative ! Inscription définitive à cet événement via le site OVHcloud : https://evdr.co/meet-up-data A savoir, clôture des inscriptions 24h avant l'événement. Une carte d'identité vous sera demandée à l'entrée. |
Construire la plateforme DATA idéale avec OVHcloud, aiven, Starburst, Hopsworks
|
|
TEST / REPLAY - Apache Iceberg, un nouveau standard ?
2024-03-25 · 10:30
REPLAY - Apache Iceberg\, un nouveau standard ? Présentation de la techno Apache Iceberg, replay de l'interview de Victor Coustenoble (environ 35mn). REMARQUE : cet événement ONLINE est un premier test de retransmission sur LinkedIn Live Event d'un contenu préenregistré. Nous serons cependant connectés avec vous pour évaluer la qualité du système de retransmission, sa facilité d'utilisation et tester le système de questions/réponses. Le lien de diffusion sur LinkedIn s'affichera une fois enregistré au meetup. Ca reste un live avec tous les aléas possibles ;-)). à propos de Iceberg Iceberg is a high-performance format for huge analytic tables. Iceberg brings the reliability and simplicity of SQL tables to big data, while making it possible for engines like Spark, Trino, Flink, Presto, Hive and Impala to safely work with the same tables, at the same time. |
TEST / REPLAY - Apache Iceberg, un nouveau standard ?
|