talk-data.com talk-data.com

Topic

ClickHouse

columnar_database big_data analytics database data_warehouse olap realtime

4

tagged

Activity Trend

17 peak/qtr
2020-Q1 2026-Q1

Activities

Showing filtered results

Filtering by: Melvyn Peignon ×

ClickHouse est conçu pour l’analytique à très grande échelle — qu’il s’agisse d’observabilité, de data warehousing ou de traitements en temps réel — tout en garantissant une latence ultra-faible. Dans cette démo, nous construirons un pipeline complet capable d’ingérer des millions d’événements par seconde — logs, métriques ou données applicatives — et de les stocker efficacement dans ClickHouse. Vous découvrirez comment modéliser des données massives, utiliser des vues matérialisées pour accélérer les agrégations, appliquer des filtres complexes à la volée, ainsi que définir des index pour optimiser les performances de vos requêtes.

Dans un monde où les volumes de données explosent et où les attentes en matière de performance analytique ne cessent de croître, construire une base de données réellement adaptée aux workloads modernes est un défi technique de taille. ClickHouse est une base de données open source orientée colonnes, conçue pour exécuter des requêtes analytiques en temps réel sur des milliards de lignes — avec une latence de l’ordre de la milliseconde.

Dans cette session technique, nous explorerons les choix architecturaux qui rendent cela possible : exécution vectorisée, stockage optimisé, traitement distribué, vues matérialisées et plus encore. Nous détaillerons aussi comment nous faisons évoluer ClickHouse au cœur de l’écosystème moderne de la donnée (cloud, IA, iceberg, observabilité) tout en restant fidèle à ses principes de performance et de simplicité.

Une plongée dans les coulisses d’un moteur analytique open source — pour répondre aux besoins d’aujourd’hui, et anticiper ceux de demain.

En regardant certaines des premières pull requests dans le repository ClickHouse, vous verrez un fort accent mis sur l’intégration avec des systèmes externes. Au fil du temps, ClickHouse est devenu un puissant pont entre les data lakes et les data warehouses, prenant en charge les files d’attente, les bases de données et les object stores, avec une compatibilité pour plus de 60 formats d’entrée et de sortie. Cette polyvalence permet aux utilisateurs de bénéficier de la flexibilité d’un data lake tout en conservant les performances de requêtes en temps réel.

Dans cette session, nous discuterons de la manière dont nos utilisateurs exploitent ClickHouse et Iceberg, ainsi que de certaines fonctionnalités en cours de développement pour faciliter cette mouvance.

ClickHouse and Databricks for Real-Time Analytics

ClickHouse is a C++ based, column-oriented database built for real-time analytics. While it has its own internal storage format, the rise of open lakehouse architectures has created a growing need for seamless interoperability. In response, we have developed integrations with your favorite lakehouse ecosystem to enhance compatibility, performance and governance. From integrating with Unity Catalog to embedding the Delta Kernel into ClickHouse, this session will explore the key design considerations behind these integrations, their benefits to the community, the lessons learned and future opportunities for improved compatibility and seamless integration.