L'introduction de ES|QL dans Elasticsearch facilite la recherche et l'analyse de grands jeux de données.\n\nES|QL présente ses résultats sous forme tabulaire en JSON, CSV et aussi au format Apache Arrow, un format de dataframe compact permettant des échanges sans désérialisation, qui est nativement supporté par la librairie Python Pandas.\n\nCette intégration ouvre de nouvelles perspectives pour l'exploration des données avec les outils habituels des data analysts, et l'intégration facile des pipelines d'aggrégation dans les applications.\n\nAprès un bref aperçu de ES|QL, nous ferons une exploration interactive d'un jeu de données avec ES|QL, Arrow et Pandas dans un notebook Jupyter. Et un petit benchmark vous montrera l'efficacité du format Arrow comparé à JSON !
talk-data.com
S
Speaker
Sylvain Wallez
1
talks
Speaker
Elastic
Par Sylvain Wallez, Elastic
Bio from: Meetup ElasticFR #98 - CLI & Arrow
Filter by Event / Source
Talks & appearances
1 activities · Newest first