talk-data.com talk-data.com

Topic

jupyter notebook

7

tagged

Activity Trend

1 peak/qtr
2020-Q1 2026-Q1

Activities

7 activities · Newest first

L'introduction de ES|QL dans Elasticsearch facilite la recherche et l'analyse de grands jeux de données.\n\nES|QL présente ses résultats sous forme tabulaire en JSON, CSV et aussi au format Apache Arrow, un format de dataframe compact permettant des échanges sans désérialisation, qui est nativement supporté par la librairie Python Pandas.\n\nCette intégration ouvre de nouvelles perspectives pour l'exploration des données avec les outils habituels des data analysts, et l'intégration facile des pipelines d'aggrégation dans les applications.\n\nAprès un bref aperçu de ES|QL, nous ferons une exploration interactive d'un jeu de données avec ES|QL, Arrow et Pandas dans un notebook Jupyter. Et un petit benchmark vous montrera l'efficacité du format Arrow comparé à JSON !

Hands-on workshop on building a search engine from scratch, focusing on text search and vector search. Topics include in-memory text search, tokenization and preprocessing, inverted index construction, embeddings, converting text to vectors, cosine similarity, and strategies to combine text and vector search. The session includes practical coding in a Jupyter Notebook using Python to implement both text and vector search approaches.

Workshop led by Alexey Grigorev on building a chatbot using large language models with Python. Topics include data extraction from FAQs, knowledge base indexing, chatbot setup in a Jupyter Notebook, interfacing with LLMs, and implementing Retrieval-Augmented Generation (RAG).

Atelier en ligne présentant les bases de la programmation en Python et l’analyse de données avec Jupyter Notebook et Pandas, en utilisant les jeux de données Airbnb. L’atelier couvre les bases de Python, les bases de Pandas, la visualisation de données et comment sourcer et analyser les jeux de données Airbnb. Accès à la plateforme d'apprentissage du Wagon à l’issue du cours.