PLAY PODCASTS
Episode 18 : DuckDB et Apache Arrow

Episode 18 : DuckDB et Apache Arrow

DuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou

#DataOops · Romain Ferraton, Fabien Beaumont, Eric Duquesnoy

July 16, 202258m 56s

Audio is streamed directly from the publisher (dataoops.org) as published in their RSS feed. Play Podcasts does not host this file. Rights-holders can request removal through the copyright & takedown page.

Show Notes

DuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI.

Apache Arrow est un format pour la représentation colonnaire données analytiques et permet d'éviter la serialisation et la perte de temps associée.

The post Episode 18 : DuckDB et Apache Arrow appeared first on Dataoops : le podcast francophone sur la data et de devops.