
Database
savoir-faire et compétences réunies autour des sujets données et databases
Romain Ferraton · Dataoops : le podcast sur la data et de devops
Show overview
Database has been publishing since 2022, and across the 3 years since has built a catalogue of 47 episodes. That works out to roughly 40 hours of audio in total. Releases follow a monthly cadence.
Episodes typically run an hour to ninety minutes. None of the episodes are flagged explicit by the publisher. It is catalogued as a FR-FR-language Technology show.
There hasn’t been a new episode in the last ninety days; the most recent episode landed 6 months ago. The busiest year was 2022, with 20 episodes published. Published by Dataoops : le podcast sur la data et de devops.
From the publisher
savoir-faire et compétences réunies autour des sujets données et devops
Latest Episodes
View all 47 episodes
Episode 58 : SQL Server 2025 et AI_GENERATE_EMBEDDINGS / MCP PowerBI
Episode timeline The post Episode 58 : SQL Server 2025 et AI_GENERATE_EMBEDDINGS / MCP PowerBI appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 52 : Iceberg et Delta, Migration de bases de données, Evidence.dev : Reports as Code
Episode timeline The post Episode 52 : Iceberg et Delta, Migration de bases de données, Evidence.dev : Reports as Code appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 51 : DuckDB v1.1 vs PostgreSQL v17 / SQL en difficulté
Episode timeline The post Episode 51 : DuckDB v1.1 vs PostgreSQL v17 / SQL en difficulté appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 50 : Performance d’un stockage physique récent | L’audit de sécurité dans SQL Server et PostgreSQL | Stockage objet
Dans cet épisode ont parle de Performance d'un stockage physique recent et la comparaison avec ce que l'on peut avoir sur du cloud public. De l'audit de sécurité dans SQL Server et PostgreSQL. Du stockage objet (S3 et Ceph), Cloud (ou pas) The post Episode 50 : Performance d’un stockage physique récent | L’audit de sécurité dans SQL Server et PostgreSQL | Stockage objet appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 49 : Migration de données et collations, Cas d’utilisations d’IA, DevOx
On parle : Migration/Transfert de données inter-databases et les problématiques de collations associées. Puis discussions sur les collations : performances, impacts Un REX sur un dataoops sur les datatypes text/varchar entre postgresqle et mssql Les grands cas d'usage IA : détection DevOx : retour d'Adrien sur ce qui lui a plus : Alto et Park et l'AGC (Appolo Guidance Computer : ou la programmation sous contraintes 😀 ) The post Episode 49 : Migration de données et collations, Cas d’utilisations d’IA, DevOx appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 48 : Indexation – PostgreSQL vs MSSQL vs Oracle
On parle indexation dans les bases de données relationnelles et en particulier PostgreSQL, MSSQL et Oracle : index Btree, GIN, GIST, partiel ou filtré, couvrant, columnstore, FullText, Spatial, BRIN, Bitmap... Une heure de comparaison entre les 3 grands SGBDR The post Episode 48 : Indexation – PostgreSQL vs MSSQL vs Oracle appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 47 : PostgreSQL : MVCC et Vacuum – PowerBI : Analyser les performances – Modélisation One Big Table et le stockage colonne à la rescousse – Détection d’anti-pattern dans MSSQL
Retour pgday Paris. PostgreSQL : MVCC et Vacuum. PowerBI : Analyser les performances et quelques conseils pour les optimiser. OBT : modélisation One Big Table et le stockage colonne à la rescousse. Clause Non-Sargable et détection d'anti-pattern avec les extended events sur MSSQL The post Episode 47 : PostgreSQL : MVCC et Vacuum – PowerBI : Analyser les performances – Modélisation One Big Table et le stockage colonne à la rescousse – Détection d’anti-pattern dans MSSQL appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 46 : Adrien Nayrat nous rejoint pour parler postgresql – DuckDB v0.10 – C/C++ bannis par les USA ?
Adrien Nayrat un spécialiste postgresql rejoint l'équipe Dataoops, il se présente et en profite pour nous rappeler l'histoire de postgresql et glisser quelques conseils sur les extensions. La deuxième partie concerne DuckDB et les nouveautés de la v0.10 ainsi que des remarques sur une nouvelle concernant les languages C/C++ considérés comme "à risques" par l'administration américaine. The post Episode 46 : Adrien Nayrat nous rejoint pour parler postgresql – DuckDB v0.10 – C/C++ bannis par les USA ? appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 45 : Chargement massif 1 Milliard de lignes dans un columnstore SQL Server en 6min, DuckDB v0.10, MS Fabrics et Vacuum
Comment accélérer un chargement massif dans un columnstore sur SQL Server : un retour d'expérience approfondi avec 1 milliard de lignes chargé en 6 minutes. DuckDB passe en v0.10 et stabilise son stockage. MS Fabric annonce que le Vacuum sera bientot possible et voici pourquoi c'est une bonne chose... The post Episode 45 : Chargement massif 1 Milliard de lignes dans un columnstore SQL Server en 6min, DuckDB v0.10, MS Fabrics et Vacuum appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouse
Episode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomous The post Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouse appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous db
Episode timeline The post Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous db appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 40 – Microsoft Fabric passe en GA
Microsoft Fabric passe en GA : on en parle The post Episode 40 – Microsoft Fabric passe en GA appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging Face
Une interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA. The post Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging Face appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodage
Partie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en général The post Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodage appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernance
Episode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique. The post Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernance appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 36 : les tendances des bases de données / Une formation Databricks testée / DB Vectorielles : les points importants
Databricks : formation en ligne gratuite et aparté Delta Lake 3.0. Oracle DB : un dashboard sur les features et innovation depuis la 11.2 avec 1608 features. Les tendances des bases de données (Relationnelles et NoSQL). Les bases de données vectorielles : qu'est ce qui les différencie et les points importants pour les choisir. The post Episode 36 : les tendances des bases de données / Une formation Databricks testée / DB Vectorielles : les points importants appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 35 : SQL invulnérable / Microsoft DataFabric
SQL : un language incontournable dans le traitement des données. On en parle avec une approche historique, les dialectes et les nouvelles approches qui rendent ce language plus vivant que jamais. Dans la deuxième partie de l'épisode on vous parle de Microsoft DataFabric : où en est-on avec ce nouveau service orienté données proposé par Microsoft. The post Episode 35 : SQL invulnérable / Microsoft DataFabric appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 34 : DataLakeHouse et architecture médaillon / Nouveautés d’Oracle Database 23c
DataLakehouse et Architecture Médaillon. Les nouveautés d'Oracle Database 23c The post Episode 34 : DataLakeHouse et architecture médaillon / Nouveautés d’Oracle Database 23c appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2
Dans cette épisode on parle d'un essai d'implémentation de recherche sémantique et vectorielle avec SQL Server. Dans la seconde partie : Approfondissement de Microsoft Fabric. The post Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2 appeared first on Dataoops : le podcast francophone sur la data et de devops.

Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAs
Microsoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accélérées les bases de données vectorielles ont le vent en poupe. Mais on peut aussi faire ce type de recherche semantique avec des bases classiques comme postgresql avec une extension (pgvector) voir même avec sql server, oracle ou n'importe quelle base de données relationnelles en faisant des calculs de distances. Ce qui manquera toutefois à ces bases non-spécialisées : des index adaptées aux vecteurs. The post Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAs appeared first on Dataoops : le podcast francophone sur la data et de devops.