Player FM - Internet Radio Done Right
Checked 10d ago
Agregado hace dos años
Contenido proporcionado por Dataoops : le podcast sur la data et de devops, Romain Ferraton, Fabien Beaumont, and Eric Duquesnoy. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Dataoops : le podcast sur la data et de devops, Romain Ferraton, Fabien Beaumont, and Eric Duquesnoy o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Player FM : aplicación de podcast
¡Desconecta con la aplicación Player FM !
¡Desconecta con la aplicación Player FM !
Podcasts que vale la pena escuchar
PATROCINADO
Jay is more than just the host of All About Change podcast. He is a lawyer and international activist, who has focused his life’s work on seeking social justice by advocating for the rights of people with disabilities worldwide. On the special episode of All About Change, Mijon Zulu, the managing producer of the "All About Change" podcast, is taking over hosting duties to interview Jay Ruderman about his new book, his activist journey, and why activism is even more important today. Episode Chapters (0:00) intro (02:38) How does one choose a cause to go after? (03:33) Jay’s path to activism (07:50) Practical steps a new activist can take (09:24) Confrontation vs trolling (17:36) Learning from activists operating in different sectors (19:20) Resilience in activism (22:24) Reflections on Find Your Fight and goodbye For video episodes, watch on www.youtube.com/@therudermanfamilyfoundation Stay in touch: X: @JayRuderman | @RudermanFdn LinkedIn: Jay Ruderman | Ruderman Family Foundation Instagram: All About Change Podcast | Ruderman Family Foundation To learn more about the podcast, visit https://allaboutchangepodcast.com/ Looking for more insights into the world of activism? Be sure to check out Jay’s brand new book, Find Your Fight , in which Jay teaches the next generation of activists and advocates how to step up and bring about lasting change. You can find Find Your Fight wherever you buy your books, and you can learn more about it at www.jayruderman.com .…
Episode 10 : DataHub & Strategie Data
Manage episode 396312693 series 3512982
Contenido proporcionado por Dataoops : le podcast sur la data et de devops, Romain Ferraton, Fabien Beaumont, and Eric Duquesnoy. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Dataoops : le podcast sur la data et de devops, Romain Ferraton, Fabien Beaumont, and Eric Duquesnoy o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Datahub : définition(s) et approche. Data stratégie : comment mieux intégrer et gérer la données dans l'entreprise
…
continue reading
50 episodios
Manage episode 396312693 series 3512982
Contenido proporcionado por Dataoops : le podcast sur la data et de devops, Romain Ferraton, Fabien Beaumont, and Eric Duquesnoy. Todo el contenido del podcast, incluidos episodios, gráficos y descripciones de podcast, lo carga y proporciona directamente Dataoops : le podcast sur la data et de devops, Romain Ferraton, Fabien Beaumont, and Eric Duquesnoy o su socio de plataforma de podcast. Si cree que alguien está utilizando su trabajo protegido por derechos de autor sin su permiso, puede seguir el proceso descrito aquí https://es.player.fm/legal.
Datahub : définition(s) et approche. Data stratégie : comment mieux intégrer et gérer la données dans l'entreprise
…
continue reading
50 episodios
Todos los episodios
×
1 Episode 54 : des nouvelles de DuckDB, des vecteurs chez les principales databases, no/low-code vs code 1:00:11
1:00:11
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:00:11
Des nouvelles de DuckDB avec l'interface graphique DuckDB UI, Les vecteurs dans les principales bases de données relationnelles comme Oracle, SQL Server ou PostgreSQL et comment fabriquer ses embeddings. Enfin une discussion sur les avantages et inconvénients entre la solution NO/Low Code et le Code de l'intégration à la BI…
Episode timeline

1 Episode 52 : Iceberg et Delta, Migration de bases de données, Evidence.dev : Reports as Code 52:17
Episode timeline

1 Episode 51 : DuckDB v1.1 vs PostgreSQL v17 / SQL en difficulté 1:04:10
1:04:10
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:04:10
Episode timeline

1 Episode 50 : Performance d’un stockage physique récent | L’audit de sécurité dans SQL Server et PostgreSQL | Stockage objet
Dans cet épisode ont parle de Performance d'un stockage physique recent et la comparaison avec ce que l'on peut avoir sur du cloud public. De l'audit de sécurité dans SQL Server et PostgreSQL. Du stockage objet (S3 et Ceph), Cloud (ou pas)
On parle : Migration/Transfert de données inter-databases et les problématiques de collations associées. Puis discussions sur les collations : performances, impacts Un REX sur un dataoops sur les datatypes text/varchar entre postgresqle et mssql Les grands cas d'usage IA : détection DevOx : retour d'Adrien sur ce qui lui a plus : Alto et Park et l'AGC (Appolo Guidance Computer : ou la programmation sous contraintes 😀 )…
On parle indexation dans les bases de données relationnelles et en particulier PostgreSQL, MSSQL et Oracle : index Btree, GIN, GIST, partiel ou filtré, couvrant, columnstore, FullText, Spatial, BRIN, Bitmap... Une heure de comparaison entre les 3 grands SGBDR

1 Episode 47 : PostgreSQL : MVCC et Vacuum – PowerBI : Analyser les performances – Modélisation One Big Table et le stockage colonne à la rescousse – Détection d’anti-pattern dans MSSQL
Retour pgday Paris. PostgreSQL : MVCC et Vacuum. PowerBI : Analyser les performances et quelques conseils pour les optimiser. OBT : modélisation One Big Table et le stockage colonne à la rescousse. Clause Non-Sargable et détection d'anti-pattern avec les extended events sur MSSQL

1 Episode 46 : Adrien Nayrat nous rejoint pour parler postgresql – DuckDB v0.10 – C/C++ bannis par les USA ?
Adrien Nayrat un spécialiste postgresql rejoint l'équipe Dataoops, il se présente et en profite pour nous rappeler l'histoire de postgresql et glisser quelques conseils sur les extensions. La deuxième partie concerne DuckDB et les nouveautés de la v0.10 ainsi que des remarques sur une nouvelle concernant les languages C/C++ considérés comme "à risques" par l'administration américaine.…

1 Episode 45 : Chargement massif 1 Milliard de lignes dans un columnstore SQL Server en 6min, DuckDB v0.10, MS Fabrics et Vacuum 1:07:09
1:07:09
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:07:09
Comment accélérer un chargement massif dans un columnstore sur SQL Server : un retour d'expérience approfondi avec 1 milliard de lignes chargé en 6 minutes. DuckDB passe en v0.10 et stabilise son stockage. MS Fabric annonce que le Vacuum sera bientot possible et voici pourquoi c'est une bonne chose...…

1 Episode 44 : REX dataoops modélisation et postgresql performance, DuckDB stars, MS Fabric ratio prix/performance 1:06:09
1:06:09
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:06:09
REX sur des erreurs de modélisation avec des vues trop imbriquées, performance postgresql windows vs linux. DuckDB une star sur Github qui rejoint Postgresql. MS Fabric des prix d'appel pour les entreprises avec un ratio prix/performance attractif.

1 Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouse 1:02:01
1:02:01
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:02:01
Episode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomous

1 Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous db
Episode timeline
Onyxia est une UX open source pour mettre en place un datalab avec des services basés sur des containers et orchestrés par K8s. Minio pour le stockage, Keycloak et Vault pour la sécurité s'intègre parfaitement. Cette solution est mise en oeuvre à l'INSEE avec le datalab SSP et Frederic Comte, Architecte Data à l'INSEE nous en explique les fondements et les avantages.…

1 Episode 40 – Microsoft Fabric passe en GA 1:07:10
1:07:10
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:07:10
Microsoft Fabric passe en GA : on en parle

1 Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging Face 1:05:28
1:05:28
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:05:28
Une interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA.

1 Episode 38 : PowerBI et Couche Sémantique – Databases et Comptage Approximatif – Parquet méthode d’encodage 57:09
Partie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en général

1 Episode 37 : Oracle Data Cartbidge, SQL Server Minimal Logging, Parquet et tri des données, Database of Databases Dashboard, DataGouvernance 1:06:43
1:06:43
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:06:43
Episode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique.…

1 Episode 36 : les tendances des bases de données / Une formation Databricks testée / DB Vectorielles : les points importants 1:08:06
1:08:06
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:08:06
Databricks : formation en ligne gratuite et aparté Delta Lake 3.0. Oracle DB : un dashboard sur les features et innovation depuis la 11.2 avec 1608 features. Les tendances des bases de données (Relationnelles et NoSQL). Les bases de données vectorielles : qu'est ce qui les différencie et les points importants pour les choisir.…

1 Episode 35 : SQL invulnérable / Microsoft DataFabric 1:03:10
1:03:10
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:03:10
SQL : un language incontournable dans le traitement des données. On en parle avec une approche historique, les dialectes et les nouvelles approches qui rendent ce language plus vivant que jamais. Dans la deuxième partie de l'épisode on vous parle de Microsoft DataFabric : où en est-on avec ce nouveau service orienté données proposé par Microsoft.…

1 Episode 34 : DataLakeHouse et architecture médaillon / Nouveautés d’Oracle Database 23c 1:00:34
1:00:34
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:00:34
DataLakehouse et Architecture Médaillon. Les nouveautés d'Oracle Database 23c

1 Episode 33 : Bases de données vectorielles essai avec SQL Server + Microsoft Fabric Partie 2 1:07:26
1:07:26
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:07:26
Dans cette épisode on parle d'un essai d'implémentation de recherche sémantique et vectorielle avec SQL Server. Dans la seconde partie : Approfondissement de Microsoft Fabric.

1 Episode 32 : Avis sur Microsoft Fabric + Les bases de données vectorielles ou la mémoire des IAs 1:02:05
1:02:05
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:02:05
Microsoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accélérées les bases de données vectorielles ont le vent en poupe. Mais on peut aussi faire ce type de recherche semantique avec des bases classiques comme postgresql avec une extension (pgvector) voir même avec sql server, oracle ou n'importe quelle base de données relationnelles en faisant des calculs de distances. Ce qui manquera toutefois à ces bases non-spécialisées : des index adaptées aux vecteurs.…

1 Episode 31 : REX dataoops SQL Server et IOT, Observabilité, DataMesh 1:39:00
1:39:00
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:39:00
4 sujets dans cet épisode : Une REX sur un problème de modélisation de données IOT dans SQL Server. L'arrivée des fonctionnalités spatiales sur DuckDB. Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog. Discussion sur le datamesh

1 Episode 30 : Parquet to SQL / 3 000 milliards de lignes dans SQL Server 1:08:10
1:08:10
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:08:10
On parle de chargement de données Parquet dans SQL Server via C# et bulkcopy. On parle également des bonnes pratiques pour sql server pour stocker 3000 milliards de lignes. Dernière partie avec une overview

1 Episode 29 : TPCH MSSQL entre dans la danse + ChatGpt Premiers tests 1:21:36
1:21:36
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:21:36
TPCH : nouveaux tests avec SQL Server et influence de la collation sur les performances. Autres Tests TPCH SF100 : DuckDB & Hyper sur un laptop vs, Snowflake (XS to 4xLarge). Quelques mots sur nos premiers essais avec ChatGPT

1 Episode 28 : TPCH Cloud Databases vs DuckDB, les outils autour de Terraform et les extended events sur SQL Server. 1:40:07
1:40:07
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:40:07
On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code. Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleStore et Synapse vs DuckDB. Eric nous parle également des outils permettant se faciliter la vie avec Terraform.…
Data virtualisation remise au gout du jour avec sql server 2022, la data virtualisation permet d'accéder à de nombreuses sources (SGBDR, Datalake, Fichiers...) depuis un point unique. Ce type d'architecture permet de simplifier le paysage architectural. On en parle sur Dataoops. Les disques NVMe apparus il y a quelques années on permis d'accélerer considérablement les accès disques. Les SAN en bénéficient maintenant plus efficacement avec le NVMe-oF : NVMe over Fabric.…

1 Episode 26 : Big Data is Dead (DuckDB) / Data Gouvernance 1:17:52
1:17:52
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:17:52
On discute de l'article Big Data is Dead : de Jordan Tigani. On discute des avantages de DuckDB. Puis un on aborde la data gouvernance avec Fabien

1 Episode 25 : DataLakeHouse, ADBC et Configuration VMWare pour les bases de données 1:16:13
1:16:13
Reproducir más Tarde
Reproducir más Tarde
Listas
Me gusta
Me gusta1:16:13
1) Premières impression sur le DatalakeHouse de Databricks. 2) Le protocole ADBC (Arrow Database Connectivity) 3) Bonnes pratiques de configuration des VMs pour les bases de données
Bienvenido a Player FM!
Player FM está escaneando la web en busca de podcasts de alta calidad para que los disfrutes en este momento. Es la mejor aplicación de podcast y funciona en Android, iPhone y la web. Regístrate para sincronizar suscripciones a través de dispositivos.