|
- Pandas Polars DuckDB 谁是 Python 数据分析性能王者?
而 Polars 和 DuckDB 从设计之初就为多核处理器而生,它们的查询引擎能自动将计算任务分解,分配到所有可用的 CPU 核心上并行执行,实现了“人多力量大”的效果。 3 Polars 的杀手锏:惰性求值 (Lazy Evaluation) 惰性求值是 Polars 高性能的关键。
- 为什么 DuckDB 可以这么火? - 知乎
1 DuckDB 是什么? DuckDB 是一款嵌入式的 OLAP 数据库,目标就是把 复杂 SQL 的计算能力直接带到 Python 里。 和传统数据库不一样: 无需安装服务器,pip 一行命令搞定 完全运行在本地进程里,数据交互无延迟 SQL 查询可以直接对 Pandas DataFrame、CSV、Parquet 等各种数据源执行 一句话: 像写 SQL 一样处理
- 知乎 - 有问题,就会有答案
DuckDB What is DuckDB DuckDB 是一个 In-Process 的 OLAP 数据库,可以理解为 AP 版本的 SQLite,采用 MIT 协议开源,是荷兰 CWI 数据库组的一个项目 W
- 如何评价DuckDB? - 知乎
DuckDB 的优势在于列式存储,扫描速度快,支持压缩,文件体积小,且可以只读需要的列,大幅减少 IO。 1 为什么要用 DuckDB? 从分析师角度,可以把 DuckDB 理解为: 在你本机(或脚本)里运行的、用于分析型查询的“小型数据仓库”。 它的特点对分析和 BI 很
- duckdb的性能如何? - 知乎
可以理解成: DuckDB 内部数据库文件( duckdb) DuckDB 作为引擎,外部读取 Parquet 文件 1 1 存储层本质对比 DuckDB duckdb 数据库文件 DuckDB 自有的 列式存储格式,不是 Parquet,但也是为分析型查询优化。 可以集中存储: 多张表、多 schema、多视图 元数据(表结构
- duckdb-学习笔记 - 知乎
TLDR:这篇笔记概述了 DuckDB 优化器的整体架构和流程,介绍了其核心组件 LogicalOperatorVisitor 以及多个优化规则,包括表达式重写、谓词下推、关联子查询优化和列裁剪等,…
- 一个人如何阅读DuckDB源码? - 知乎
研一新生,想要在AP方向上发展,想看看duckdb源码,但是没有文档,debug的时候感觉太复杂了看不太懂,这…
- VBA如何连接duckdb数据库? - 知乎
摘要(TL;DR):本文介绍了在 Excel 的 VBA 中,通过 ODBC 读取 DuckDB 中文数据时会出现乱码的原因。经过分析发现,乱码的根源在于 Windows 的 OLE DB Provider 将 UTF-8 字节流误当作 GBK 解码。本文将提供一个通用的解决办法。 〇、起因介绍 在 DuckDB 中国用户微信群里偶尔会看到有小伙伴在抱怨:在 Excel 的 VBA
|
|
|