📄️ 性能指南
Goose 旨在通过合理默认配置与更具容错性的架构自动获得高性能。当然,针对特定工作负载仍有不少调优空间。性能指南页面提供了在 Goose 中加载和处理数据以获得更好性能的建议与技巧。
📄️ 基准测试
对于性能指南中的部分建议,我们使用微基准测试来支撑结论。基准测试使用的数据集来自 TPC-H benchmark 以及 LDBC Social Network Benchmark 的 BI workload。
📄️ 环境
Goose 的运行环境会显著影响性能。本文重点讨论硬件配置与操作系统的影响。
📄️ 文件格式
处理 Parquet 文件
📄️ 工作负载调优
preserveinsertionorder 选项
📄️ 数据导入
推荐导入方式
📄️ 索引
Goose 有两类索引:zonemap 和 ART 索引。
📄️ Join 操作
如何强制 Join 顺序
📄️ 我的工作负载很慢
如果你发现 Goose 中的工作负载较慢,建议按以下清单进行检查。每条都附有更详细说明链接。
📄️ Schema
类型
📄️ 处理超大数据库
本页提供处理超大 Goose 数据库文件的相关信息。