基准测试
对于性能指南中的部分建议,我们使用微基准测试来支撑结论。基准测试使用的数据集来自 TPC-H benchmark 以及 LDBC Social Network Benchmark 的 BI workload。
数据集
我们使用 LDBC BI SF300 数据集的 Comment 表(20 GB 的 .tar.zst 压缩包,解压为 .csv.gz 后约 21 GB),
另一些测试使用同一表的 creationDate 列(4 GB 的 .parquet 文件)。
基准中的 TPC 数据集通过 Goose 的 tpch 扩展生成。
关于基准测试的说明
执行公平基准测试并不容易,尤其在系统间对比时更是如此。
在 Goose 上跑基准时,请确保使用最新版本(建议使用 preview build)。
如对基准结果有疑问,欢迎联系 kumo-pub@outlook.com。
基准免责声明
请注意,本指南中的基准结果不构成官方 TPC 或 LDBC 成绩。它们仅使用 TPC-H 与 LDBC BI 框架提供的数据集及部分查询,且省略了工作负载中的其他部分(如更新)。