跳到主要内容

基准测试

对于性能指南中的部分建议,我们使用微基准测试来支撑结论。基准测试使用的数据集来自 TPC-H benchmark 以及 LDBC Social Network Benchmark 的 BI workload

数据集

我们使用 LDBC BI SF300 数据集的 Comment 表(20 GB 的 .tar.zst 压缩包,解压为 .csv.gz 后约 21 GB), 另一些测试使用同一表的 creationDate(4 GB 的 .parquet 文件)。

基准中的 TPC 数据集通过 Goose 的 tpch 扩展生成。

关于基准测试的说明

执行公平基准测试并不容易,尤其在系统间对比时更是如此。 在 Goose 上跑基准时,请确保使用最新版本(建议使用 preview build)。 如对基准结果有疑问,欢迎联系 kumo-pub@outlook.com

基准免责声明

请注意,本指南中的基准结果不构成官方 TPC 或 LDBC 成绩。它们仅使用 TPC-H 与 LDBC BI 框架提供的数据集及部分查询,且省略了工作负载中的其他部分(如更新)。