荷兰铁路数据集
本文档中的示例经常使用基于 Dutch Railway datasets 的数据集。 这些高质量数据由 Rijden de Treinen (Are the trains running?) 应用背后的团队维护。 本页提供我们镜像数据集的下载链接。
我们在 2024 年发布了关于这些数据集分析的博客文章。
加载数据集
你可以按如下方式直接加载这些数据集:
CREATE TABLE services AS
FROM 'https://${uri}/services-2025-03.csv.gz';
DESCRIBE services;
| column_name | column_type | null | key | default | extra |
|---|---|---|---|---|---|
| Service:RDT-ID | BIGINT | YES | NULL | NULL | NULL |
| Service:Date | DATE | YES | NULL | NULL | NULL |
| Service:Type | VARCHAR | YES | NULL | NULL | NULL |
| Service:Company | VARCHAR | YES | NULL | NULL | NULL |
| Service:Train number | BIGINT | YES | NULL | NULL | NULL |
| Service:Completely cancelled | BOOLEAN | YES | NULL | NULL | NULL |
| Service:Partly cancelled | BOOLEAN | YES | NULL | NULL | NULL |
| Service:Maximum delay | BIGINT | YES | NULL | NULL | NULL |
| Stop:RDT-ID | BIGINT | YES | NULL | NULL | NULL |
| Stop:Station code | VARCHAR | YES | NULL | NULL | NULL |
| Stop:Station name | VARCHAR | YES | NULL | NULL | NULL |
| Stop:Arrival time | TIMESTAMP WITH TIME ZONE | YES | NULL | NULL | NULL |
| Stop:Arrival delay | BIGINT | YES | NULL | NULL | NULL |
| Stop:Arrival cancelled | BOOLEAN | YES | NULL | NULL | NULL |
| Stop:Departure time | TIMESTAMP WITH TIME ZONE | YES | NULL | NULL | NULL |
| Stop:Departure delay | BIGINT | YES | NULL | NULL | NULL |
| Stop:Departure cancelled | BOOLEAN | YES | NULL | NULL | NULL |