摘要:在交通工程、智能交通系统(ITS)和自动驾驶研究中,高质量的数据集是开展科学研究的基础。本文系统梳理了交通领域常用的开源数据集,涵盖车辆轨迹、交通流量、出租车运行等多类数据,并提供官方获取渠道,帮助研究者快速获取所需数据资源。
一、车辆轨迹数据集
1. NGSIM 数据集 🇺🇸
全称:Next Generation Simulation(下一代仿真)
发布机构:美国联邦公路局(FHWA)
数据特点:
• 采集于美国 101 号高速公路和 80 号州际公路 • 包含车辆跟驰、换道等微观驾驶行为数据 • 时间分辨率高达 0.1 秒,轨迹精度达厘米级 • 每个时段 15 分钟,包含数万辆车的完整轨迹
应用场景:
• 车辆跟驰与换道行为研究 • 交通流微观仿真模型构建 • 自动驾驶决策规划算法验证 • 驾驶员意图识别与轨迹预测
获取方式:
• 🌐 官方网站:https://data.transportation.gov/Automobiles/Next-Generation-Simulation-NGSIM-Vehicle-Trajector/8ect-6jqj • 📦 数据格式:TXT 文件,包含时间戳、车辆 ID、位置、速度等信息 • ⚠️ 备用下载:如官网无法访问,可通过 CSDN 等国内平台搜索"NGSIM 数据集"获取镜像下载
2. HighD 数据集 🇩🇪
发布机构:德国亚琛工业大学汽车工程研究所
数据特点:
• 德国高速公路自然驾驶轨迹数据 • 采集自科隆附近 6 个不同地点 • 记录 11.5 小时测量数据,覆盖 11 万辆车 • 包含 5600 条完整变道记录 • 定位误差小于 10 厘米
应用场景:
• 驾驶员模型参数化 • 自动驾驶行为规划 • 交通模式分析与识别 • 车辆运动轨迹预测
获取方式:
• 🌐 官方网站:https://www.highd-dataset.com/ • 📝 需提交研究用途申请,审核通过后下载 • ⚠️ 注意:需要使用机构邮箱申请,审核周期约 1-2 周
3. Mirror-Traffic 数据集 🇨🇳
发布机构:清华大学苏州汽车研究院、江苏智能网联汽车创新中心
数据特点:
• 中国真实道路交通场景 • 覆盖匝道、直道、弯道、十字路口等多种道路类型 • 包含多种交通流状态(畅通、适中、拥堵) • 车辆与行人轨迹精度达厘米级
应用场景:
• 驾驶场景提取与生成 • 自动驾驶预测与规划算法开发 • 交通流分析与微观仿真 • 自然驾驶行为模仿学习
获取方式:
• 🌐 官方网站:http://www.scenarios.cn/html/dataset.html • ⚠️ 备用方案:如官网无法访问,可联系清华大学苏州汽车研究院获取
二、交通流量数据集
4. PeMS 数据集 🇺🇸
全称:Performance Measurement System(性能测量系统)
发布机构:加州交通局(Caltrans)
数据特点:
• 覆盖加州主要高速公路网络 • 包含交通流量、速度、占有率等指标 • 高频采样:每 5-10 分钟更新一次 • 历史数据可追溯至 2000 年
常用子集:
应用场景:
• 短时交通流预测 • 交通状态识别与评估 • 时空预测模型研究 • 交通管控策略优化
获取方式:
• 🌐 官方网站:https://pems.dot.ca.gov/ • 📝 需注册账户,登录后在"Data Tools"页面下载 • ⚠️ 注意:每次下载限一周数据,批量获取需自动化脚本 • ⚠️ 备用方案:可通过 GitHub 搜索"PeMS dataset"获取预处理版本
5. METR-LA 数据集 🇺🇸
全称:Metropolitan Transportation Authority - Los Angeles
数据特点:
• 洛杉矶地区高速公路交通流量数据 • 207 个环形线圈检测器 • 2012 年连续 4 个月数据 • 每 5 分钟采样一次
应用场景:
• 交通流量预测算法 benchmark • 图神经网络时空建模 • 深度学习交通预测研究
获取方式:
• 📦 GitHub 开源项目:https://github.com/liye847497412/METR-LA • 🔗 或搜索"METR-LA dataset"获取多个镜像版本
三、城市交通运行数据集
6. 滴滴盖亚数据开放计划 🇨🇳
发布机构:滴滴出行
数据类别:
• 城市交通指数数据集 • 驾驶行为数据集 • POI 检索数据集 • 网约车轨迹数据集 • 驾驶场景视频数据集
数据特点:
• 覆盖中国多个主要城市 • 数据质量高,时间跨度长 • 包含丰富的时空信息
获取方式:
• 🌐 官方网站:https://outreach.didichuxing.com/ • 📝 需使用国内高校邮箱注册并提交研究申请 • ⏱️ 审核周期:1-2 周 • ⚠️ 注意:目前主要以科研项目合作形式开放,可关注 CCF-滴滴盖亚学者科研基金
7. 深圳市政府数据开放平台 🇨🇳
发布机构:深圳市人民政府
交通数据类别:
• 停车场数据 • 卡口过车数据 • 车流量数据 • 公交站点路线数据 • 营运车辆 GPS 数据 • 刷卡数据 • 路段属性数据
数据特点:
• 实时与历史数据兼备 • 覆盖深圳市全域 • 持续更新维护(最近更新:2026 年 3 月)
获取方式:
• 🌐 官方网站:https://opendata.sz.gov.cn/ • 📥 开放下载,无需申请 • ✅ 状态:网站正常运行,数据持续更新
8. 纽约出租车数据集 🇺🇸
发布机构:纽约市出租车与礼车委员会(TLC)
数据特点:
• 2009-2025 年完整记录 • 包含黄色和绿色出租车 • 字段:接送时间、地点、行程距离、票价、乘客数等 • 每月更新,数据量超亿级
应用场景:
• 城市出行模式分析 • 交通需求预测 • 网约车调度优化 • 城市计算研究
获取方式:
• 🌐 官方网站:https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page • 📦 CSV 格式,按月提供 • ✅ 状态:网站正常运行,数据持续更新
9. 上海出租车数据集 🇨🇳
发布机构:香港科技大学智慧城市研究小组
数据特点:
• 4000 辆出租车 24 小时轨迹 • 2007 年 2 月 20 日全天数据 • 采样间隔:1 分钟 • 字段:车辆 ID、时间、经纬度、速度、载客状态
获取方式:
• 🌐 官方网站:https://cse.hkust.edu.hk/scrg/ • ✅ 状态:网站正常运行 • ⚠️ 注意:此为历史经典数据集,主要用于算法验证
10. 共享单车数据集 🚲
数据字段:
• 骑行起止时间 • 起点/终点位置 • 用户性别、年龄 • 自行车 ID
四、其他交通数据资源
11. 美国交通事故数据集 🇺🇸
数据特点:
• 覆盖美国 49 个州 • 2016-2019 年约 225 万起事故记录 • 数据来源:交通运输部门、执法机构、交通摄像头等
应用场景:
• 交通事故成因分析 • 道路安全评估 • 事故风险预测
获取方式:
• 🔍 可通过 Kaggle、UCI 等平台搜索"US Accident Dataset"获取
12. 英国高速公路交通流量数据集 🇬🇧
数据特点:
• 过去 18 年累计数据 • 34,416 个手动计数点 • 主干道与次干道全覆盖
应用场景:
• 路口拥堵分析 • 交通流量趋势研究 • 道路规划支持
获取方式:
• 🔍 可通过英国政府数据平台 data.gov.uk 搜索获取
五、数据使用建议
📌 选择数据集的考量因素
- 研究目标匹配
:根据研究方向选择合适类型(轨迹/流量/出行) - 数据质量
:关注采样频率、精度、完整性 - 时间跨度
:长期研究需选择历史数据丰富的数据集 - 区域特征
:考虑交通环境差异(高速/城市/乡村) - 获取成本
:评估申请流程、审核时间、使用限制
⚠️ 使用注意事项
• 遵守数据使用协议,仅限学术研究 • 引用时注明数据来源和发布机构 • 注意数据脱敏和隐私保护 • 部分国外数据集需科学上网访问 • 建议优先选择国内可访问的镜像源
🔧 链接失效应对方案
六、总结
本文汇总了交通领域 12 类常用开源数据集,涵盖:
获取难度说明:⭐ 容易 ⭐⭐ 中等 ⭐⭐⭐ 较难(需申请/审核)
七、国内研究者推荐数据源
针对国内网络环境,推荐以下易于获取的数据集:
- 深圳市政府数据开放平台
- 无需申请,直接下载 - 上海出租车数据集
- 香港科技大学开放下载 - Mirror-Traffic 数据集
- 国内机构发布 - METR-LA/PeMS
- GitHub 有预处理版本 - 共享单车数据
- 官网可直接下载
📢 更新说明:本文数据链接截至 2026 年 3 月验证,如有变动请以官方网站为准。如发现链接失效,欢迎通过搜索引擎查找替代资源。
👨💻 作者:交通数据实验室
📅 发布日期:2026 年 3 月 10 日
如本文对您有帮助,欢迎分享转发!
夜雨聆风