计算机工程与应用

2022, v.58;No.992(01) 113-121

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于时空相关性的公交大数据清洗
Big Data Cleaning Method for Bus Based on Spatiotemporal Correlation

谢智颖;何原荣;李清泉;

摘要(Abstract):

随着大数据与AI技术的发展,由数据驱动的预测模型层出不穷,数据清洗在提升这些模型预测中起着重要的作用。从公交车运行数据的时空相关性入手,分析了公交大数据存在的四类异常,接着在对时间相关性、空间邻近性、时空依赖性等公交大数据特性的分析基础上,提出了整合缓冲区、四分位数、时间依赖网络等时空处理方法的冗余清洗、范围清洗、异常清洗、补全清洗四种清洗方法,然后对公交进出站、轨迹数据集用这几种清洗方法进行了清洗。在不同清洗数据集下,通过LSTM公交到达时间预测精度的比较分析,证明了数据清洗对预测精度的提升是显著的。

关键词(KeyWords): 数据清洗;时空相关性;数据质量;公交大数据

Abstract:

Keywords:

基金项目(Foundation): 福建省自然科学基金面上项目(2020J01263);; 教育部高等教育司产学合作协同育人项目(201902207003);; 厦门市科技计划项目(3502Z20203060);; 福建省建设科技研究开发项目(2020-K-59)

作者(Author): 谢智颖;何原荣;李清泉;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享