现代计算机ModernComputer第28卷第24期2022年12月25日文章编号:1007-1423(2022)24-0110-06DOI:10.3969/j.issn.1007-1423.2022.24.019基于公交运营异常事件快速定位存储平台设计迟剑,刘艳飞(河北民族师范学院数学与计算机科学学院,承德067000)摘要:公交运营中异常事件频发影响出行用户舒适度,增加公交公司运营成本。快速处理运营异常事件是目前公交公司亟待解决的问题之一。异常事件发生的不可控性以及不确定性是研究中监测难点。在完整追踪某一线路所有运营车辆的营运过程,提出了对异常事件影响指标分级,设计二级位图索引,快速定位异常事件发生车辆和路段的问题解决方法。Hadoop分布式存储框架中,车辆信息和查询地点作为Key值,设计辅助多维位图索引,构建Hbase异常数据存储库,依据Impala快速定位查询点。对比应用MapReduce计算框架和直接Impala查询完全数据集,异常特征数据快速定位性能提升明显,也减少了Impala查询存在的一些缺陷问题。关键词:公交数据云存储平台;异常事件;Impala平台;位图索引;轨迹数据基金项目:河北民族师范学院2018年度校级基金项目(PT2018010);河北省省级科技计划资助项目(20310301D)0引言近几年,中小城市城镇化扩张速度迅猛,对公交运输提出了新挑战。以承德市为例,在2010年前,承德公交集团年运输旅客在8000万人次左右,到疫情前的2019年,年运输人数达到1.58亿人次左右,海量的乘客运输轨迹和公交运营轨迹随着公交车辆网络升级,车载终端借助于GPS与北斗双系统复合模块来定位实现了实时传输,公交公司能及时方便地获取公交车辆的轨迹数据。大量的轨迹数据,促使公交系统管理由预定排班系统转向实时的计算分析,对运营的公交车辆实现有效的监测。面向公交运营监测中,实时探测运营异常是最迫切的应用需求。这里的异常主要指同一线路上车辆聚集问题、车辆拥堵问题、车速异常问题、非站点停车问题等,需要在存储的数据中针对异常数据快速定位分类,进而提升问题解决的效率。在实际的运营过程中,公交企业普遍采用成熟的数据库产品,比如甲骨文的OracleSpatial,或者是成熟的云存储平台,采用规定的接口和模式访问相关的数据,既定的条件限制下,在海量数据中快速定位异常数据,是国内外展开研究的热点问题。针对云存储平台,一般主要对数据索引以及存储结构两个方面加以改进加快定位速度。吕江波等[1]提出基于车辆轨迹误差来源,研究统计分析方法,设计了基于Hadoop的预处理模型方案,解决数据...