DIGITCW技术研究TechnologyStudy20DIGITCW2023.09在轨迹聚类研究的发展历程中,对海量对象运动规律的发掘始终是重要的探讨课题之一。2005年,Kalni等[1]提出了基于一种密度的移动聚类思想,这种聚类思想主要可以被阐述如下:对于聚类中的每个数据点,给定范围(ε),在该范围中至少有一定数量(Minpts)的点。这类移动对象聚类模式也被Jeung等[2]称作Convoy模式。Convoy模式定义:K个连续时间段内存在超过某数目且共同移动的对象集合。本文中实验采用北京交通的数据集,此数据集主要由城市地图数据库、道路ID数据库、节点ID数据库以及轨迹数据库构成。1实验流程本次实验基于数据总量庞大的特性,采用道格拉斯-普克算法(Douglas-Peucker)[3]对连续坐标进行测量,然后对相邻时间戳的数据进行了进一步填充以保证数据的平滑性。在对数据噪点清除和切分之后,本实验采用了3种聚类算法(MC1、MC2、CMC)对处理后的数据进行Convoy模式的聚类,并且对这3种聚类算法进行了效率、质量的对比[4]。2轨迹聚类算法实现2.1轨迹压缩在轨迹压缩部分,本实验采用了时间同步欧氏距离(TimeSynchronizedEuclidianDistance)和DK算法来简化轨迹数据。时间同步欧氏距离能够从轨迹算法中产生近似轨迹[5],而DK算法则能通过垂向距离对数据进行压缩[3]。本次实验基于这两种方法将测试数据中单个时间戳中缺失的数据进行了补全,然后通过DK算法对整体轨迹数据进行了压缩。即使数据经过算法进行了压缩,也需要对各个时段内所有坐标点进行统计之后才能聚类。为了提升聚类算法的性能,本次实验中采用了网格(Grid)数据结构[6]。网格数据结构将地图数据均分成若干小的网格并建立索引,单个交通数据的轨迹挖掘方法研究朱毅,祁雪婷,赵玉帅(盐城工业职业技术学院,江苏盐城224000)摘要:随着位置采集技术以及带有GPS组件的移动设备的大量应用,其产生的空间轨迹数据规模已经达到了可以进行研究的标准。为研究城市交通轨迹数据是否适用于相关移动聚类的算法,本文首先根据北京城市交通数据进行了预处理与降噪;然后,通过采用相关聚类算法进行对比,总结了各算法的优劣和适用性;最后对该实验的研究趋势进行了讨论。关键词:轨迹挖掘;高维数据;聚类分析doi:10.3969/J.ISSN.1672-7274.2023.09.007中图分类号:TP3,U491文献标志码:A文章编码:1672-7274(2023)09-0020-03ResearchonTrajectoryMiningMethodsforTrafficDataZHUYi,QIXueting,ZHAOYushuai(YanchengIndustrialVo...