基于全球AIS的多源航迹关联数据集崔亚奇①徐平亮*①龚诚②余舟川②张建廷③于洪波①董凯①①(海军航空大学信息融合研究所烟台264001)②(91001部队北京100000)③(91977部队北京100000)摘要:数据、算法和算力是当前人工智能技术发展的3大推力,考虑到智能关联算法研究的迫切需求和多雷达协同观测航迹数据获取困难,针对航迹关联数据集缺失问题,该文公开了多源航迹关联数据集(MTAD),其由全球AIS航迹数据经栅格划分、自动中断和噪声添加处理步骤构建。该数据集包括训练集和测试集两大部分,共有航迹百万余条,其中训练集包含5000个场景样本,测试集包含1000个场景样本,每一个场景样本由几个到几百个数量不等的航迹构成,涵盖多种运动模式、多种目标类型和长度不等的持续时间。同时,进一步对构造的MTAD数据集进行可视化分析,详细研究了各个栅格内航迹的特点,证明了该数据集的丰富性、合理性和有效性。最后,作为参考,给出了关联评价指标和关联基线结果。该数据集目前已被用作海军“金海豚”杯竞赛科目专用数据集。关键词:航迹关联;自动识别系统(AIS);人工智能;深度学习中图分类号:TN957.52文献标识码:A文章编号:1009-5896(2023)02-0746-11DOI:10.11999/JEIT221202MultisourceTrackAssociationDatasetBasedontheGlobalAISCUIYaqi①XUPingliang①GONGCheng②YUZhouchuan②ZHANGJianting③YUHongbo①DONGKai①①(InstituteofInformationFusion,NavalAviationUniversity,Yantai264001,China)②(91001Unit,Beijing100000,China)③(91977Unit,Beijing100000,China)Abstract:Data,algorithms,andhashratesarethethreethrustforcesfordevelopingartificialintelligence.Consideringtheurgentdemandforresearchontheintelligentassociationalgorithmandthedifficultyofobtainingtrackdatafrommulti-radarcollaborativeobservationandaddressingtheproblemofmissingtrackassociationdataset,aMulti-sourceTrackAssociationDataset(MTAD)isconstructedinthisstudy.MTADisbasedonautomaticidentificationsystemtrajectorydataafterprocessinggriddivision,automaticinterruption,anderroradding.Thedatasetincludestwoparts,namely,thetrainingdatasetandthetestdataset,withmorethan1milliontracks.Thetrainandtestdatasetscontain5000and1000scenesamples,respectively.Eachscenesampleconsistsofseveraltohundredsoftracks,coveringvariousmovemen...