第49卷第2期2023年2月ComputerEngineering计算机工程面向多元时间序列的群体因果关系发现算法蔡瑞初1,伍运金1,陈薇1,郝志峰1,2(1.广东工业大学计算机学院,广州510006;2.汕头大学理学院,广东汕头515063)摘要:从多元时间序列观测数据中学习多个变量之间的因果关系是许多专业领域中的重要基本问题。现有的多元时间序列因果关系发现方法通常从每个个体的观测数据中学习个体因果关系,没有考虑部分个体之间可能存在相同的因果关系,导致样本利用不足。提出一种面向多元时间序列的群体因果关系发现算法。该算法分为2个阶段:第一阶段基于因果关系对个体之间的相似性进行度量,并把多个个体划分成多个群体,且无须指定群体的个数;第二阶段基于变分推断方法充分利用每个群体内的所有个体数据,从而学习群体因果关系。实验结果表明,该算法在多组不同参数生成的仿真数据上均具有较好的表现,与对比算法相比,AUC评分提升了5%~20%。在真实数据集中,该算法能够较好地区分具有不同因果关系的群体,并且能够学习到不同群体之间不同的因果关系,表明算法不仅具有因果关系发现能力,而且还具有多元时间序列聚类能力。关键词:群体因果发现;多元时间序列;因果关系;聚类;变分推断开放科学(资源服务)标志码(OSID):中文引用格式:蔡瑞初,伍运金,陈薇,等.面向多元时间序列的群体因果关系发现算法[J].计算机工程,2023,49(2):127-135.英文引用格式:CAIRC,WUYJ,CHENW,etal.Collectivecausalrelationsdiscoveryalgorithmformultivariatetime-series[J].ComputerEngineering,2023,49(2):127-135.CollectiveCausalRelationsDiscoveryAlgorithmforMultivariateTime-SeriesCAIRuichu1,WUYunjin1,CHENWei1,HAOZhifeng1,2(1.SchoolofComputer,GuangdongUniversityofTechnology,Guangzhou510006,China;2.CollegeofScience,ShantouUniversity,Shantou515063,Guangdong,China)【Abstract】Causaldiscoveryfrommultivariatetime-seriesisasignificantandfundamentalprobleminnumerousdisciplines.Theexistingmultivariatetime-seriescausaldiscoverymethodslearnthecausalrelationsforeachindividualwhilesomeindividualsmaysharethesamecausalrelations;therefore,theymayexploitdatainsufficiently.Tothisend,thisstudyproposesacollectivecausaldiscoveryalgorithmformultivariatetime-series,whichisatwo-stagealgor...