第26卷第9期2023年9月软件工程SOFTWAREENGINEERINGVol.26No.9Sep.2023文章编号:2096-1472(2023)09-0048-04DOI:10.19644/j.cnki.issn2096-1472.2023.009.009收稿日期:2023-02-22基于OpenTelemetry+Jaeger的分布式系统调用链路监控方案张爱华1,白金峰2[1.大连东软信息学院网络工程系,辽宁大连116023;2.欧普杰科技(大连)有限公司,辽宁大连116023]zhangaihua@neusoft.edu.cn;baijinfeng1202@126.com摘要:在分布式系统中,由于各个功能模块的通信网络错综复杂,因此对于单一请求的调用链路监控与分析就显得尤为重要。文章在详细调研大部分分布式系统的通用结构和调用链路特征的基础上,设计了一套通用的分布式系统调用链路监控方案。该系统基于OpenTelemetry(开源可观察性框架)对服务进行埋点采样及数据整体搜集,使用Jaeger(分布式跟踪系统)对数据进行整理分析并进行可视化展示。使用该方案对分布式系统进行监控,可以快速发现系统中存在的链路问题并监控服务健康程度,使分布式系统的运行更加稳定,能给用户带来更好的体验。关键词:分布式系统;链路监控;OpenTelemetry;Jaeger中图分类号:TP391文献标志码:ADesignofDistributedSystemCallLinkMonitoringBasedonOpenTelemetryandJaegerZHANGAihua1,BAIJinfeng2[1.DepartmentofNetworkEngineering,DalianNeusoftUniversityofInformation,Dalian116023,China;2.OpenJawTechnology(Dalian)Co.,Ltd.,Dalian116023,China]zhangaihua@neusoft.edu.cn;baijinfeng1202@126.comAbstract:Indistributedsystems,monitoringandanalyzingthecalllinkofasinglerequestisparticularlyimportantduetothecomplexcommunicationnetworksofvariousfunctionalmodules.Afteradetailedinvestigationofthegeneralstructureandcalllinkcharacteristicsofmostdistributedsystems,thepaperproposestodesignauniversaldistributedsystemcalllinkmonitoringscheme.OpenTelemetry(anopensourceobservabilityframework)isusedforburiedpointsamplingandoveralldatacollectionofservices,andJaeger(adistributedtracingsystem)isusedtoorganize,analyze,andvisualizethedata.Byusingthisschemetomonitordistributedsystems,itispossibletoquicklyidentifylinkissuesinthesystemandmonitorservicehealth,makingtheoperationofthedistributedsystemmorestableandprovidinguserswithabetterexperience.Keywords:distributedsystem;linkmonitoring;Op...