-53-CHINASCIENCEANDTECHNOLOGYINFORMATIONApr.2024·中国科技信息2024年第8期航空航天◎时序特征提取算法能够从实际意义出发,高效分析时间序列特征模式,提取可辨识的时间序列特征,挖掘数据蕴涵的规律。随着物联网、大数据和人工智能等技术研究和应用的蓬勃发展,时序特征提取算法在环境、金融、天气预报、工业控制以及天文医学等领域的应用越来越广泛。本文在某型航空发动机数据处理过程中引入时序特征提取算法进行关键特征提取,深入处理分析后获得航空发动机的稳态运行规律,而后基于此完成航空发动机性能模型的轻量化构建。算法概述时间序列T可以表示为一组有序离散值集合的形式。T={(x1,(y1…yj)1),…,(xi,(y1…yj)i)}其中xi为时间序列,(y1…yj)i是对应的标签。时间序列的特征主要分为基础特征,转换特征。基础特征包括均值、方差、极值、最值、斜率、自相关性等。对于难以直接发现的深层次信息就需要进行特征转换,如以Box-Cox变换为代表的统计转换特征,以格拉姆角场为代表的高维空间转换特征,以及以傅里叶转换为代表的频域转换特征分析。在大部分任务背景中,时序数据的稳态特征或者过渡态趋势变化特征更受关注,而长时序数据变化频繁,不能直接进行特征提取分析。此时需要对时序数据分段,方便以更细的颗粒度进行针对性分析,从而获取到时序数据的分段特征。时序数据的分段特征提取是指将原始时间序列数据按照图1所示的变化趋势割成子段,然后再进行特征提取。现有的时序分段算法总体思路为通过有限数量的线性分段实现对原始时序数据的最佳表示,使任意段的最大误差不超过指定的阈值误差。时序分段方法大致分为以下几种类型:(1)聚合近似分段(PiecewiseAggregateApproximation,PAA),此类算法需提前指定分段数,通过将时间序列平均划分为多个分段,然后每个分段用其对应的均值来表示,分段精度较为依赖分段数量,分段数越多,则能保留越多原始数据的信息,反之分段数较少时丢失的信息增多,分段效果下降;(2)符号化聚合近似(SymbolicAggregateApproximation,SAX),SAX算法的思想是首先通过PAA方法完成数据分段,再将分段转化成人为定义的符号,然后通过符号序列来表示原序列;(3)自顶向下分段(Top-Down),通过对时序数据进行递归分割,测试每次分割得到的两个子节,直到所有分段的逼近误差都低于设定阈值,图2和图3说明了时序数据的自顶向下分段表示结果;(4)自下而上行业曲线开放度创新度生态度互交...