识别风险,发现价值请务必阅读末页的免责声明1/21金融工程|专题报告2018年4月3日证券研究报告Table_Title基于条件随机场的周频择时策略交易性择时策略研究之十三Table_Summary报告摘要:条件随机场模型及股市择时思路自1988年,西蒙斯成立了大奖章基金并在多次股灾中取得稳定的收益后,纯技术量化型的投资策略开始受到投资者的广泛关注,而机器学习正是这种技术量化型策略的中坚力量。目前使用较为成熟的模型之一是隐马尔可夫模型HMM,其与条件随机场是一对“生成判别对”。相比起HMM,条件随机场具有更加灵活等优点。事实上,条件随机场(ConditionalRandomField,CRF)是描述给定一组输入随机变量条件下另一组输出变量的条件概率分布的模型。基于条件随机场,我们可以建立观测指标值和走势状态及走势状态与走势状态之间复杂的函数依赖关系,从而,当给定新的观测指标值时,我们可以给出新的走势状态值,实现涨跌模式识别的目标。预测指标提取及模型参数选择预测指标提取及模型参数选择是应用机器学习算法时的两个关键问题,对条件随机场也不例外。关于预测指标的提取,我们实际上采取的是机器学习中常用的升维后降维的思想,我们从两个在以往的研究中发现的可能对中短期择时有预测作用的指标——涨跌幅和换手率出发,衍生出更多的特征指标以增加输入信息,接着对这些特征指标进行逐一测算,我们剔除了其中冗余无效的信息,最终筛选出一个较为稳健的预测指标组,其中包括涨跌幅、涨跌幅波动率和收盘价连涨连跌序列。关于模型参数的选择,我们的主要思路是控制数量和质量,控制质量指的是参数所确定的模型要能较好地描述我们的实际问题,而控制数量则指的是要避免参数过多所导致的参数估计不准和模型过拟合。在周频择时中,我们最终确定了以三结点的链式结构模型作为我们的模型框架。指数择时测算最后,我们利用上述指标组构建的线性链条件随机场模型对2014年末到2018年初的市场走势进行了预测,测算的指数包括沪深300指数、深证成指、上证综指、上证50和中小板指。测算结果显示,我们的模型在样本外总体表现良好,具有较强的泛化能力和适用性。在不考虑交易费用时,沪深300年化收益率约为14%;考虑双边千二交易成本后,年化收益率约为12%。风险提示本篇报告仅作为基于条件随机场择时的研究,进行投资方法与建模的相关讨论,不提供任何投资建议。图1、基于条件随机场的择时思路图2、沪深300周频择时样本外表现图3、上证综指周频择时样本外...