风险中性的深度学习选股策略1金融工程|专题报告2018年6月3日证券研究报告文巧钧S0260517070001邮箱:wenqiaojun@gf.com.cn安宁宁S0260512020003邮箱:anningning@gf.com.cn广发证券金融工程2018年6月3日CONTENTS目录>风险中性的机器学习模型02>策略与实证03>总结04>组合表现012INTRODUCTION01|问题背景|>01020304010203043-6%-4%-2%0%2%4%6%8%10%00.511.522.533.544.5500净值对冲收益率(右轴)对冲净值多头净值问题背景4深度学习选股策略表现:全市场选股,中证500指数对冲2011年以来,年化收益率18.5%,最大回撤-4.77%,月度胜率为81.8%数据来源:Wind,广发证券发展研究中心5新的思考如何减小组合的风险暴露?如果当前市场与历史数据差别较大时,如何使得机器学习模型有效?能否构建在不同风格市场上表现稳定的机器学习选股模型?如何减小机器学习交易策略的同质化问题?背景组合优化?模型更新???THEORY02010304|风险中性的机器学习选股模型|>0103040267模型训练:通过训练样本,确定模型结构,优化模型参数预测输出Y的维度:3输入特征X的维度:156(128个因子+28个行业)通过网格搜索获取最优的模型结构选取模型结构为:156(输入层)-512-200-200-200-128-3(输出层)即一共包含5个隐层隐层节点数依次为:512(隐层1)、200(隐层2)、200(隐层3)、200(隐层4)、128(隐层5)深度学习预测模型上涨平盘下跌8隐层激活函数:输出层激活函数:,对于分类问题,一般用Sigmoid函数或者Softmax函数2(2)(2)(2)01()Nkokjjkjywhw1(2)(1)(1)(1)01()Njhjiijihwhw(1)(0)(0)01()xNjhjiijihwxw𝜎ℎ𝜎𝑜()TiTixTixexe多分类问题深度学习预测模型(以2个隐层的网络为例)9参数优化方法:BP算法,迷你批量梯度下降算法集成了梯度下降法和随机梯度下降法的特点2111()NKnknknkEytNKw待优化网络参数:w优化目标:最小化均方误差(MSE)预测输出实际标签()(1)(1)():()kknnnijijnnBatchnijwwEww深度学习预测模型10提高深层神经网络选股性能的主要方法:1、采用relu等激活函数2、将优化目标函数MSE改成交叉熵3、Batchnormalization技术4、Dropout技术深度学习预测模型11采用Keras作为机器学习平台:可以选择Tensorflow、CNTK、Theano(目前已经停止更新)作为后端目前已经支持多GPU显卡选择:NvidiaGTXTitanXP,GTX1080Ti,GTXTitan,GTX1080,GTX1070,GTX10...