- 基于机器学习的量化投资建模研究
- 贺毅岳
- 1831字
- 2025-02-17 12:50:47
摘要
以深度学习为标志的人工智能与机器学习新技术在语音识别、图像理解等应用领域取得突破性进展,激发了金融学者对大数据、人工智能与机器学习的研究兴趣,使得利用机器学习进行量化投资建模成为当今金融科技和量化投资领域研究的前沿热点之一。其中,如何将前沿的机器学习方法深度应用于复杂金融数据建模与量化投资建模研究实践中,进而基于投资约束与目标构建智能、自适应的主动型量化投资模型,是一项极具吸引力和挑战性的金融量化投资研究课题,受到机构投资者和证券交易监管当局的高度关注。
本书从金融投资、机器学习和信号处理等多学科交叉视角,深入研究基于机器学习的金融预测建模与量化投资策略构建问题,主要包括股票价格与交易量分布的预测、行业板块指数互动关系建模、基于预测的量化择时策略构建,以及基于深度强化学习的实时在线最优组合构建等关键问题。具体包括如下五方面内容:
(1)基于机器学习的股票价格与交易量预测建模。针对股价时序中复杂波动模式有效提取与高精度预测的难题,将经验模态分解(EMD)及其改进方法,包括集合经验模态分解(EEMD)和自适应噪声完备集合经验模态分解(CEEMDAN),引入股市指数预测建模研究中。首先,提出EMD分解下基于支持向量回归的股价集成预测方法EMD-SVRF;其次,采用遗传算法(GA)自动执行超参数优化,提出遗传算法改进的指数预测建模方法EMD-GA-SVR;再次,提出EEMD与SVR结合的沪深300指数预测建模方法EEMD-SVRP;最后,将CEEMDAN的自适应完备分解功能与长短期记忆网络(LSTM)高效提取复杂序列中长期依赖关系的优势有效结合,采用“分解—集成—预测”的思路,提出指数集成预测方法CEEMDAN-LSTM。实验结果表明,本书提出的股价预测建模系列方法具有更高的预测精度和更低的预测滞后性。
(2)基于机器学习的股票指数日内交易量分布预测建模。现有的预测建模方法难以有效提取日内交易量分布随时间演变的复杂变化规律,导致日内交易量分布预测误差过大。为此,本书提出一种MEMD分解下基于LSTM-Attention的指数日内交易量分布预测方法M-LSTM。首先,运用MEMD将区间交易量多维时间序列分解为若干个独立的本征模态函数(IMF)和一个趋势项;其次,对各维度中高频IMF进行去噪和重构处理,获得降噪后的日内交易量区间分布;最后,构造基于LSTM-Attention网络的日内交易量分布多元预测模型。与现有交易量分布预测方法的对比实验表明:M-LSTM具有更低的预测误差,是一种更精确、有效的日内交易量分布预测方法。
(3)基于机器学习预测的股市指数量化择时研究。具体包括三个方面的研究内容:①提出基于EEMD-SVR的指数低频分量预测模型,并以低频分量预测结果为基础制定择时交易信号生成规则,构建基于低频分量趋势预测信号的沪深300指数择时策略。对比实验表明:该策略能更有效地把握指数的中长期主要运行趋势,其收益获取与风险控制能力更出色。②构建基于CEEMDAN-LSTM预测的市场指数择时策略,对比实验证实:该策略依托其对指数的高精度预测,大幅提升了择时信号的准确度,其回测表现显著超越对照策略。③BBS算法选取最优小波包基,对上证综指进行小波包非线性阈值消噪,针对传统均线策略买卖信号滞后性,利用不同分解水平的小波低频分量能够反映信号基本和次级趋势且不具滞后性的特点,提出一种基于小波低频分量的量化择时策略,实验表明该策略在提示基本和次级趋势买卖信号的同时可降低交易信号的滞后性。
(4)股票行业互动关系建模及择时策略研究。具体包括三个方面的研究内容:①提出MEMD-Apriori行业轮动分析模型,运用MEMD方法对申万一级行业指数进行去噪,并利用最大信息系数(MIC)测度各行业指数的相关关系,然后将行业指数转为收益率序列,并设定适当的阈值以确定指数的涨跌标签值,进而运用Apriori算法挖掘不同行业指数间的涨跌关系规则。②以相关行业指数为输入数据、以目标行业指数涨跌状态为输出标签,构建基于MEMD-SVC的行业指数涨跌关系模型。③分别以MEMD-Apriori、MEMD-SVC行业指数涨跌分类模型为基础,生成择时信号并构建相应的择时策略,进而进行仿真回测以评估策略有效性。
(5)基于深度强化学习的在线最优投资组合构建研究。结合深度学习的感知能力和强化学习的在线决策能力,将卷积神经网络引入DDPG算法模型,提出了基于深度强化学习DDPG算法的在线最优投资组合构建模型,可实时感知金融市场行情的变化,并通过强化学习决策算法自主调整组合权值,获得实时在线最优投资组合,从而实现了投资组合管理自动化、智能化。采用真实的股票价格数据对所构建的模型进行了训练和测试,并以上证50指数收益率为基准,深入分析DDPG在线最优组合交易策略的收益获取与风险控制能力,实验结果表明,该策略的综合表现明显超越了基准策略。