深度学习应用于量化交易有哪些优势?
发布时间:2021-7-15 09:32阅读:670
近年来,深度学习结合业务场景的应用越来越广泛和深入,发展十分迅速。作为数据分析与挖掘的细分领域,量化交易中应用深度学习方法也逐渐被业界重视起来。那么,深度学习应用于量化交易具有哪些优势呢?
交易数据的天然可标记性
目前深度学习还是主要应用于有监督学习,本质是基于数据驱动的统计方法,对样本进行非线性的预测和分类。在深度学习中,给予计算机一个输入(一组变量和数据集),输出是输入变量的结果,机器然后“学习”或“归纳”在输入和输出之间起到链接作用的规则,并把这种规则以参数形式记录在模型结构中。这个过程中要获得大量的准确标记的训练和测试数据是机器能够“学习”的前提,然而这不是件容易的事情。
证券市场则是难得的天然就可以获得海量标记数据的应用场合,传统金融工程中多因子模型是常用的量化分析方法,实践中也已经总结出很多有意义的特征因子,这包括技术分析面、财务基本面、宏观经济面等等各种大类因子,诸如动量/反转,技术指标、估值/增长、质量/效率、规模/波动等等,这些因子作为传统金融工程的成果已经在很多数据服务系统中存在。
证券分析的终极目的也是为了能判断标的资产的趋势,用以指导资产的配置和交易,那么证券市场的历史走势相对于历史时期的特征因子就是天然已标记好的样本。在量化交易分析中,这种输入特征项和市场指数/证券资产的走势的直接关联,可以为深度学习提供训练和验证测试的样本数据。
突破传统行情/基本面等量化数据的限制,新闻、资讯、研报等图像、文本数据通过深度学习的方法也可以生成大数据因子应用于量化投资中,kensho的大数据因子可以看作是“万物和量化交易关联”。我们知道,明星交易员在高频交易时的模式较难进行传统量化,在这方面,一家日本的人工智能初创公司利用基于图像识别的深度学习技术,允许用户很容易地从存档里找到外汇交易图表并帮忙做好分析,这样一来,普通人就能知道明星交易员是如何做交易的,从他们的经验中学习并做出更准确的交易。
交易数据的可迁移性
深度学习的有监督学习除了数据需要标记外,对于海量数据的依赖也是该方法在实际应用中的一个前提。为了让模型具备较高的鲁棒性,除了使用模型结构和参数调整技巧外,还需让海量的数据参与模型训练过程,防止过拟合的情况。
国内证券市场已经发展了近30年,时间虽说不长,但也积累了大量的证券交易数据,考查市场或单个证券的数据,以高频tick数据为例,活跃股票的年累计tick数据在百万量级,这个量级足以用于分析高频量化。但tick数据的时间衰减效应还是比较明显,而且对于中低频量化分析的指导意义也较缺乏。
如果考察日K线的交易数据,那么绝大多数股票的上市以来数据量还不到1万,这样单个证券和市场的低频交易数据就显的不足。当以时间窗口去切片一定时间内的低频交易数据时,比如技术指标、股价形态等特征数据时,则数据量不足的问题会突显出来。
幸运的是,证券市场的数据是天然可迁移的,这体现在市场不同证券之间,甚至不同市场、不同资产之间的波动从量化分析的角度,表现形式上有着很大的相似性,这就为不同市场/证券之间的数据进行迁移学习带来了可能。其实在传统的金融工程中,很多方法也是在不同证券中适用,比如技术指标、波动性分析价差分析、基本面分析等等,情景分析和压力测试大致也是迁移应用的范畴。
通过对证券市场各类数据进行预处理和正规化,也可以增加不同证券数据之间的混合使用的可能性,例如实践中,分钟K线通过正规化后训练的深度学习模型,可以应用到日K线低频投资策略中。针对某一市场训练的深度学习模型也可以应用于另一市场的证券量化交易中。深度学
习模型中特征的自我学习
金融工程是一门专业性很强的学科,传统量化中需要宽客能够提出合理解释证券市场的特征因子,这需要很强的证券投资知识的贮备。以多因子选股模型为例,传统量化中需要宽客能够提出合理的因子组合,不同因子解释组合alpha效应的能力是不同的,如果要从大量因子库中获取有效的因子组合,分析人员专业的经验非常重要。
量化交易中复杂数学模型的应用如ARIMA、协整、分形、小波分析、HMM等等对数学要求还是比较高。传统金融工程复杂数学模型通常是一个白盒系统,一些复杂控制模型应用于时间序列数据的分析,需要分析人员深刻理解模型的原理和数据分析应用场合。
深度学习中的数学逻辑虽然也很复杂,但深度学习的应用场景在具备标记数据的情况下,方法和流程是很清晰的。当我们把深度学习的特征工程和模型结构调整作为重点,忽略模型的黑盒性质的解释,那么使用深度学习模型会明显降低量化分析的门槛。
深度学习的模型中,通过模型结构的调整,改变模型深度(层数)、宽度(节点数)以及节点计算和层级之间数据传递的方式,根据问题自动建立相应的模型,并可以持续改进,然后达到完美的境界,这使得它具有很强的灵活性和成长性。此外,深度学习也有许多种不同的实现形式,根据解决问题的不同来灵活运用。
深度学习提出了一种让计算机自动学习出模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备性。深度学习几乎不需要处理原始数据,并自动学习最有预测性的特征,而不需要对数据的正确分布做假设。目前以深度学习为核心的某些机器学习应用,在满足特定条件的应用场景下,已经达到了超越现有算法的识别或分类性能。
例如,深度学习模型中的循环神经网络RNN、长短期记忆模型LSTM可以直接针对原始的股价时间序列进行分析;当我们按一定时间窗口对股价进行切片,将切片数据按照时间顺序组合成矩阵数据,形成类似像素矩阵的图片格式,那么还可以使用卷积神经网络CNN来进行分析。
使用深度学习的模型能让数据分析师在基本了解证券市场知识的情况下,也能像金融工程专家一样寻找证券市场波动背后的规律。当然,金融工程人员的业务知识在特征提取中也十分重要。针对DNN等深度学习模型,根据原始数据使用先验知识加工出有效的特征因子作为输入项,可以更好地训练出模型。
深度学习模型对非结构化数据的支持
证券市场一直以来都是一个可以利用信息不对称而获利的市场。例如,股票市场每时每刻都与海量数据密不可分。随着大数据解决方案的普及,我们可以搜集更多维度的数据来更精细地进行投资分析,包括利用一些新闻资讯数据、舆情信息数据、电商数据甚至是卫星图像、地理信息数据等等。投资者需要及时地获取尽可能全面而准确的信息,以快速做出有利决策,这给业内人士提出了各种难题和挑战。
由于金融数据类型和范围的大幅扩大,新投资业务风险环境频繁演化,传统人工迭代模型无法适应市场变化速度,迭代优化较慢。量化分析模型面对的往往是加工出来的上千维度变量特征。面对数据繁杂的问题,基于深度学习的模型已被大量运用于这些数据的分析中,对诸如文本、图像、语音等非结构化数据实现了深层特征加工提取,显现出超乎想象的优势。
2011年伦敦一家资产管理公司就推出了全球首支基于社交媒体的大数据对冲基金,该基金将twitter作为观察投资者情绪的窗口,以期获得超额收益;还有投资机构将港口货轮的卫星图像用于大宗商品的量化分析。将AI+大数据因素纳入投资分析框架,也已成为许多专业机构的重点系统配置。
综上所述,深度学习应用于量化交易的优势在于训练样本的自然可获取、海量特性和特征自我学习等方面。深度学习模型在数据分析的普适性解放了量化分析人员的业务分析能力,在研究过程中研究人员主要的工作会集中于业务分析及特征工程,以及如何提取更有效的因子特征作为深度学习模型的输入项,使得金融工程人员能够更好的发挥专业特长。



温馨提示:投资有风险,选择需谨慎。
-
节后首日见分晓:中信证券2025国庆假期收益测算出炉!
2025-09-28 10:27
-
小米17系列全面对标iPhone17系列,战绩亮眼!但仍需时间考验
2025-09-28 10:27
-
国庆金融影单:十部豆瓣高分电影▶️,让你边躺边学~
2025-09-28 10:27