量化投资的生产线是如何运作的?
发布时间:2021-8-11 09:48阅读:286
截至8月4日,最新的百亿私募家数已经增至84家,而百亿规模的量化私募也已扩充至17家。
大众对量化投资的了解,可能还是来自于西蒙斯与文艺复兴公司(大奖章基金)的传说。加上新闻媒体的演绎,使得量化投资有了更多神秘的色彩。
其实,广义上来说,凡是借助于数学模型和计算机实现的投资方法都可以称为量化投资。在国内,比较常见的量化投资包括股票多因子策略、期货CTA、套利策略和高频交易等。
虽然量化领域,学神云集竞争激烈,但作为投资者,简单了解量化投资流程,稍稍打开神秘的黑箱还是很有必要的。
1、量化投资的特征
从世界范围来看,量化投资已经成为一种主流方式。在2004年时,全球量化对冲基金资管规模的前10名仅有一家是量化机构,那就是排在第10名的桥水。到了2018年,同样的资管排名,前六位都是量化机构。
图片
和主观交易相比,量化投资与其差异可以参考下图。如果要说具体的优势,可以总结为:客观性、大数据、响应快。
图片
量化投资一般通过回测来证实或者证伪策略的历史有效性,执行交易时通过程序自动完成下单的,在很大程度上保证了决策的客观性,受人为情绪等因素的干扰较少。
在研究或者决策中,通常会引入大量的数据来进行分析。同一套代码,就可以同时分析和监控全市场4000多家股票。这种效率在传统投研方法中是做不到的(当然,传统投研对公司基本面的研究可能更深入)。分析、响应和执行的速度都十分迅速,完全可以达到毫秒级(比如获得行情到下单延时低于10ms)。在完成大量的日内或偏高频交易时,显然会比人工更有优势。
2、因子是怎么来的?
整个量化投资流程至少会涉及以下几个环节(股票策略为例):因子挖掘(策略研发)、投资组合构建、算法执行优化。
首先是因子挖掘。因子的来源很多,有人工挖掘的包括数理统计方法以及基本面财务建模,也可以是机器挖掘的。最初可能是一个想法,它可以来源于市场,或者是学术论文,也可以是卖方研报,甚至是朴素的直觉与灵感。比如我猜想证券股收益和券商研报下载量或者点击量有关。某券商研报下载量越高,说明与该券商有业务往来的人越多,未来盈利增长的空间更大,股价可能将会上涨。(这可能算是另类因子)
有了想法之后,就需要进行数据处理了。接着上述的假设,就需要从交易所获得这些券商历史行情数据,再用爬虫等工具获得研报下载量或者点击率数据。根据策略想法的不同,数据来源可以是研究报告、公司公告、定期财报,也可以是新闻、交易所行情,还可能是一些另类数据,比如电商的销售数据(用来预测消费类标的股价)。然后,还需要将这些原始数据清洗处理成标准的结构化数据。接下来,就能借助数理统计的方法,来观察券商研报下载量或者点击率和股价表现到底是否有正相关性。其实整个过程就是不断从历史数据中挖掘有望在未来重复的历史规律并且加以利用。
对于一些信号周期比较长的策略会用到更多历史数据(比如10年)来进行样本内及样本外测试和交叉数据验证,以减少训练数据过程中发生过拟合情况(假设6、7月艳阳天时沪深300都是阳线,于是得出「规律」,天晴与指数上涨有相关性,那就是过拟合了,随着样本数量增加,可能会发现两者毫无关系。)
经历过测试之后,这些因子就可以投入到生产环境了,当然基金管理人团队会不断挖掘新因子,维持更新迭代以适应市场的变化和竞争。因子的划分,最常见的应该是量价因子(交易型)和基本面因子。趋势、反转、动量、流动性、波动率等因子都属于量价因子,你能想到的一些「技术指标」也可以归为此类,当然现在很多机构预测的时间维度可以很短,甚至是全时段覆盖的。
基本面因子,也是基于数量统计来找规律,数据来源方面有很大一部分是财务报表。比如:估值因子(市盈率、市净率、市销率、企业价值倍数等);成长因子(营业收入增长率、营业利润增长率、净利润增长率等);盈利能力因子(销售净利率、财务费用比例、息税前利润与营业总收入比等);杠杆因子(负债权益比、资产负债率等)……
还有一种另类因子,比如新闻舆情,网站搜索数据,媒体报告都可以归于此类。
3、组合、优化和执行
更多更有效的因子,优质的因子库无疑是提高收益的关键因素之一。但是在获取了成千上万个有效因子后,如何组合起来同样非常重要。因为完全有可能出现单因子策略效果还不错,但是组合起来多因子效果反而变差的情况。
先假设一些因子组合的逻辑。盈利性和估值组合,所选择的公司在现有资源上能够产生显著的回报(包括基于损益表和现金流量表的盈利性),而且确保投资者不会为这些资源支付过高的价格;成长性和估值组合,成长性表明该公司的收入或现金流产生能力的增加,而且估值确保投资者不会为这样的增长付出过高的价格……
但现在可能有数万个因子放在面前,到底要怎么办?事实上,很多机构都会自主研发程序化算法,然后依据因子长期表现将多因子叠加进行选股得出更稳定的组合。通过历史回测检验构建的因子组合是否能在各种市场风格下都有稳健的表现。所以,组合构建的工作主要也是由计算机完成的,会用到深度神经网络的算法,进行非线性拟合。
利用算法交易,在交易执行下单时也会进行拆单等优化操作,这也是可以增厚利润的(贡献约年化6%至8%的收益)。
在交易时段,可以实时刷新获取全市场交易数据并(利用因子组合)对价格进行预测,进而发出目标持仓信号。在报单前可以用植入的检测逻辑来确保委托价格、数量均在正常合理范围,有效避免报错单。以程序完成交易,响应速度的优势能让订单被快速执行,更早被撮合成交,也能规避人工下单时可能产生的误操作及主观情绪等因素。
简单总结,量化投资就是借助现代统计学、数学的方法,利用计算机技术,在海量历史数据中寻找能够大概率带来超额收益的多种策略和规律。
在此基础上,综合归纳成因子模型程序,最终纪律严明地按照这些策略所构建的数量化模型来进行投资,力求取得稳定、可持续的超额收益。
(以上文章转载于科普学堂)
各种投资问题,股票和两融开户欢迎详询微信/电话:18529285999!老牌上市券商!支持同花顺,雪球,腾讯自选股等三方软件交易,享一对一投顾服务


温馨提示:投资有风险,选择需谨慎。



-
2025年端午节假期享收益,赶紧码住这份攻略
2025-05-26 10:29
-
打新预告来啦!来看看这两支新股潜力如何~
2025-05-26 10:29
-
为什么粮食ETF会上涨?
2025-05-26 10:29