什么是量化选股中的因子“共线性”?为什么因子堆叠越多效果越差?
发布时间:6小时前阅读:12
在量化选股模型的研发过程中,许多初学者经常会陷入一个“以量取胜”的思维误区:认为既然多因子策略是通过不同的特征指标来综合评判股票的,那么只要在策略代码里堆叠足够多的指标,选股模型就一定会越精准。于是,他们将市盈率(PE)、市净率(PB)、市销率(PS)、企业价值倍数(EV/EBITDA)等几十个因子一口气全部塞进模型里。然而,历史回测和实盘结果往往会给这种盲目堆叠浇一盆冷水——因子加得越多,策略的超额收益往往反而越差、回撤越大。这种现象,正是由于因子之间产生了严重的“共线性(Multicollinearity)”。
什么是因子的共线性?通俗来说,就是你所选用的多个因子,其背后的数理底层实际上都在表达和计算“同一种市场特征或同一种信息源”。
以刚才提到的PE、PB、PS因子为例。虽然它们的计算公式不同(分别对标利润、资产和销售额),但在金融市场的真实运行中,它们在本质上都属于“估值/便宜度”这一单一维度的特征。一家因为行业低迷而被市场集体冷落的传统钢铁厂股票,它的PE通常很低,PB通常也很低,PS同样也会处在低位。
如果你在打分系统中,把这三个高度相关的因子直接简单进行加权叠加,在数学上就相当于把“估值”这一项考核指标的权重,在无形中放大了三倍。这就会导致你的选股模型产生严重的方向性偏见:程序选出来的最终股票池,会极度单一地集中在银行、地产、钢铁等特定低估值传统板块,而把电子、医药、AI等高估值但高成长的优质弹性个股全部无情过滤掉。这种“偏科”的投资组合,不仅彻底丧失了资产分散风险的量化初衷,一旦市场风格发生反向切换,账户净值就会遭遇集中的惨烈回调。
真正的量化选股艺术,追求的是因子之间的“低相关性”与“互补性”。一个健康的多因子骨架,应当精简而全面:包含1个纯净的估值因子(考察便宜度),搭配1个高质量的ROE因子(考察赚钱能力),再搭配1个量价动量因子(考察资金情绪)以及1个低波动因子(考察防守韧性)。每个维度的因子各自独立,在数学上保持垂直交错,才能在市场的风向变动中实现真正的东方不亮西方亮。
量化交易的核心优势,是用程序代替人工,规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制,10万入金即开QMT/PTrade专业版,再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持,让普通投资者也能轻松解锁智能交易工具。利用我司系统内置的科学计算和高阶数据分析接口,投资者可以在Python开发环境中一键计算因子之间的相关性矩阵,轻松识别并剔除共线性冗余。搭配我司提供的全线上极速业务开通服务、超级优惠的交易佣金费率让利,以及专业量化社群的7x24小时全天候答疑指导,协助您清洗冗余,打造纯正、精悍、高效的机构级智能选股战队。
温馨提示:投资有风险,选择需谨慎。


问一问

+微信
分享该文章
