什么是多因子模型中的“因子正交化”？用线性代数斩断因子同质化内卷

立即提问“ ”

提问

北京[切换城市]

找证券公司 | 找期货公司

叩富问财>资讯>其他>什么是多因子模型中的“因子正交化”？用线性代数斩断因子同质化内卷

什么是多因子模型中的“因子正交化”？用线性代数斩断因子同质化内卷

发布时间：2026-6-8 09:52阅读：117

量化张经理股票

资质已认证

帮助10万+ 好评1293 入驻5年

问一问

在开发量化多因子选股策略时，很多开发者喜欢扮演“多因子收藏家”的角色。他们每天不停地往系统里塞入新的指标：今天听技术流说 5 日动量很好，加进去；明天看研报说 MACD 金叉很灵，加进去；后天又觉得 ROC（变动率）指标不可或缺，再加进去。最后，他们的复合因子选股模型里塞满了十几个看似不同的量价技术因子。然而，参数调优后的实盘表现却让他们大失所望，策略的收益不仅没有提升，反而因为维度灾难变得极其不稳定。这是因为他们掉进了多因子开发中最经典的统计学陷阱——“因子高度多重共线性（Collinearity）”。换句话说，你加进去的十几个因子，在数理本质上全都是“换汤不换药”的同一类动量因子的变体。这种因子同质化内卷，会导致量化权重矩阵严重失真。要解决这个难题，量化大厂的标配底牌是引入线性代数中的——“因子正交化（Factor Orthogonalization）”。

因子正交化的数理哲学极其深刻：它的目标是将一组彼此高度相关、互相内卷的原始因子矩阵，通过矩阵变换，投影到一个全新的几何坐标系中，生成一组在统计学上彼此相关系数绝对为零（完全垂直正交）的全新因子组合。

在 Python 编程实践中，最常用的两种因子正交化工程手段是“施密特正交化（Gram-Schmidt）”和“对称正交化（Symmetric Orthogonalization）”：

以经典的对称正交化为例，其底层的矩阵求解逻辑如下：

第一步，在每个调仓日横截面上，准备好 $M$ 只股票的 $N$ 个原始因子组成的非正交矩阵 $F$。首先对该矩阵进行 MAD 去极值和 Z-Score 标准化处理。

第二步，计算这组标准化因子的相关系数矩阵（Correlation Matrix） $\Sigma = F^T F$。因为因子之间存在内卷相关性，这个相关系数矩阵的对角线之外会充满了非零的大数字。

第三步，利用线性代数中的奇异值分解（SVD），求解相关系数矩阵的特征值对角矩阵 $D$ 和特征向量矩阵 $U$，使得 $\Sigma = U D U^T$。

第四步，动态构建正交变换矩阵 $S = U D^{-1/2} U^T$。最终，正交化后的全新因子矩阵计算为：

$$\hat{F} = F \times S$$

经过这一套极其硬核的线性代数矩阵洗礼，生成的全新复合因子矩阵 $\hat{F}$ 展现出了近乎完美的数理美感：因子与因子之间的相关系数彻底变成了 0。这意味着它们之间所有的同质化水分都被无情斩断，每个因子都代表了市场上一个绝对独立的、互不内卷的超额收益解释维度。用这种正交化后的精纯因子矩阵去跑多因子选股，模型的泛化能力和实盘稳定性将会实现质的飞跃。

量化交易的核心优势，是用程序代替人工，规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制，10万入金即开QMT/PTrade专业版，再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持，让普通投资者也能轻松解锁智能交易工具。全市场海量个股因子相关系数矩阵的高频求解、特征值与特征向量的非线性矩阵求逆，需要量化终端具备强大的科学计算能力。国金证券提供的QMT与PTrade系统提供了完全开放的 Python 第三方科学计算环境，完美支持 NumPy、SciPy 以及 Pandas 的高级矩阵代数运算，散户可以在几行代码内轻松部署机构级的对称正交化算法。我们还提供贴心的专业量化社群答疑与实操指导，帮您科学梳理多因子模型的底层数理骨架，并奉上超优惠的佣金费率与线上业务办理服务，全方位赋能您的智能交易体系。

温馨提示：投资有风险，选择需谨慎。

量化张经理

两融账户可在线办理，支持智能条件单和网格交易，佣金成本价

+微信

当前我在线最快30秒解答立即追问 99%的人选择

文章很精彩？转发给需要的朋友吧

版权及免责声明：本文内容由入驻叩富问财的作者自发贡献，该文观点仅代表作者本人，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决策投资行为并承担全部风险。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至kf@cofool.com 举报，一经查实，本站将立刻删除。

推荐相关阅读

什么是多因子模型？什么是多因子模型？

多因子模型是量化投资中常用的工具，通过筛选影响资产价格的多个关键因子（如估值、成长、动量、波动率等），构建数学模型来评估资产价值、预测收益。它将复杂市场拆解为可量化的维度，帮助投资者更...