什么是量化选股中的多因子正交化?普通人如何通俗理解?
发布时间:3小时前阅读:9
在学习高阶股票量化交易策略时,许多投资者经常会在投研报告或专业书籍中看到一个非常高大上的数学词汇——“因子正交化(Factor Orthogonalization)”。对于没有深厚统计学和线性代数背景的普通人来说,这个概念往往令人望而生畏。然而,如果用生活中的通俗例子来类比,多因子正交化的底层逻辑其实非常直接,它是为了解决选股标准中的“信息重复和冗余”问题。
我们可以用“选拔学校篮球队员”来打个比方。假设教练有一套打分选拔系统,包含两个考察指标(因子):第一个指标是“身高”,第二个指标是“摸高高度”。在实际筛选时,教练会发现,身高两米的同学,其摸高高度通常也非常惊人。这两个指标之间存在极强的“正相关性”。如果教练在计算总分时,直接把身高得分和摸高得分加在一起,由于这两者本质上都在考察同一个身体天赋(即长得高),就会导致“身材高”这一特征的权重被无形中放大了两倍,而忽略了球员的“运球速度”和“投篮准星”。
在量化股票多因子策略中,这种现象被称为“因子的多重共线性(Multicollinearity)”。例如,投资者同时使用了“市盈率(PE)”因子和“市净率(PB)”因子来寻找低估值股票。由于便宜的股票往往 PE 和 PB 同时都很低,如果直接混合使用,估值因子的影响力就会严重超标,导致选出来的股票池高度集中于银行、地产等特定传统板块,失去了分散风险的作用。
多因子正交化的通俗解释,就是利用数学工具(如施密特正交化、PCA主成分分析等)对相互关联的因子进行一次“脱水和剥离”手术。
它的运行逻辑是:
首先,承认“身高”是一个核心因子。
然后,在审视“摸高高度”这个因子时,通过数学投影,把摸高数据中由于“长得高”带来的那部分自然增量彻底剔除掉。剥离之后,摸高因子就只剩下纯粹的“弹跳力与臂展”信息。
经过这样一次清洗,改造后的“新摸高因子”就与“身高因子”变得完全垂直独立(即正交)。此时,它们之间不再有任何信息重叠,每一个因子都在纯粹地贡献自己独特的选股视角。
量化交易的核心优势,是用程序代替人工,规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制,10万入金即开QMT/PTrade专业版,再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持,让普通投资者也能轻松解锁智能交易工具。利用QMT和PTrade系统内置的底层高级数据分析接口,投资者可以非常方便地调用两市股票全面的基础因子数据,并在Python环境下结合SciPy、NumPy等科学计算库轻松实现因子的正交化清洗与高效多因子权重配置。配合我司提供的全面线上开户、超级优惠的佣金费率支持以及活跃的专业量化社群技术指导,助您搭建出更加纯净、科学的专业级选股模型。
温馨提示:投资有风险,选择需谨慎。
什么是量化多因子选股?有用吗?


问一问

+微信
分享该文章
