什么是量化选股中的因子“正交化”?如何剔除策略里的重复功劳?
发布时间:2小时前阅读:14
在构建一个由几十个技术指标或基本面特征组成的高阶量化多因子选股策略时,许多研究人员在做完回测后会发现:虽然每个单独的因子在历史上都表现出了极强的选股能力,但一旦把它们强行拼装组合在一起,模型的总收益非但没有成倍增加,反而出现了严重的逻辑钝化。在量化工程学中,解决这一难题的核心技术叫做“因子正交化(Factor Orthogonalization)”。
要理解正交化,我们可以用一个通俗的职场考核来类比:假设一家公司考核员工,设置了“出勤率”、“打卡准时度”和“加班时长”三个考核指标。虽然这三个指标听起来侧重点不同,但在本质上,它们都在重复考核员工的“工作态度/勤奋度”。如果直接给这三个指标分别打分并相加,就会导致“勤奋度”的权重被严重高估,而真正决定公司业绩的“业务创新能力”和“客情维护能力”就会被完全掩盖。
在多因子量化模型中,类似的情况屡见不鲜。比如动量因子中的“5日累计涨幅”和“10日累计涨幅”,在数理统计上它们的相关性极高。如果不做处理直接叠加,模型就会给那些短期内极度暴涨、风险极高的妖股打出不切实际的高分,导致组合在实盘中频繁踩雷。
因子正交化的本质,就是利用数学矩阵运算(如格拉姆-施密特正交化、对称正交化),把这些相互纠缠、信息重叠的影子因子进行“数理清洗与剥离”。
具体操作中,程序会指定一个核心因子作为基准,然后让其他相关因子去跟它做回归,剔除掉那些能够被基准因子完美解释的“重复信息”,仅仅保留那些完全独立的“净剩余超额信息”。经过正交化清洗后的新因子库,彼此之间相关系数为零,相互垂直交错。这样构建出来的多因子打分系统,才能做到各司其职,彻底拒绝策略内部的“重复记功”,实现真正的分散化组合优势。
量化交易的核心优势,是用程序代替人工,规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制,10万入金即开QMT/PTrade专业版,再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持,让普通投资者也能轻松解锁智能交易工具。借助我司提供的高阶策略交易终端,系统完整的Python科学计算框架完美支持各类高级矩阵运算与因子去相关、正交化模块。结合我司全流程线上极速办理渠道、全行业领先的超级优惠佣金费率方案,以及24小时量化社群的专业技术答疑,助力您的选股逻辑去粗取精,迈向科学量化的至高阶梯。
温馨提示:投资有风险,选择需谨慎。


问一问

+微信
分享该文章
