核心原理
PCA 通过线性变换将高维因子空间转换为低维主成分空间,保留数据方差最大的方向(即关键信息),剔除冗余维度。
关键步骤:
标准化因子:消除量纲差异(如市盈率与波动率)。
计算协方差矩阵:衡量因子间相关性。
特征值分解:提取主成分(按特征值从大到小排序,累计方差贡献率达 80%-90% 时停止)。
因子载荷映射:通过主成分与原始因子的线性组合,识别驱动收益的核心因子(如价值因子、动量因子)。
信息保留与冗余减少
保留关键信息:主成分累计方差贡献率反映信息保留程度(如前 3 个主成分解释 70% 方差,则视为保留核心驱动因素)。
减少冗余:剔除低方差主成分(对应特征值接近 0),避免因子间多重共线性导致的模型过拟合(如市值因子与成长因子高度相关时,PCA 可合并为规模主成分)。
发布于2025-5-21 15:51 武汉

