数据缺失处理方面,均值填充简单便捷,把缺失值用该变量的均值替代,不过可能会使数据方差变小;插值法能依据已有数据的变化趋势估算缺失值,让数据更符合原有规律。处理异常值时,分位数法是确定合理的分位数区间,把区间外的值视为异常值并修正;Z - score法是通过计算数据点与均值的偏离程度,偏离过大的当作异常值处理。
如果你在股票量化投资中还有其他问题,想深入探讨数据处理或量化策略,欢迎点赞,然后点我头像加微联系我,我会为你提供更细致的服务。
发布于2025-5-15 11:53 北京


发布于2025-5-15 11:53 北京