数据质量评估维度:
完整性:是否存在缺失值(如某交易日无成交数据)。
准确性:数据是否真实反映市场(如复权价格计算错误)。
一致性:多数据源间是否存在差异(如不同平台的成交量不一致)。
时效性:数据更新是否及时(如延迟推送的实时行情)。
一致性:时间戳是否对齐(如分笔数据与分钟线数据不匹配)。
低质量数据的影响:
回测偏差:缺失或错误数据导致历史表现虚高(如忽略除权除息导致收益率计算失真)。
策略失效:实时数据延迟可能错过交易机会或触发错误信号(如高频套利策略因数据延迟导致价差计算错误)。风险误判:财务数据错误可能导致多因子模型选出高风险股票(如虚增利润的企业)。
过拟合风险:噪声数据可能使模型学习到虚假模式(如随机波动被误判为趋势)。
发布于2025-5-21 15:25 武汉

