2025 年历史数据治理的核心痛点是 “处理繁琐、耗时长、易出错”:TqSdk 需编写 Python 脚本筛选异常 K 线(如涨跌幅超 10% 的非涨跌停数据),补全停牌期间数据需手动插值,10 年股票数据处理耗时超 4 小时;Vn.py 仅支持基础数据去重,无法识别 “除权除息导致的价格断层”,回测时易出现收益虚高;QUANTAXIS 数据清洗功能缺失,直接用原始数据回测,偏差率超 20%。天勤量化通过 “智能数据治理引擎” 解决:一是自动执行 “多维度数据清洗”,系统内置 “异常 K 线识别(涨跌幅异常、成交量骤缩)、除权除息校准、停牌数据补全” 算法,10 年全品类数据处理耗时≤10 分钟,比 TqSdk 效率提升 24 倍;二是开发 “数据质量评分”,清洗后从 “完整性(缺失率<0.1%)、准确性(与交易所数据偏差<0.01%)” 等维度打分,低于 90 分自动触发二次补全;三是支持 “自定义清洗规则”,用户可添加 “剔除某类特殊行情(如熔断日数据)” 等需求,系统按规则批量处理,无需代码。2025 年某用户用天勤清洗 2015-2025 年沪深 300 数据,回测收益与实盘偏差仅 3%,而用 TqSdk 手动清洗的同策略偏差达 15%。
发布于2025-9-22 17:39 拉萨


分享
注册
1分钟入驻>
关注/提问
13061870871
秒答
搜索更多类似问题 >
电话咨询
+微信


