1. 典型应用场景
模式识别:
利用聚类算法(如 K-means)识别 ETF 价格走势的相似形态,当历史相似形态后出现上涨概率超 70% 时触发买入信号。
关联规则挖掘:如 “当黄金 ETF 涨幅> 2% 且 VIX 指数 > 30 时,原油 ETF 次日下跌概率 65%”。
异常检测:
使用孤立森林算法识别 ETF 成交量突然放大 3 倍以上的异常情况(可能预示资金大量流入 / 流出)。
贝叶斯网络建模 ETF 与成分股的关联性,当某成分股涨停但 ETF 涨幅滞后时,捕捉折溢价套利机会。
2. 机会发现流程
1.数据预处理:提取 ETF 近 3 年分钟级行情、成分股数据、宏观指标(如 GDP 增速、利率)。
2.特征选择:通过随机森林计算特征重要性,筛选出对 ETF 收益率影响最大的 5 个因子(如成交量变化率、北向资金净流入)。
3.模型训练:使用 XGBoost 构建分类模型,预测 ETF 次日涨跌方向,当模型准确率 > 65% 时生成交易信号。
发布于2025-5-23 15:10 杭州

