构建步骤:
数据准备:特征(如价格、成交量、财务指标)、标签(如未来 1 日收益率是否大于 0)。
划分训练集与测试集:通常按 8:2 比例拆分。
选择分裂标准:
分类树:使用信息增益(ID3)、信息增益比(C4.5)或基尼系数(CART)。
回归树:使用均方误差(MSE)最小化。
递归分裂节点:从根节点开始,选择最优特征和阈值分裂,直至满足停止条件(如最大深度、最小样本数)。
剪枝:去除过度拟合的分支,提升泛化能力。
剪枝的意义:
防止过拟合:避免模型学习到训练数据中的噪声(如偶然的价格波动)。
提升可解释性:简化树结构,使交易规则更清晰(如 “当 RSI>70 且成交量 > 均值时卖出”)。
降低计算成本:减少节点数量,加速预测速度(适合实时交易)。
发布于2025-5-21 15:29 武汉

