商品基本面量化系列(五):油粕多因子套利策略探索
发布时间:2023-9-1 21:50阅读:223
一般而言,套利相较于方向性策略上方的收益空间有所减小,但同时也具备更高的安全边际。如果我们以截面和时序的角度来看待这两种交易方法,通过对海外运行时间较长的主观和量化策略进行分析可以得出,在当前技术条件下,量化策略的优势更多体现在截面维度,即在配对交易方面能够获取更高胜率的收益。这主要是某些特定数据由于路径和形式的原因无法被准确地定量观测,从而导致特征深度上所欠缺。在对品种基本面进行无差别的观测和度量方面,主观上存在更多判断依据;而对于多个品种构成的截面进行相对强弱地排序或类比,量化方法具有更高的兼容和评价能力。这也是我们继能化、有色和黑色品种的量化基本面研究之后,在农产品板块中尝试套利研究的原因。
油粕套利作为农产品板块中较为活跃的套利方法在市场上运行已久。豆油和豆粕同为大豆的压榨产物,豆粕主要用于饲料,豆油主要用于食用和生物柴油。油厂的高利润和亏损均不具有可持续性,为豆油和豆粕之间的套利提供了产业基础。除了基本面的合理性之外,本文也从统计模型和时间序列的角度对油粕比值的协整性和可预测性等指标进行了论证。
实证研究显示:
1. 基于通道模型的整体收益表现优于加入过滤机制后的情况,年化收益为22.2%,最大回撤13.7%,年化开仓次数11次,夏普为1.16。加入过滤机制后的策略开仓次数有所减少,最大回撤降低,但年化收益较量价策略缩窄,为10.52%。
2. 历史合约上看,进入18年之后,01交割合约的收益情况普遍好于其他合约的情况。01合约区间开仓次数也大于其他月份合约为4-5次,而05合约的开仓次数则偏少为1-2次,区间收益普遍低于另外两个合约。
一、油粕比值影响因素
豆油和豆粕的原料都为大豆,通过炼油厂压榨生产出,处于同一产业链,受到成本和利润的制约导致价格存在一定相关性。供需、生产链条以及基本面差异导致油粕比走势存在较大套利空间。量价策略方面,以SARIMA时序模型为基础寻在季节性和趋势性特征。基本面策略方面,从供需端入手观察进口大豆和国产大豆供应情况。天气、种植面积和政策层面都会对大豆产量造成影响,海外方面则会涉及海运、国际运费的情况。因大豆的基本面数据存在滞后性和不确定性,基本面数据存在失效的可能。为了验证基本面策略的可行性,我们对于以上数据展开了研究。
二. 数据清洗和指标筛选
2.1数据频率的处理
考虑到两个品种货值存差异,为平衡价格波动风险,油粕配比一为1手豆油和2手豆粕的套利组合,合约选择1、5、9月主力合约。
基本面数据中主要以数据量充足的日度数据为主,包含各地大豆压榨利润、国内外大豆价格、品种间价差等数据。一般国内的大豆压榨利润按照16.5%的出油率和80%的出粕率计算,进口大豆按照18.5%的出油率和78%的出豆率计算。由此可知,大豆价格和大豆压榨利润呈现反向变动关系,豆油占压榨利润数据的比值不大,利润主要贡献源自于豆粕。另外,豆油是生物柴油的原料之一,生物柴油价格受制于原油价格,因此原油价格数据也被纳入基本面数据库。从相关性分析,在01合约上IC绝对值最高的基本面数据为CBOT豆油和天津压榨利润,分别为0.079和0.057,在09合约上为辽宁大豆压榨利润以及每蒲式耳大豆出粕价值。从数据中可以观察到海外数据和油粕比的相关性更高,豆油的替代品例如菜油、棕榈油价格的IC为负值。数据初筛标准为IC值在数据库中相对较高且通过自回归检验。
2.2 数据滞后性处理
滞后性处理:日频数据基本都会在交易日当天滞后性处理:日频数据基本都会在交易日当天收盘更新,而周频数据基本在周五发布。因此我们在做特征有效性检测和建模过程中统一将这些数据延后一阶处理,即当天获得的数据生成信号在下一个交易日进行交易。
2.3去极值和标准化处理
数据中的极值往往会影响在线性模型假设下的拟合,同时对于映射关系也存在错误推断的可能,因此高于时序数据3倍标准差的数值本文按照平均值+/-3倍标准差调整。
三. 基本面策略
基本面数据利用胜率和盈亏比确定相应阈值,并进行比较。胜率上,三个月份合约上表现较好的基本面数据为天津进口压榨利润和棕榈油价格,大豆出油价值和品种间价差表现较于单一品种价格更优。
从数据中观察到,单一基本面数据的胜率普遍不高,在0.5左右,多数数据的盈亏比并未超过1。基本面角度分析,大豆压榨利润地区差异较大,并存在一定的季节性。同时豆粕、豆油对压榨利润的贡献比会根据供需而发生变化。例如在养殖业对于豆粕需求偏弱的时候,豆油对于压榨利润的贡献会增加。基本面数据变化原因的复杂性导致大豆压榨利润和油粕比的相关性减弱。
考虑到基本面策略整体表现不理想,本报告选择尝试量价均值回归方法。
四、量价策略
4.1 季节性和趋势性处理
从可视化图像观察到,油粕比序列受消费受淡旺季影响存在一定周期性。为验证观察,我们对油粕比进行了ACF和PACF检验。检验过程中没有发现显著的规律性尖峰,因此无法对于季节性做出判定。
为了进一步判定季节性是否存在,实验中使用了SARIMA模型对序列进行分解。SARIMA(p, d, q)(P, D, Q)序列结合了自回归(AR)、移动平均(MA)和差分(I)的组件以及季节性成分,来捕获时间序列的结构。p为非季节自回归阶数,d为一步差分次数,q为非季节移动平均阶数,P为季节自回归阶数,D为季节差分次数,Q为季节移动平均阶数。
Y = F (T, S, R)
其中:T(Trend)为趋势性,S(Seasonality)为季节性,R(Residual)为随机残差。
如下所示,对于时间序列做D次差分去除季节性,d次差分去除周期性。
其中:为延迟算子。
最优模型在AIC和BIC的筛选下确定,找到了对应合约在SARIMA模型中包含(p, d, q, P, D, Q)六个参数的最优组合。以01合约油粕比为例,观察到ar.L1,、ma.L1、ma.S.L22统计显著,ma.S.L22存在负相关性,序列不存在显著的相关性和异方差性。
我们将时间序列剥离成三个组件,包括序列的趋势性、季节性和随机性部分,并对残差部分进行分析。Decomposition分为累加(Additive Model)和累乘 (Multiplicative Model)分解两种方法。油粕比季节性并非随着时间变化,而是维持在一个相对稳定的区间,因此相比于累乘分解,我们采用累加的方式进行分解。
(1)趋势项分解:
其中:f为频率,当f为奇数时F=(f-1),当f为偶数时F=f。
通过中心化均值移动方式得到趋势项。
(2)季节项分解:
其中:X序列为剔除趋势项的时间序列。
通过各周期相同频率下的值平均化得到季节项。
(3)残差项分解:
去除季节性采用的是季节性差分方法。在趋势性去除的过程中,发现2009年-2023年的时间跨度中,并没有存在整段显著的单向趋势,而4年为时间跨度存在相对单向趋势。因此在模型构造过程中使用4年为分析区间,即3年为一个模型训练区间,1年为滚动预测区间。
训练区间内的趋势通过Decompose提取,滚动区间利用三次样条插值(Cubic Spline)的方式对于提取的趋势进行预测。三次样条插值将序列分段成小区间,分段多次低项式可以避免Runge现象,减少边缘误差,每个区间的曲线构造出一个三次方程,并用该方程预测未来的点。
序列残差使用做差的方式得到,序列的平稳性和随机性则通过ADF和Ljung-Box检验方式验证。平稳性分析确定时间序列的统计性质如均值和方差不会随时间变化,增加序列的可预测性和可靠性。检验结果显示,ADF的p值均小于0.05,且ACF图显示出了快速衰减特性,存在均值回归的迹象。随机性分析则检验出被分离的序列为随机的非白噪声序列,同时残差中没有明显的趋势或季节性。
4.2时序多空通道模型搭建
验证油粕比残差存在均值回归特性后,策略方面决定利用此特性,使用通道法构建量价模型。该通道法主要是利用百分位阈值遍历确定开仓边界,并产生相应的交易信号。当突破上轨a并回归时,认为价差被高估后回归中性,产生空头信号,反之,突破上轨b并回归时,认为价差被低估后回归中性,产生多头信号。当趋势确定并产生信号后,该信号会在[a,ka]以及[kb,b]内维持仓位,k值作为一种风控指标,主要用于做风险规避和平仓线的划定,防止价格朝着不利方向变化。
轨道阈值由胜率和盈亏比确定。
胜率:
预测盈亏比:
4.3交易机制
为了兼顾流动性和减少合约展期造成的价差,统一在12月-4月交易05合约,4月-8月交易09合约,8月-12月交易01合约。对应合约在进入到下一个交易阶段前平仓。初始资金为一手豆油和两手豆粕的货值,交易的标的为一手豆油和两手豆粕的价差。
4.4过滤机制
基本面策略结果的不理想,模型构建上考虑削弱基本面数据的影响,将其应用在过滤机制上,过滤量价策略的部分干扰信号。利用基本面信号对量价策略的持仓时间进行调整,对量价策略进行风控并形成最终的交易信号。即在量价信号持仓期间,基本面信号未产生相应交易信号,则该笔交易平仓。
从区间统计中分析,在8-12月01合约交易期间,正值豆油需求旺季,价差常显示油强粕弱的状态,价差正向放大,量价策略开仓上边界为0.68,下边界偏向阈值边界为0.33。在21年价差区间收益最大为17.80%,量价策略收益为15.09%,合成收益为3.63%。在12月-4月05合约交易区间,17年-23年呈现为粕略强于油,价差反向放大,量价策略开仓上边界偏中性为0.58,下边界偏向阈值边界为0.23,开空仓的次数大于多头仓位,价差反向放大时即做空油粕比时收益更显著。在20年量价策略收益最大为9.25%,合成策略收益为-1.01%,价差区间收益为-9.21%。在4月-8月09合约交易区间,统计区间呈现油粕双弱的状态,价差缩窄,量价策略开仓上边界为0.66,下边界为0.38,较另外两个合约更偏中性位置,多空仓位分配更加均衡。
五、实证分析
区间收益上,统计发现进入18年后,01交割合约的收益情况普遍好于其他交割月的情况。01合约区间开仓次数为4-5次,05合约的开仓次数偏少为1-2次,05合约区间收益普遍低于另外两个合约。从净值和收益指标分析,量价策略的整体收益情况好于加入过滤机制后的情况,年化收益为22.22%,年化开仓次数为11次,夏普比例约为1.16。加入过滤机制后的策略开仓次数有所减少,最大回撤降低,但年化收益较量价策略缩窄,仅为10.52%。统计区间中,价差区间最大收益为10.94%,20年量价收益最大为10.68%,合成收益为3.52%。观察得出,油粕价差缩窄时,合成策略收益略优于量价;量价策略在价差大幅走扩时收益增幅更显著,合成策略信号损耗了部分盈利空间。量价策略整体表现优于合成策略情况,该策略将作为研究标的进一步跟踪,为油粕比交易提供参考。


温馨提示:投资有风险,选择需谨慎。
-
2025年债券基金收益排行榜,谁是最强“蛋王”?
2025-03-17 16:35
-
315 黑天鹅突袭!这些股票开盘跌停,你的持仓中招了吗?
2025-03-17 16:35
-
华为海思概念股逆势涨停!这把科技火苗,散户该不该追?
2025-03-17 16:35