在股指期货期现套利中,现货组合的构建是关键。在目前ETF流动性尚不充裕情况下,利用股票组合进行股指期货套利显得尤为重要。股票组合虽然交易成本比较大,但合理的权重配置不仅能使其较好地跟踪标的指数,而且能获取一定的超额收益,这部分超额收益可抵御交易成本和期末基差的不利影响,从而降低套利风险。
开发既能避免较大负向跟踪偏差,又能获取适当超额收益的股票组合是目前利用沪深300指数期货进行正向套利的技术核心,本报告就此进行研究和深入探讨。
一、组合构建核心:选股与优化
在股票选择上我们认为应遵循三个原则:一是行业分层抽样;二是选择调整市值大的股票;三是大行业需有足够的样本。
纯粹按大市值选股会导致股票过多集中于金融行业,也就忽略了行业板块的轮动和行业景气周期的影响,行业因素必须在选股时加以考虑;沪深300指数是按分级靠档配置成份股权重,指数收益率与个股的调整股本市值呈正比,所以调整市值大的个股对指数的影响也就越大;另外对于一些大市值行业,其指数的影响程度非常大,过少的行业样本量将导致股票组合对行业的代表性不足,组合将出现较大的跟踪误差,故大市值行业应该选择足够多的样本。
沪深300指数最近7月2日调整了成份股,我们通过不断增加样本规模观察股票组合规模对跟踪误差的影响。样本增加的次序为调整市值比重靠前的股票先加入股票组合,权重配置为调整市值权重。从7月2日至7月25日的实证数据来看,股票数量达到65只以上,指数跟踪的均方根误差(RMSE)能控制到1%以内,达到110只时RMSE控制到0.5%以内,200只以上RMSE能控制到0.2%以内。
而根据我们选股原则选取的一个47只股票组合,实证发现该股票组合跟踪沪深300指数非常好。该组合的指数跟踪均方根误差为0.5664%,其指数跟踪能力相当于不考虑行业分类的前100只大权重股组合,并且具有超额收益,所以考虑行业分层抽样是相当必要的。
构建现货组合另外一个比较关键的技术环节是股票的权重配置。优化方法是常用的技术,它能比较充分地利用过往的价格信息,但优化的难点在于优化目标、优化约束条件的确定,而其中技术含量更高的是优化约束的制定。优化约束主要目的是制衡所有的样本股,避免内部失衡导致过大的跟踪偏差。优化约束包括行业权重的边界约束、个股权重的边界约束和无卖空约束。另外,优化过程中需避免局部最优,优化初始点的选取非常关键,优化算法的设计也需要和优化目标进行结合。
二、股票组合“Q40”指数跟踪的改善过程
股票组合“Q40”指沪深300指数成份股中权重靠前的40只股票,这40只股票调整市值比重约为50%。这里通过4种不同的组合构建方法对这40只股票配置不同的权重,Q40组合跟踪沪深300指数的观察时间为2007年7月19日至2007年8月16日,共21个交易日,建仓成本为2007年7月19日开盘价。指数跟踪能力的好坏采用累计跟踪误差进行度量,随着4种配置方法的演进,Q40股票组合将表现出不断改善的指数跟踪能力。
1、调整市值加权
沪深300指数采用分级靠档的调整市值进行权重分配,我们首先根据这40只股票2007年7月18日调整市值的相对比例进行加权,调整市值越大Q40组合中的权重也越大。
调整市值加权的Q40组合指数跟踪的均方根误差(RMSE)为0.7215%,最大的负累计跟踪误差为-2.5417%,且有较多交易日的累计跟踪误差,有7个交易日累计跟踪误差大于-0.5%。总体来说,以调整市值加权的Q40组合指数跟踪效果比较差,不适宜用来套利。
2、简单优化加权
利用历史数据信息,并在特定的优化目标下通过优化算法对Q40股票进行权重配置,这里对优化算法所加的约束条件为无卖空和期现头寸市值相等。
结果指数跟踪的均方根误差(RMSE)为0.5057%,最大负累计跟踪误差为-1.6842%,风险有所减小,可见利用优化方法对信息的利用要充分得多,但这样的Q40组合在指数跟踪上仍很不稳健。
3、考虑行业分层的被动配置
我们对股票的行业分类采用联合证券的行业分类标准,把这40只股票分入13个行业,其中一些小市值行业的股票纳入了第13类行业。考虑行业分层的被动配置仍然采用优化算法,只是这里的优化算法比普通优化算法更容易找到全局最优点。我们对优化初始点进行深入和谨慎的考虑,从而避免算法停止于局部最优。同时,优化的约束条件考虑了个股和行业的配置边界。
根据联合证券研究所金融工程部自行开发的优化模块和关键参数,我们得到了全新的Q40组合。该组合的指数跟踪均方根误差(RMSE)为0.3666%,比简单优化方法更小,最大的负累计跟踪误差为-0.3776%,最终的累计跟踪误差为正的3.0171%,获有超额收益。
总体来讲,该组合在指数跟踪上比较稳健,不利的跟踪误差控制得比较好,比较适应用来进行正向期现套利。
4、考虑行业分层的主动配置
上面的被动配置仅仅是利用了样本股历史价格信息和沪深300指数成份股行业分层信息,但实务操作中我们还可通过更多有关宏观经济与行业发展信息,这些信息可用来继续改进我们的股票组合。主动配置思路是这样的:保持较大比例的被动配置头寸,把较小比例的头寸主动配置于具有成长性的行业。这里我们把90%的头寸作被动配置,10%的头寸主动配置于地产、钢铁和有色,主动头寸的分配是根据指数成份股的行业布局进行的,主动配置的先后顺序次于被动配置。
考虑行业分层主动配置的Q40股票组合的指数跟踪均方根误差(RMSE)为0.4925%,无负的跟踪偏差,最终的累计跟踪误差为正的4.9019%。需要指出的是主动配置是有风险的,能否深入发掘行业机会非常关键,主动配置策略比较适合那些拥有独立研发力量的机构投资者,可以在极低的风险水平下获取超额收益,主动配置策略也为更安全的套利保驾护航。
虽然被动和主动Q40组合在验证期内表现出较好的指数跟踪能力,但其也存在很大的风险隐患。从40只股票的行业分布来看,金融行业显然占据了太多的样本,而有色、信息和交通运输行业则样本不足,权重优化过程中优化目标的中间值表现出这些行业并不能有效地降低组合的跟踪误差。
组合的改进需要依据优化过程中优化目标的中间值,对行业股票样本量和优化约束条件进行调整,调整过程需要几次反复。
三、几个更稳健的股票组合
1、改进的Q40组合
对于Q40组合的改进我们主要是调整不同行业的样本量,压缩了金融行业的样本数量,增加了有色、信息、交通运输和食品饮料行业的样本量,使得每个行业的股票组合都能起到改善Q40股票组合指数跟踪能力的作用。
改进的被动配置Q40股票组合的指数跟踪均方根误差(RMSE)为0.4055%,最大的负累计跟踪误差为-0.4776%,改进的Q40组合在两个指标上并没有改善,但改进后的被动配置Q40消除了原来组合一个-0.271%的负向偏差;改进的主动配置Q40股票组合的指数跟踪均方根误差(RMSE)为0.4773%,比未改进组合0.4925%的RMSE要小,而大部分时间内改进的主动Q40正的累计跟踪偏差更高,套利的安全性也就越高。
2、改进的Q50组合
类似于改进的Q40组合,我们对权重靠前的50只股票也进行了适当的改进,调整了每个行业的样本股数量,直到该行业股票组合能有效改善整个Q50组合的指数跟踪能力。
改进的被动配置Q50股票组合的指数跟踪均方根误差(RMSE)为0.3172%,改进的主动配置Q50股票组合的指数跟踪均方根误差(RMSE)为0.4073%,稳健性又有所提高。
3、改进的Q60组合
我们继续增大股票组合规模,把股票数量增加至60只,压缩了金融行业股票数量,增加了有色股票数量并增加了一些小市值行业股票。
改进的被动配置Q60股票组合的指数跟踪均方根误差(RMSE)为0.2673%,改进的主动配置Q60股票组合的指数跟踪均方根误差(RMSE)为0.3594%,指数跟踪的稳健性继续提高,但获取超额收益的能力在减弱。
从Q60的指数跟踪可以发现,随着股票规模的增加,股票组合跟踪指数的稳健性趋强,其指数跟踪能力受某些行业影响或局部行情影响趋弱。表现为围绕指数的上下波动,改进的Q60组合在稳健性提高的同时下方负偏差有所增大,最大负偏差为-0.7528%。
以上3个股票组合的共性是均选择大盘蓝筹股构建组合,市值比重比较高,指数跟踪的风险也比较小,而且在目前行情下这些蓝筹股组合更易战胜指数获取超额收益。另外,也都考虑了行业均衡,选择足够多的股票来代表该行业。3个组合最大的区别在于股票规模,最显著的差异就是随着规模的增大,股票组合跟踪标的指数的稳健性提高,但获取超额收益的能力降低。
在股票组合构建时使用主动配置策略可以在较低风险下获取超额收益,从而提高期现套利的安全边界。在研究力量支持下运用主动配置策略进行套利要比被动配置策略更为有效,收益也将更为丰厚。
(执笔:王红兵)
Q40股票投资组合
股票代码 股票简称 股票代码 股票简称
600036 招商银行 600900 长江电力
600030 中信证券 600011 华能国际
600000 浦发银行 601600 中国铝业
601318 中国平安 600320 振华港机
600016 民生银行 000039 中集集团
000001 深发展A 600519 贵州茅台
601398 工商银行 000858 五粮液
601628 中国人寿 600028 中国石化
601166 兴业银行 600309 烟台万华
601988 中国银行 600050 中国联通
600015 华夏银行 600104 上海汽车
600009 上海机场 002024 苏宁电器
601006 大秦铁路 600739 辽宁成大
600018 上港集团 600177 雅戈尔
601111 中国国航 000063 中兴通讯
000002 万科A 000527 美的电器
000402 金融街 000069 华侨城A
600019 宝钢股份 600881 亚泰集团
600005 武钢股份 000623 吉林敖东
000898 鞍钢股份 600583 海油工程
改进的Q40股票投资组合
股票代码 股票简称 股票代码 股票简称
600036 招商银行 000039 中集集团
600030 中信证券 600519 贵州茅台
600000 浦发银行 000858 五粮液
601318 中国平安 000568 泸州老窖
600016 民生银行 600028 中国石化
600009 上海机场 600309 烟台万华
601006 大秦铁路 600050 中国联通
600018 上港集团 600037 歌华有线
601111 中国国航 000793 华闻传媒
000002 万科A 600104 上海汽车
000402 金融街 600150 中国船舶
600019 宝钢股份 002024 苏宁电器
600005 武钢股份 600739 辽宁成大
000898 鞍钢股份 600177 雅戈尔
600900 长江电力 000063 中兴通讯
600011 华能国际 000527 美的电器
601600 中国铝业 000069 华侨城A
000878 云南铜业 600881 亚泰集团
600331 宏达股份 000623 吉林敖东
600320 振华港机 600583 海油工程
改进的Q50股票投资组合
股票代码 股票简称 股票代码 股票简称
600036 招商银行 000060 中金岭南
600030 中信证券 600320 振华港机
600000 浦发银行 000039 中集集团
601318 中国平安 600031 三一重工
600016 民生银行 600519 贵州茅台
000001 深发展A 000858 五粮液
600009 上海机场 000568 泸州老窖
601006 大秦铁路 600028 中国石化
600018 上港集团 600309 烟台万华
601111 中国国航 600050 中国联通
000002 万科A 600037 歌华有线
000402 金融街 600832 东方明珠
000024 招商地产 600104 上海汽车
600383 金地集团 600150 中国船舶
600019 宝钢股份 002024 苏宁电器
600005 武钢股份 600739 辽宁成大
000898 鞍钢股份 600177 雅戈尔
600010 包钢股份 000063 中兴通讯
000825 太钢不锈 000527 美的电器
600900 长江电力 000069 华侨城A
600011 华能国际 600881 亚泰集团
600642 申能股份 000623 吉林敖东
601600 中国铝业 600583 海油工程
600331 宏达股份 000652 泰达股份
000878 云南铜业 600811 东方集团
改进的Q60股票投资组合
股票代码 股票简称 股票代码 股票简称
600036 招商银行 600320 振华港机
600030 中信证券 000039 中集集团
600000 浦发银行 600031 三一重工
601318 中国平安 000157 中联重科
600016 民生银行 600519 贵州茅台
000001 深发展A 000858 五粮液
600009 上海机场 000568 泸州老窖
601006 大秦铁路 600887 伊利股份
600018 上港集团 600104 上海汽车
601111 中国国航 600660 福耀玻璃
600717 天津港 600150 中国船舶
601333 广深铁路 600028 中国石化
000002 万科A 600309 烟台万华
000402 金融街 000792 盐湖钾肥
000024 招商地产 002024 苏宁电器
600383 金地集团 600739 辽宁成大
600019 宝钢股份 600655 豫园商城
600005 武钢股份 600050 中国联通
000898 鞍钢股份 600037 歌华有线
600010 包钢股份 600832 东方明珠
600900 长江电力 600177 雅戈尔
600011 华能国际 000063 中兴通讯
600642 申能股份 000527 美的电器
600795 国电电力 000069 华侨城A
601600 中国铝业 600881 亚泰集团
600331 宏达股份 000983 西山煤电
000060 中金岭南 600183 生益科技
000960 锡业股份 600308 华泰股份
000612 焦作万方 000538 云南白药
000807 云铝股份 600108 亚盛集团