A3版 基金·研究  查看版面PDF

基金评级管用吗?

2018-12-23 来源:上海证券报 作者:⊙赵威 ○编辑 于勇

⊙赵威 ○编辑 于勇

基金评价业务

今年是公募基金成立20周年,这些年来基金行业发生了天翻地覆的变化。鉴于良莠不齐的基金评价状况,中国证监会于2009年末发布《证券投资基金评价业务管理暂行办法》(下文简称《办法》),正式拉开了基金评价业务规范化管理的序幕,包括上海证券在内的10家金融机构获准在协会备案并审核通过后在媒体上公开发布基金评价或评奖结果。《办法》发布已有九个春秋,其间经常会有人问:基金评级有用吗?

研究方法

1.样本选择

自2010年上海证券获得基金评价资格后,我们共对社会公众发布了33期基金评价报告。纳入评价范围的基金19946个次,被评为3年五星基金2951个次,被评为5年五星基金1817个次。

为了回避早期特定市场环境和配套政策的历史因素,我们选取了2014年至2018年中期共18个报告期所有当期纳入评价范围的基金(14103个次)作为本次分析的核心样本。

2.分析方法

首先,我们将评价对象按照其大类资产投向,分成主要投资权益市场的主动投资股票型基金、主要投资固收市场的主动投资债券型基金和介于两者之间的主动投资混合型基金。

其次,我们按照每一个观察期所有纳入评价范围的基金当期获取的星级评定,将基金分成五星、四星、三星、二星和一星共5个组别。对这5个组别分别跟踪其在获取相应的星级评定后的3个月、6个月、1年、2年和3年共5个持有期的收益情况,拟将事前评价与事后绩效做一个对比,来考察基金评级的真实作用。

再次,我们分别引入规模因素、单一持有人集中度因素重复上述步骤,拟观察剔除这些可能错判主动投资能力的要素是否有利于提高评级结果的适用性。

最后,我们以在上述过程中发现的最优参数构建基金组合,以此来度量和对比引入相关约束条件后,不同星级基金作为一个整体在后续市场表现上的差异及其程度。

评级效果分析

1.定义与释义

在展开实证数据前有必要先厘清一个重要概念,即什么样的评级是“有用”的?对此,我们可以反过来思考一下,什么样的评级是“没用”的?我们的评价将基金分为5、4、3、2、1这五个层级的星级水平,如果评级是没用的,那么我们评为最高星级的基金在接下来的业绩表现中依然处于五档中的最高档的概率应该是随机的,也就是20%左右的水平。换言之,只要一种评级能够系统性地持续稳定地超越这个随机水平,那么它就是有用的。但即便是有用的,还有一个度的问题。那么,评级的击中比率在多大程度上超越基础概率,就为我们接下来的讨论确定了“多有用”这个概念的度量边界。

2.高星级基金评级效果

在具体的实证部分,我们对高星级基金(五星与四星)引入了两个关键考察指标,前20%击中率与前40%击中率。前20%击中率是指被评为高星级基金作为一个整体持有一定期限依然可以保持在同类前20%的概率,前40%击中率则将条件放宽到了40%。

以我们本次研究采用的分析方法,我们统计了在2014年至2018年三季度末期间所有历史上曾被评为五星和四星的基金击中概率,我们发现:

第一,高星级基金评级对基金其后业绩表现的影响是显性的。先撇开持有期限差异,历史数据表明上证的五星基金评级后其真实业绩表现依然可以保持在前20%的概率在40%左右,而保持在前40%的概率最高可以达到80%。也就是说,如果你将五星基金作为一个整体来看,那么持有一定期限后有40%的概率它们会击败剩下4/5的基金,有最高80%的概率击败其他3/5的基金。

第二,持有期限对分析结果影响显著。数据表明,五星基金方面最佳持有期限在6个月到1年。若仅持有3个月,前40%击中率掉到60%;而持有期2年及以上时,不再有五星基金业绩能排到同类前1/5,排在前2/5的概率也下降到了40%至50%。也就是说,我们观察下来,五星级股票型基金投资能力的业绩甜区(sweet spot)在6个月至12个月之间,超过1年则开始衰减,不到6个月则展现不完整。

第三,同为高星级,五星与四星并不等价。在使用评级的时候,投资者有时候会对五星基金和四星基金做等价考虑。人们会认为,都是高星级基金,可能投资效果差不太多,真的是这样的吗?我们采用四星基金样本核算后发现:其前20%击中率最高不超过30%,前40%击中率不高于50%。在3个月、6个月和12个月的持有期,四星基金完败于五星基金。尤其从前20%击中率口径来看,更长的持有期五星基金已经不再表现,而四星基金的击中率也已低于20%的随机概率,可忽略不计。

3.低星级基金评级效果

在探讨评级是否有用的时候,人们通常更关注高星级基金是否“物有所值”。我们想在这里提出基金评级有用的一个更完整诠释,那就是可以趋利也能避害。低星级基金的击中比例与高星级基金的击中比例概念相当,方向相反。这里考察的是被评为低星级基金在其后的持有期中表现不如人意的概率。通过观察数据,我们得出了与高星级基金相似的结果。

4.小结

综上,在不引入其他参数的情况下,历史数据表明:

第一,上证基金评级不仅有挑选到好产品的作用,也同时具备了回避不佳产品的作用。

第二,对于权益基金而言,高星级基金最佳持有期在评级后的6个月至12个月,低星级基金在其后的3个月至6个月即会呈现较差的表现。

第三,相对于更中性的二星与四星,五星评价体系中的两级评价(五星与一星)的后续业绩参考价值要显著得多。

评价结果优化

1.基金规模阈值

在可能影响到基金主动管理能力的外部因素中,我们首先想观察的是基金的管理规模。我们分别引入5千万元和2亿元两个规模阈值作为考察指标。

这里的考察逻辑非常直白,我们将不满足规模阈值的产品剔除后,再次核算样本的业绩表现。以业绩击中概率是否提高来判定这种剔除规则是否有效,以提高的比例来度量优化的程度。

高星级基金数据显示,与不进行任何规模约束相比,当我们仅将规模不足5千万元的产品剔除后,它在各个考察持有期的业绩表现并没有发生太多变化。但是,当我们将规模低于2亿元的产品剔除后,五星基金在评级后的大部分持有期均纷纷提高了高业绩击中的概率。

低星级方面,一星基金在仅剔除低于5千万元产品后的表现与不剔除同样没有显著差异。但是,在剔除低于2亿元规模产品后,对低业绩的击中率则大大提高,而且持有时间越长越显著。

2.单一持有人集中度阈值

鉴于单一持有人集中度的“重灾区”出现在混合基金中的灵活配置基金以及债券基金中的纯债类基金,而在股票基金中较少出现,所以剔除这部分产品后对股票基金并没有什么实质性的影响。

3.优化效果汇总

最后,我们将本次研究所设的约束条件做了一个横向比较,结果表明:五星基金方面,在几种约束条件中,持有高于2亿元规模的产品相对来说能更好地提升高业绩击中率;一星基金方面,2亿元规模阈值的加入大大提升了评级的警示效果。

主动股票基金评级绩效总结

基金评级到底有没有用?怎么才能使它们更有用?

我们首先确定了判定评级是否有用的标准,即基金获取评级后的业绩表现达到预期目标的概率是否能够持续地高于随机概率,如五档评星中的1/5这个概率。而我们衡量评级有用的程度,即观察评级后对标业绩击中概率超越这个随机概率的程度。我们对2014年至2018年中期共18个报告期所有当期纳入评价范围的基金(14103个次)进行了评级后业绩的持续跟踪,得到了以下结论:

第一,在主动投资股票基金范畴,上证基金综合评级具备了趋利避害的作用。不考虑持有期限的差异,高星级基金命中高业绩区概率与低星级基金命中低业绩区的概率均可高达80%以上!

第二,五星基金的持有期甜区(sweet spot)在获取评级后的6个月至1年之间。过则不及,短则不满!一星基金的绩差兑现率随着持有时间增加而增加。

第三,相对于更中性的二星与四星,五星评级体系中的两极评价(五星与一星)的后续业绩参考价值要显著得多。

第四,剔除基金规模少于2亿元的产品可以有效提升评级结果的有效性。

据此,我们按照上述优化方式构建了五星基金、一星基金、所有纳入评级股票基金共3个基金组合,即以当期获取上证对应评级的基金为样本,每期样本的持有期为6个月。构建的五星基金组合2014年一季度末至2018年三季度末的业绩达到101.57%,远超所有纳入评价范围股票基金的69.73%,而同期沪深300、中证A股指数收益率仅分别录得59.8%和40.01%。

综上,如果说还有投资者在疑惑基金评级有没有用或者曾经觉得基金评级就是没用的,那么他们有可能只是还没有找到基金评级正确的打开方式。