• A1:基金周刊
  • A2:基金·基金一周
  • A3:基金·焦点
  • A4:基金·投资
  • A5:基金·视点
  • A6:基金·焦点
  • A7:基金·专版
  • A8:基金·封面文章
  • A10:基金·海外
  • A11:基金·投资者教育
  • A12:基金·投资者教育
  • A13:基金·专访
  • A14:基金·互动
  • A15:基金·研究
  • A16:基金·QFII
  • A股迎来大数据投资时代
  • 大数据指数
    让投资走在曲线前面
  • 大数据i指数将开辟量化投资新篇章
  •  
    2014年9月14日   按日期查找
    A7版:基金·专版 上一版  下一版
     
     
     
       | A7版:基金·专版
    A股迎来大数据投资时代
    大数据指数
    让投资走在曲线前面
    大数据i指数将开辟量化投资新篇章
    更多新闻请登陆中国证券网 > > >
     
     
    上海证券报网络版郑重声明
       经上海证券报社授权,中国证券网独家全权代理《上海证券报》信息登载业务。本页内容未经书面授权许可,不得转载、复制或在非中国证券网所属服务器建立镜像。欲咨询授权事宜请与中国证券网联系 (400-820-0277) 。
     
    稿件搜索:
      本版导航 | 版面导航 | 标题导航 收藏 | 打印 | 推荐  
    大数据i指数将开辟量化投资新篇章
    2014-09-14       来源:上海证券报      

      ⊙本报记者 徐维强 黄金滔

      

      大数据i指数的编制发布,在中国资本市场上书写了诸多的第一。南方基金权益投资总监史博分析,南方新浪大数据指数将南方基金的专业股票研究优势与互联网“大数据”结合,在南方基金量化投资研究平台的基础上,通过新浪财经“大数据”定性和定量分析,找出股票热度预期、成长预期、估值提升预期与股价表现的同步关系,精选出具有超额收益预期的股票,建构、编制并发布策略指数,并突破传统的基于财务数据、价值成长因子、指数指标因子的多因子模型研究框架,将新闻事件、公司事件对股价的影响也纳入研究范围内,弥补了新闻事件所带来的互动信息数据研究的空白。

      

      大数据投资有望颠覆传统投资

      史博认为,大数据投资不仅仅是现有投资的有效补充。传统的投资分为主动投资和被动投资,但无论主动还是被动都是基于数据的投资。其中被动投资是严格按照指数配置,获取市场平均收益,而主动投资中基于基本面的投资者注重的是企业经营数据的分析,包括企业的收入、毛利率、净资产回报水平等,而技术分析则更注重投资过程中不同投资者产生的数据,由投资者共同形成的交易量的数据、股价变化的数据等,因而主动投资也是基于对数据的分析。而在大数据时代,大数据模型投资不仅是对传统投资是一种补充,更是一种超越。所基于的数据不仅仅是传统投资中的企业财务报表数据、股票交易量及交易价格变化数据,同时也会特别关注投资者对于这些数据的反应。基本面的数据是否超越投资者预期、投资者对交易数据如何反应、公司事件以及报道等,都会产生新一轮数据。因而大数据有可能会对传统投资产生颠覆性的影响。

      历史数据显示,2005年至今,A股市场表现有好有坏,其中表现好的2006、2007年市场平均收益率在100%以上,而表现差的2008年市场下跌63%、2011年下跌22%。但是通过寻找历年来超越市场30%的个股,平均收益率都全部为正,在市场好的时段甚至可达300%以上。如果能够找到这些股票,无论市场表现好或差,都会对投资者带来丰厚收益。

      但如何找到这样的股票?史博认为,市场是由人的行为来形成,因而所基于的数据一定不能仅仅是企业的经营数字、市场成交量、价格等数据,同时也要了解整个市场参与者对股票价格、成交量等相关反应,而这些反应也能通过大数据来体现。同时随着数据量的增加,数据分析的难度也越来越大,南方基金将通过有效的量化平台,与新浪财经的大数据有效融合,能够迅速分析获取的大数据。如果能够快速分析数据并得出结论,这种价值也就越大。

      

      i指数如何“诞生”

      指数构成过程中,样本选择空间十分巨大,全市场股票中扣除三类股票,包括ST、*ST以及上市不满一年的股票。选股因子共有三大类,包括企业财务因子、大数据因子和市场驱动因子。其中财务因子包括最新市盈率PE、净资产收益率ROE、年度营业收入和净利润增长率以及对它们的变化预测。市场驱动因子包括股票近期换手率、波动率、价格变化率、成交量变化率。

      史博介绍,纳入的新浪财经大数据因子包括个股报道、新浪财经频道下的页面点击量,微博的正负面文章报道、新闻报道影响,由此反应的市场情况,以及对这些个股事件的反应都结合进来,同时找出股票的热度预期、成长预期、估值提升预期等,进一步影响股价的未来反应。这些因素构成不同因子权重,并进行动态优化调整,组成大数据指数基础。

      对i指数的历史收益分析可见,大数据100、300与巨潮A指数、沪深300、深证100、中小板指数、创业板指数等比较分析,过去5年大数据100、300的累计收益为222.40和141.58,大幅跑赢其余指数的-5.35、-26.65、-29.87、-8.95、34.45水平。

      填补市场情绪应用空白

      大数据时代,数据已经从对事物的简单描述逐渐演变成人类行为模式的全面刻画,近年来基于社交平台和互联网搜索中用户行为被记录的数据,还被证明能够很好地映射出市场主体的情绪。

      美国印第安纳大学近年的一项研究成果更表明从Twitter信息中表现出来的情绪指数与道琼斯工业指数的走势之间相关性高达87%。2014年牛津大学期刊发表的一篇文章表明,通过搜索分析投资者在网络发帖和评论中表现出来的观点很好地代表了多空态度,同样也能够有效地预测未来股市的收益。美国市场大量有关金融和大数据成功结合的案例鼓舞了投资管理人,作为最火的社交网络,Twitter拥有众多互联网使用群体的信息,因而其被大量的投资管理人视为大数据的最佳来源,并依此开发了相应的对冲产品, CAYMAN ATLANTIC公司就是其中的翘楚之一。CAYMAN ATLANTIC在其官网上披露了旗下对冲基金的历史收益数据。从2012年7月该基金成立至2014年6月,基金的累计收益率达到了48.36%,年化收益率为21.8%。各种指标揭示了该基金在非常低的风险下,创造了相当高的收益。

      目前国内股票指数中还没有基于财经媒体与社交平台挖掘投资情绪并应用于指数选样的策略指数,南方新浪大数据系列指数的面市填补了这一市场空白。大数据系列指数的发布是在“大数据”背景下对投资者行为分析与传统基本面分析融合的积极探索与实践,也是在传统指数编制基础上的有益创新。史博分析指出,国内股票市场交易较为频繁,短期交易盛行,价格波动较大。由此,国内股票市场上投资者情绪在投资者行为中的决定作用更加突出,对投资指导意义也尤为明显。大数据系列指数的发布能够丰富和完善指数体系,为市场提供新的投资工具,并有助于满足投资者多样化的投资需求。