“掘金”交易数据
⊙本报记者 唐真龙
提及量化投资,很多人会将其理解为依赖量化模型的被动投资。在华商基金的基金经理费鹏看来,量化投资是一种基于交易数据的择股、择时和风险控制的主动投资管理,对交易数据的研究、分析和挖掘在量化投资中占据核心地位。
费鹏的投资策略是在交易数据中找“黄金”:首先在海量交易数据中找出有异动的股票,并对筛选出的股票进行基本面研究,寻找股票异动背后的逻辑,进行择股。然后,再根据交易数据判定合适的介入时机,择时。在风险控制方面,交易数据也是非常重要的依据。对交易数据的研究、分析、挖掘,贯彻在整个投资过程中。“在选股上我们使用的是高频数据,通过数据挖掘,去看哪些股票正在异动。”费鹏认为,不管市场出于什么样的逻辑,或是出于投资价值,或是基于主题性的投资机会,最终都会反映到交易数据上。费鹏的模型涵盖了1900多只有两年以上交易记录的股票,通过对这些股票的数据的分析,挖掘出有异动的股票,然后再对这些股票进行研究,那些有基本面支撑的股票才能最终入选量化股票池。
在量化股票池确立之后,费鹏并不会马上介入这些入选的股票,而是会依据对交易数据的判断进行择时。“我们会通过高频数据,去判断股票的买卖点,哪只股票什么时候买什么时候卖,对它进行量化择时。”不过量化数据并非择时的唯一标准,有时也会结合传统的技术分析,比如看一只股票的技术形态,什么样的形态可能是一个非常好的介入点,还有到什么样的形态,可能破位了,要止损。经过一年多的检验,费鹏认为,这样的择时方法,在个股的买卖时点上还是比较有效的。
在具体的配置策略上,费鹏非常讲究细节。比如对于前十大重仓股,一定要求多次量化入选,并能够在基本面找到原因,对这一类股票会进行高配,通常仓位达到40%,并会长期持有。而对于那些通过量化模型判定有异动,但找不到异动原因的股票,费鹏也会选择短期介入,但不会配置太多,通常不超过20%,赚到一定程度就获利了结。对于这两类股票,都会及时止损,止损的依据是基金净值的回撤幅度和个股的下跌幅度,具体的量化标准会根据情况而定。
在风险控制方面,费鹏的方法很不一样,他运用了金融物理学的方法来判断市场风险。为此他制作了一个反映市场信息混乱程度的模型——信息熵值模型。费鹏发现,当市场的信息越混乱的时候,市场就越稳定,而熵值越小,短期风险就越大。经过历次验证,这个熵值模型在控制风险方面是非常有效的。
对于当前的市场行情,费鹏认为今年仍将延续震荡的格局,在某些题材和板块还是有投资机会的。他相对比较看好军工、农业和核电板块。