“物体智能识别”技术将成就下一代互联网新面貌
北京时间3月13日晚,谷歌宣布收购了加拿大智能识别技术公司DNNresearch。该公司于去年创立,诞生于多伦多大学计算机科学系,其主要研究领域为"物体智能识别"。即如何利用最新的算法和技术让计算机或机器人能够和人类一样,智能化的识别图像、语音、文字等目标。
作为交易的一部分,谷歌将获得该公司的技术。完成并购后,该公司创始人、多伦多大学教授杰弗里·辛顿(Geoffrey Hinton)将参与谷歌的深度研究项目,而他的两名研究生确定将加入谷歌。
杰弗里·辛顿是人工智能和物体识别领域的世界级专家。其多年经营于利用深度神经网络技术等提高计算机对图像、语音等多种目标的智能识别能力。有消息称,在并购前,杰弗里团队刚取得一项物体智能识别领域的重要突破。而谷歌多年前已经开始赞助杰弗里的研究项目。
仅就目前来看,“物体智能识别技术”具体到应用层面的话,仍是比较简单的语音和图像识别。但如果将这些研究方向与谷歌的发展方向结合起来看,就更不难理解谷歌为何频频出手智能识别技术了:谷歌眼镜与google now系统正是上述识别技术最好的载体,谷歌还获得了一项新专利——"人脸识别登录计算机"。
算上此次并购,谷歌在过去3年内已经4度出手并购图像和语音识别领域公司。包括2012年10月花费3000至4500万美元收购乌克兰面部识别技术提供商Viewdle,2011年斥重金收购美国本土的面部识别软件公司匹兹堡模式识别。以及2011年1月底,收购了语音信息技术平台SayNow。
其中,viewdle的面部识别技术已经成功应用于一些智能手机。匹兹堡模式识别则脱胎于美国卡内基·梅隆大学的一个项目,通过开发其独有的算法提高计算机在人脸检测,人脸跟踪和面部识别能力。
作为全球科技界最擅长收购的公司,谷歌一直以来都倾向于通过收购来充实公司的技术能力,并通过自身的大平台将技术能力更好的发挥。如果算上一些百万美元级别的收购的话,自1998年至今,谷歌在科技业的收购已近百起。其中除了为大众所熟悉的摩托罗拉、Youtube、DoubleClick等数十亿乃至数百亿规模的并购。
"美国的大型科技企业,历来有为未来3~10年后产品储备长期研发技术的习惯。不止谷歌,许多大型科技企业一直把图像和语音的智能识别领域看作未来最重要的核心方向之一。"微软研究院一位资深研究员表示。
据悉,物体智能识别之所以得到青睐是因为,如果此关键方向得到突破,则未来电脑、互联网的核心交流界面将发生本质性改变。人们将从单纯的计算机键盘输入、改换为全方位的智能交流互动。电脑的人工智能将成倍提升,智能化识别人脸、语音、图像照片、文字等。其影响力将对下一代家电、消费电子、安防产品、乃至科技研究的组织互动产生革命性的推动。
上文提及的DNN技术是指深度神经网络技术,是一种模仿生物神经网络的结构和功能的数学模型,该技术在语音识别和图像识别领域发挥重大推进作用。百度语音助手就是借助于DNN技术,另外国内公司中,还有科大讯飞、恒信移动、华平股份等涉及识别技术研发和应用。此外,脸部识别技术方面,汉王科技和捷顺科技都曾开展过面部识别领域的研发。
科大讯飞
智能语音技术处于领先水平
科大讯飞是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业。其在智能语音方面的技术研发一直处于领先水平,公司在深交所互动平台上明确表示,在DNN技术方面公司有长期跟踪和积累,2012年已经将DNN应用到相关技术和产品中。
科大讯飞目前约占有中文语音技术市场70%以上市场份额,以讯飞为核心的中文语音产业链已初具规模。2012年12月5号在中国移动全球开发者大会上,公司于中国移动联合发布语音门户产品——灵犀,这是继去年8月份公司与中国移动签署了《战略合作协议》以来取得的实质进展,"灵犀"表明公司和中移动现有的增值业务实现了紧密整合。公司的语音技术已经被广泛应用于手机、电视、导航、玩具等领域,年初与广东群兴玩具股份有限公司签订战略合作协议,双方将在电子电动玩具领域开展战略合作,合作开展新产品的设计、研发、生产和市场推广工作。
恒信移动
子公司中科信利擅长语音识别
公司是一家同时拥有地面零售连锁商务经验和移动信息技术研发, 业务平台运营经验的企业。目前公司旗下子公司中科信利涉及语音识别软件研发业务。公司持有其70%股权,中科信利是以开发语音识别搜索引擎技术为核心的软件企业,主要开发服务器端的音频信息处理技术,为国内多家音乐语音搜索平台运营厂家提供音乐搜索软件和音乐搜索平台技术支撑服务。中科院声学所中科信利语音实验室给公司提供了强大的技术研发后盾,目前主要研究方向包括:语音信号处理、语音识别、语种识别等领域。
据公司相关人员透露,公司在语言识别领域已经取得具备国际水平,在行业内处于领先地位,已经建成音频/语音信息分类和处理平台,其中包括非特定人大词表连续语音识别系统、语种识别系统、说话人识别/确认等系统,公司研发的电信级语音识别产品已在国内20余个省级电信运营商中进行商业化运营;桌面平台语音识别产品已成为英特尔数字家庭台式电脑的捆绑软件;嵌入式平台产品已集成于国内多家手机厂商和PDA厂商的产品内。未来中科信利将进一步在语音识别领域进行拓展和研发,并且进一步形成规模化和产业化,对母公司恒信移动有着潜在利好影响。
华平股份
已具备智能视频分析技术
公司目前主要业务是为企业提供视频会议系统,但华平股份已经具备智能视频分析技术。智能视频分析首先将场景中背景和目标分离,识别出真正的目标,去除背景干扰(如树叶抖动、水面波浪、灯光变化),进而分析并追踪在摄像机场景内出现的目标行为。
公司进一步完善视频智能交通版本,进行"烟火识别"算法开发,研发基于智能分析手势识别的PPT翻页控制及远程教育中的教师跟踪(学生跟踪)技术。并且在其他智能检测算法方面积极储备技术。在今年2月7日在深交所互动平台上,公司表示公司的智能视频算法已初出成果,并准备就某些软件申请著作权。
公司从视频和音频编解码技术起步,衍生出视频会议、远程培训、远程教育、远程医疗等多类应用,考虑到目前国内视频会议市场以硬件解决方案为主(代表企业有华为、中兴),公司未来产品将逐步融合硬件,并以南昌分公司为平台着手电子白板、电子地图、视频分析、识别技术等新产品研发。
公司2012年度营业总收入为1.99亿元,较2011 年度上升57.78%。
汉王科技
人脸识别领域有多年积累
虽然公司近两年发展速度不快,但汉王科技应对市场变化正在改变策略,公司谋求转型升级的动力十分明显。
公司相关人士表示未来将锁定数字阅读、输入、识别三大业务领域,已推出多业务领域的新产品和新服务。
另外,公司在技术研发方面的投入一直很多,特别是在电磁模组技术和人脸识别技术方面多年潜心研究,具有一定的技术优势,现已进入市场开拓阶段,并有考勤人脸识别系统产品上市。
该项技术在未来的智能家居市场规模必然越来越大,据日信证券的报告分析,2011年后,平安中国建设进入整体推进阶段,整体投资规模近千亿元,产业将在"十二五"期间进入建设高峰期,年增长率将保持在20%左右。人脸识别技术的商业化是有一定地位的。
(本报数据研究部 孙亮 汪思伟 陈晓力)