星环科技孙元浩:热潮过后大模型商业化加速落地
◎记者 罗茂林
2023年以来,人工智能无疑是贯穿资本市场的一条主线,从“百模大战”千帆竞逐,到上游算力芯片“一日一价”。大模型正在催生一场巨大的变革,其影响最终将波及千行百业。
站在2024年的起点上,人工智能大模型又将有哪些新的趋势?近日,星环科技创始人、董事长孙元浩在接受上海证券报记者专访时表示,第一轮热潮过后,商业化正在加速落地,许多垂直细分赛道或在2024年为大众带来眼前一亮的变革。
热浪之下的变革与挑战
“大模型时代的来临,将在多方面带来巨大变革。”孙元浩开门见山地告诉记者,这将是一场知识获取方式的变革。
他以学习为例说道:“人们对于知识获取从阅读书籍论文,到依靠搜索引擎,现在已经发展为大模型,随着通用大模型和领域大模型的增加,除了把公有知识压缩导入大模型之外,还可以导入更多的行业知识库。”
具体到星环科技的产品,孙元浩介绍称,向量数据库Hippo可以帮助企业建设自己的内部知识库,企业将自身的各种形式数据向量化存储到向量数据库Hippo中,可以提高大模型提问的精准度,建设企业自己的大模型助手。
除此之外,孙元浩认为,大模型的诞生在数据分析、交互方式、智力劳动等方面已经产生深远影响。“以交互来说,越来越多的场景可以建设数字人以及AI Agent(人工智能体),直接通过自然语言调用后台服务或者操作机器人,现有的应用都可以通过新的交互方式做改造。”
孙元浩预计,在第一轮大模型的热潮之后,今年商业化的落地会开始细分加速。“领域知识库、企业专属的大模型将成为相对商业化步伐最快的。”孙元浩说。
伴随变革的步伐,从产业链传导来看,一系列新的挑战将摆在行业面前。从产业链而言,AI大模型包括底层的算力提供、大数据分析工具(包括向量数据库)、基础大模型、由大语言模型驱动的应用开发工具、垂类模型和应用/效率工具等环节。
“对于国产GPU公司或者拥有储备充沛算力的公司来说,涉足算力提供及基础大模型的训练和研发将具备较明显的优势。”孙元浩表示,星环科技作为国内领先的企业级大数据基础软件开发商,站在工具链的角度提供大模型时代的软件开发工具链,公司提供包括大数据分析工具和大模型应用开发工具,旨在让每家企业都能打造自己的专属大模型。
在孙元浩看来,数据是模型生产过程中最大的桎梏之一。据了解,围绕大数据基础建设,星环科技已经完成多项重要工程。比如,公司在2023年推出了大模型统一运营管理平台Sophon LLMOps,旨在为用户打通从数据接入、生成、开发和清洗、提示工程、大模型训练、大模型上架部署到大模型应用编排和业务效果对齐的全链路流程。
卡位工具链供应商
随着大模型行业的迅猛发展,一条完整的产业链正在逐步形成,从专精底层模型架构到终端链接千行百业,各个厂商都在努力寻找自己在供应链上的位置。
“星环科技的大数据基础平台TDH支持11种模型的统一存储管理,能够为大模型落地的训练开发、应用推广、运营提升等多个环节的不同多模态存、算、检索、生成需求,提供统一的数据接口。”孙元浩告诉记者,与此同时,星环科技自身也推出了两款深耕细分领域的垂类模型,分别为金融大模型“无涯”及大数据分析大模型“求索”。
谈及未来规划,孙元浩表示,星环科技将进一步提升在大数据和人工智能领域内的技术实力,巩固公司的技术壁垒。“目前我们已经有三个计划中的项目,分别是数据分析大模型建设项目、智能量化投研一体化平台建设项目和AI知识助理建设项目。”孙元浩说。
在采访中,孙元浩多次提及“生态建设”。他表示,星环科技日前已经加入中国大模型语料数据联盟,联盟主要为了应对大模型发展对高质量、大规模、安全可信语料数据资源的需求,旨在通过链接模型训练、数据供给、学术研究、第三方服务等多方面机构,联合打造多知识、多模态、标准化的高质量语料数据,探索形成基于贡献、可持续运行的激励机制,打造国际化、开放型的大模型语料数据生态圈。
“生态对于整个大模型产业发展有着重要的意义。”孙元浩以公司金融大模型“星环无涯Infinity”为例介绍称,该模型基于公开研报、公告、政策、新闻、监管法规、公开司法判例等数据,融合了舆情、工商、产业链、热门主题、卫星等多模态信息,将之转化为高质量金融语料,输出对于事件或标的的总结分析及演绎推理,“这个产品汇集的各类信息和语料,就是基于生态伙伴们的共建。”