5版 特别报道  查看版面PDF

2024年

7月6日

查看其他日期

数据底座 高质量供给流通 垂直服务“训练有素”

2024-07-06 来源:上海证券报 作者:◎记者 宋薇萍

高质量供给流通 垂直服务“训练有素”

◎记者 宋薇萍

智能未来,数据先行。 2024世界人工智能大会上,“高质量数据”成为热词。

AI模型越来越复杂,并开始处理文本、音频、图像和视频等各种类型数据,其对快速数据处理的需求更加迫切。回应市场需求,星环科技在大会现场展示了企业级多模态知识存储与服务,包括大数据与云平台、星环分布式交易型数据库Transwarp KunDB、分布式分析型数据库Transwarp ArgoDB等,助力企业打造新一代一站式多模型数字底座。

在中国电信展台数据要素能力展区,其打造的数链智网(DCAN)吸引不少观众驻足。数链智网是中国电信依托云、网、数、智、安资源禀赋和基础优势,统一构建的数据要素能力体系,涵盖“星海”大数据产品矩阵、“灵泽”数据要素链服务、“银河”数据跨境流通解决方案等三大板块。未来,中国电信将着力打造国内国际数据要素双循环安全可信交换模式,构建数据跨境流通平台,提供数据跨境安全服务和数据跨境咨询服务的一体化解决方案。

当前,高质量数据供给和安全流通,成为大模型进入垂直产业应用面临的首要挑战。行业大模型获得解决专业问题的能力,首先要经过数量充足、质量高的专业数据训练。然而,专业数据往往分散在不同的机构、企业中,并且由于价值大、保密要求高,难以流动。此外,企业、大模型厂商、用户之间存在信任壁垒,企业担心数据对外泄露,大模型厂商担心模型资产安全,用户担心个人数据和隐私泄露。

大会上,数据要素领域的主要技术服务商——蚂蚁集团发布“隐语Cloud”大模型密算平台,通过软硬件结合的可信隐私计算技术,在大模型托管和大模型推理等环节实现数据密态流转,保护模型资产、数据安全和用户隐私。

蚂蚁密算CEO王磊介绍,“隐语Cloud”大模型密算平台首批推出两大服务,分别为大模型密态托管和大模型密态推理:大模型密态托管,指模型提供方可以将模型加密后托管在平台上,一键完成云上密态部署,保护模型资产不被泄漏和盗用;大模型密态推理,指数据以密态形式完成推理,保护用户交互时的数据安全、商业机密等。

星环科技创始人、CEO孙元浩表示,为解决大模型中文语料治理等数据问题、大模型的安全可控问题,以及垂类全流程安全可控问题等,星环科技持续加大工具平台研发,在Sophon智能分析工具中推出大模型运营平台(Sophon LLMOps),提供一站式的大模型基础平台。同时,加快模型和语料研发,推出大模型“无涯”,借助公司研发和行业经验,完整实现大模型所需硬件选型、基础软件开发等功能。此外,星环科技还积极推进数据要素相关研发,数据要素流通平台Navier、数据安全管理平台Defensor等已投入应用。

隐私计算也是行业的急迫需求。在蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬看来,数据供给决定了大模型应用能力的上限,而隐私计算技术决定了数据跨域供给的上限。当大模型从通用走向专业应用,从技术想象力走向产业的生产力,必须解决高质量数据集稀缺与专业数据阻滞的挑战。未来,高价值数据深度融合,须以密态方式进行安全流转。

“我们希望联合产业合作伙伴,把蚂蚁集团多年来在密态计算技术上的探索和创新,以开源和产品化的形式对外开放,助力推动产业向前发展,为实体经济和中小微企业创造新的价值,让数据价值的流动像自来水一样即开即用。”韦韬说。