961版 信息披露  查看版面PDF

2025年

4月26日

查看其他日期

北京海天瑞声科技股份有限公司2024年年度报告摘要

2025-04-26 来源:上海证券报

公司代码:688787 公司简称:海天瑞声

第一节 重要提示

1、本年度报告摘要来自年度报告全文,为全面了解本公司的经营成果、财务状况及未来发展规划,投资者应当到www.sse.com.cn网站仔细阅读年度报告全文。

2、重大风险提示

公司已在本报告中详细描述可能存在的风险,敬请查阅“第三节管理层讨论与分析”(之四)“风险因素”部分,请投资者注意投资风险。

3、本公司董事会、监事会及董事、监事、高级管理人员保证年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。

4、公司全体董事出席董事会会议。

5、容诚会计师事务所(特殊普通合伙)为本公司出具了标准无保留意见的审计报告。

6、公司上市时未盈利且尚未实现盈利

□是 √否

7、董事会决议通过的本报告期利润分配预案或公积金转增股本预案

经公司第三届董事会第四次会议审议,公司拟定2024年度利润分配预案如下:

拟以实施权益分派股权登记日登记的总股本扣除回购专户股份后的股本为基数分配利润,向全体股东每10股派发现金股利3.50元(含税),截至2025年3月31日,公司总股本60,325,180股,回购专户股份数466,117股,以此计算合计拟分派现金红利20,950,672.05元(含税);根据《上市公司股份回购规则》等有关规定,上市公司以现金为对价,采用要约方式、集中竞价方式回购股份的,视同上市公司现金分红,纳入现金分红的相关比例计算。公司在2024年度以集中竞价交易方式累计回购906,014股,支付的资金总额为人民币49,987,510.15元(不含印花税、交易佣金等交易费用),视同现金分红。综上,公司2024年度现金分红总额为70,938,182.20元(含税),现金分红比例为625.77%;2024年度不进行资本公积转增股本,不送红股。

2024年度利润分配预案披露后至实施权益分派的股权登记日期间,若公司总股本发生变动,公司拟维持每股现金分红金额不变,相应调整现金分红总额。

上述利润分配方案尚需提交公司2024年年度股东大会审议通过。

8、是否存在公司治理特殊安排等重要事项

□适用 √不适用

第二节 公司基本情况

1、公司简介

1.1公司股票简况

√适用 □不适用

1.2公司存托凭证简况

□适用 √不适用

1.3联系人和联系方式

2、报告期公司主要业务简介

2.1主要业务、主要产品或服务情况

1.主要业务情况

公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。

自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据涵盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能家居、智能驾驶、智慧金融、智能安防等多种创新应用场景。

公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、内容生成、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前公司客户累计数量超过1,050家,覆盖了科技互联网、社交、IoT、智能驾驶、大模型等领域的主流企业,以及政企、教育科研机构。

图:公司产品服务矩阵示意

2.主要产品及服务情况

2.1主要产品及服务按业务类型分类

公司研发、生产的训练数据覆盖了智能语音、计算机视觉及自然语言处理三大AI核心领域,广泛应用于算法模型的开发、训练、优化、应用场景拓展等环节。此外,公司还提供与训练数据相关的应用服务。

(1)智能语音

人工智能在语音领域的应用技术主要包括语音识别、语音合成等。

语音识别(Automatic Speech Recognition,ASR)是让机器能够“听懂”人类语音的技术,它能使机器自动将语音信号转换为对应的文本信息。

语音合成(Text to Speech,TTS)是让机器能够“说出”人类语音的技术,它使机器能将文字信息转化为流畅的语音“朗读”出来,相当于给机器安上了人工嘴巴。

以日常生活中的情景为例,语音输入法、即时通讯软件运用了语音识别技术将用户输入的语音实时转换为文字,实现了软件“听懂”语音并“听写”出文字的效果;而地图、导航软件则运用语音合成技术,实现了软件“发声说话”的效果,为用户提供即时语音导航。

公司通过设计(设计训练数据集结构、供发音人朗读录制的语料文本或对话场景、发音人分布、录音设备场景等)、采集(定义合适的发音人、选取录音设备及软件、组织发音人朗读录制音频)、加工(对音频文件进行切分、标注各类声音特征,形成带时间戳和特征标签的文本和标注文件等)、质检(对数据集进行质量检测,如音字一致性、标注准确率检查等)等训练数据集生产环节;或者针对客户提供的原料音频文件执行加工、质检工作,最终形成客户所需的智能语音训练数据集。

(2)计算机视觉

计算机视觉(Computer Vision,CV)是使机器具备“看”的功能的技术,它使得智能驾驶、智能家居、手机、安防设备等机器能够代替人眼对目标进行识别、跟踪和测量等。

以日常生活中的情景为例,在汽车的自动驾驶功能中,计算机视觉技术使得汽车能够“看见”并识别行车过程中的各种行人、路况场景,为后续作出相应的反应奠定基础;在机场、车站安检中,计算机视觉技术使得人脸识别设备能够识别被检验人员是否为其出示的身份证件显示的人员。

公司通过设计训练数据集结构、采集(如定义合适的人脸、动作、场景作为采集对象,组织被采集人按照要求拍摄照片、录制视频等)、加工(对图像、视频文件进行打点、拉框、分割标注等)、质检(对数据集进行质量检测,如检验图片、视频文件格式是否正确,检查光照环境、物体种类的数量是否达标,打点标框的准确率是否符合要求等);或者对客户提供的图像、视频文件执行加工、质检工作,最终形成客户所需的计算机视觉训练数据集。

(3)自然语言处理

自然语言处理(Natural Language Processing,NLP)是使机器能够像人一样理解语言意图的技术。

以日常生活中的情景为例,寄送快递时使用的“智能填写”功能即运用了自然语言处理技术,在输入框中填入整段联系信息,软件应用能够理解语义,并从中识别及提取“收件人”、“联系方式”、“地址信息”等所需信息,完成自动填写;智能客服、聊天机器人等人机交互程序也运用了自然语言处理技术,使得程序、机器能够读懂人类语言的真正意图,并相应做出反应、提供服务等。

公司通过设计训练数据集结构、采集(收集或编写自然语言文本、对话等数据信息)、加工(对自然语言文本数据进行单词分割、词性标注、语义语法标注、情感属性标注等)、质检(对数据集进行质量检测,如检验文本、词性或者语义的标注结果是否准确等);或者对客户提供的自然语言文本执行加工、质检工作,最终形成客户所需的自然语言训练数据集。

(4)训练数据相关的应用服务

公司开放基于多年行业经验打磨的数据处理工具集及平台,提供包括公有云访问、私有化部署及SaaS化服务的多种能力,满足产业链上各类企业对于数据处理工具及平台能力的需求。

公司基于自身生产的训练数据提供算法相关的模型训练服务、模型评测服务及模型应用服务,运用训练数据研发能力助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高AI技术应用效果。

前述产品、服务均以公司生产的专业训练数据集为核心或基础。公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。

成品训练数据集主要由数据文档、说明文档、技术文档三部分构成。以智能语音训练数据集为例,成品训练数据集包含原始采集形成的音频文件、与音频文件对应的带有时间戳的标注文件,训练数据集相关的设计文档、训练数据集说明,发音词典,数据集参数信息文件等,图示如下:

图:训练数据集结构(智能语音)示例

2.2主要产品或服务的终端应用场景

公司提供的高质量、大规模、结构化的训练数据,为算法模型的训练拓展提供了可靠的训练素材,助力AI技术实现实践应用及商业化落地,赋能AI技术与实体经济深度融合。公司提供的训练数据广泛应用于众多主流AI产品及终端应用的训练过程中,覆盖了个人助手、语音输入、内容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息提取、情感分析、OCR识别等多种应用场景。

图:训练数据集服务的算法模型应用场景示意

2.2主要经营模式

1.盈利模式

与主要产品及服务类型对应,公司的盈利模式主要包括以下三类:

(1)定制服务:公司根据客户需求提供定制训练数据集并收取服务费。在此种模式下,公司享有服务费收入,不享有最终生成的训练数据的知识产权,不可将此类业务生产的训练数据向其他客户重复销售。

(2)标准化产品:公司开发自有知识产权的训练数据集产品,通过销售训练数据集产品的使用授权许可,获取让渡资产使用权收入。此类训练数据集一经开发完成,可多次销售并获取授权许可收入。

(3)训练数据相关的应用服务:公司基于积累的训练数据和多年行业经验提供数据处理工具集及平台服务、算法相关的模型训练、模型评测及模型应用服务,通常以软件授权或软硬件一体化形式交付平台产品、算法模型拓展、开发成果等,获取让渡资产使用权收入和技术服务等收入。

2.生产或服务模式

(1)训练数据集生产模式

公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。

图:训练数据生产过程示意图

公司的训练数据生产过程主要包括四个环节:设计(训练数据集结构设计)、采集(获取原料数据)、加工(数据标注)及质检(各环节数据质量、加工质量检测)。

(2)训练数据相关的应用服务模式

公司开放基于多年行业经验打磨的数据处理工具集及平台,提供包括公有云访问、私有化部署及SaaS化服务的多种能力,满足产业链上各类企业对于数据处理工具及平台能力的需求。

公司基于其生产的训练数据提供算法模型相关的训练、评测及应用服务,助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景(例如特定行业、特定口音等)的专属算法模型,提高AI技术应用效果。

以某大型科技公司客户项目为例,客户研发了特定语音识别算法模型,需要根据算法模型的实际场景(如法院庭审场景)开发落地应用。公司承担了部分落地应用拓展相关的开发工作,围绕客户的算法模型和接口开发,最终协助客户算法模型实现多个麦克风收集庭审语音内容并实时转成文字记录入系统的功能。

3.采购模式

按照采购的内容及主体划分,公司的采购包括:

数据服务采购:公司在数据采集、加工环节中,向人力资源服务等类型的公司等供应商采购的,非核心技术环节的原料数据采集、标注服务。

岗位服务采购:主要针对临时性的、不设长期岗位的业务领域的外包采购,如保洁、临时招聘服务、少量实习生招聘等。

其他采购:(1)训练数据生产所需的资产,主要包括软、硬件设备及其他需求物品采购;(2)日常运营所需的资产及物品,如办公用房、车辆、办公家具、计算机设备等;(3)日常专项服务采购等,主要包括审计服务、会议服务、差旅服务等。

上述原料数据采集、加工环节所涉及的数据服务采购,为公司最主要的采购类别,由集采中心负责;各部门岗位服务采购由人力资源部负责;其余日常运营相关的资产物品采购、专项服务采购等非业务采购由集采中心负责。财务中心负责参与采购供应商的遴选、监督与管理,并对采购费用进行核算及结算。

经过多年的发展,公司已经建设有完善的《海天瑞声采购管理制度》、《海天瑞声项目资源采购管理制度》、《海天瑞声供应商管理制度》、《海天瑞声岗位服务采购管理制度》等内部规范制度,设立有完善的采购流程和体系,并与主要的供应商形成了良好稳定的长期合作关系。

4.营销模式

公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高质量的训练数据集及相关服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过直接拜访潜在客户、参与学术会议和行业展会新产品发布、搭建并持续升级公司官方网站和建立自媒体矩阵等方式提升品牌知名度、开拓新客户,后续再通过商务谈判、招投标等形式获取具体业务机会。

2.3所处行业情况

(1). 行业的发展阶段、基本特点、主要技术门槛

1.1行业的发展阶段、基本特点

(1)政策、技术、应用协同共振,全球AI产业迈入高速发展新阶段

当前,全球人工智能产业正迎来历史性发展拐点,政策、技术与应用的三重共振推动行业进入高速增长通道。中、美、欧三大经济体持续加码AI布局:中国通过《新一代人工智能发展规划》和《"十四五"数字经济发展规划》等构建了涵盖技术研发、资源建设和标准制定的全链条政策体系;美国则依托《人工智能行政令》和星际之门计划(Stargate)等,持续巩固其在人工智能基础设施领域的领先优势;欧盟以《人工智能大陆行动计划》为纲领,配套《数字欧洲计划(2025-2027年工作方案》专项资金,重点培育AI与高性能计算融合创新。技术层面,人工智能也正在经历革命性突破,DeepSeek R1等开源模型通过性能提升与成本优化的双重突破,显著降低了技术应用门槛;多模态大模型(如Sora、GPT-4o)也在不断拓展AI能力边界,实现全模态互动能力。这种技术平权运动正在加速AI向千行百业渗透,大模型已逐步开始向金融、医疗、制造等核心领域进行新一轮的赋能,智能风控、AI辅助诊断、智能制造等应用场景不断丰富,推动各行业效率提升和模式创新。全球AI产业也将在上述政策引导、技术迭代与商业落地的正向循环下,迎来前所未有的发展机遇,加速向规模化、价值化阶段迈进。

根据国际数据公司(IDC)的数据,2024年全球人工智能(AI)IT总投资规模为3,158亿美元,预计在2028年增至8,159亿美元,年复合增长率(CAGR)为32.9%。

数据来源:国际数据公司(IDC)

中国作为全球科技大国,也深度受益AI技术发展。根据艾瑞咨询的数据,2024至2029年中国AI产业将保持32.1%的年均复合增长率,在2029年突破1万亿的市场规模。

(2)训练数据作为AI发展和演进“燃料”的作用更加凸显,并逐渐成为大模型竞赛中的重要决定性要素

在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。过去十多年,人工智能产业以算法为核心,通过深度学习算法的不断创新,推动人工智能产业的快速发展。但未来,当更多先进算法趋于开源,算法的差异化壁垒逐渐消除;此外,以DeepSeek为代表的算法架构创新和工程优化,带来了训练以及推理成本的大幅下降,这也意味着算力将不再是制约AI发展的核心因素。在此背景下,训练数据的重要性被进一步放大,成为未来AI发展的关键驱动因素。数据的质量、规模和精准性将直接决定模型能力的上限,高质量的训练数据不仅能显著提升模型的推断可靠性,还能有效减少幻觉和错误信息的产生,成为模型落地效果的关键。因此,高质量数据需求将呈现快速增长趋势。

根据Cognilytica数据统计显示,预计2027年全球AI训练数据市场规模将增长到220亿美元,2021-2027年复合增长率达32%。

数据来源:Cognilytica

中国作为全球人工智能产业增速最快的国家之一,相关数据需求也在快速增长。根据艾瑞咨询的数据,2024年中国人工智能基础数据服务市场规模为58亿元,2028年规模将达到170亿元,年复合增长率为30.84%。

数据来源:艾瑞咨询

(3)数据要素市场蓬勃发展,数据行业迎来更为广阔的发展机遇

党的二十届三中全会对加快构建促进数字经济发展体制和机制,完善数据要素市场制度规则等作出部署,为中国数据要素市场化改革发展指明了方向。2023年国家数据局成立以来,我国坚持推进数据要素市场化配置改革“一条主线”,统筹数字中国、数字经济、数字社会“三个建设”的工作思路,推动数据工作更好服务高质量发展。同时,探索完善数据基础制度体系,加快推进数据基础设施建设,提升数据资源开发和利用水平。国家数据局联合多部门制定《“数据要素×”三年行动计划(2024一2026年)》《关于促进数据产业高质量发展的指导意见》《国家数据基础设施建设指引》《关于促进数据标注产业高质量发展的实施意见》等一系列数据产业发展指导意见,体现国家高度重视数据产业高质量发展,《关于促进数据产业高质量发展的指导意见》指明了数据技术和产业重点发展方向;《关于促进数据标注产业高质量发展的实施意见》明确提出培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。

全国各地数据要素市场化配置改革也在加速推进。例如,北京市制定2024数据工作要点,在探索和实践数据基础制度先行示范区、人工智能数据训练基地的基础上,提出“一区三中心”的建设总体思路,开展“高端数据标注基地”建设,不断完善数据基础制度,激发数据要素活力。2024年国家公布了7个数据标注基地试点城市,数据标注规模再创新高,数据标注总规模达17282TB,相当于中国国家图书馆数字资源总量的6倍左右。其中,成都市发展改革委印发《2024年成都市数字经济发展工作要点》,成都市大数据集团探索精准安全的公共数据开发运营新模式,搭建“成都市公共数据运营服务平台”,保障不同市场主体平等获取数据要素,实现数据要素配置效益最大化、效率最优化。2024年长沙市政府印发《长沙市关于推进国家数据标注基地建设的工作方案》,同时配套出台《长沙市关于推进国家数据标注基地建设若干政策(试行)》,从聚焦加快培育标注产业、支持技术创新攻关、加强专业人才培育、促进数据服务赋能等四大方面推出了14条产业政策,加大扶持力度。沈阳市推动数据要素市场化配置改革,探索数据交易服务机制,实施《沈阳市公共数据授权运营管理办法(试行)》,开展公共数据授权运营探索实践。其他地方政府也非常关注高质量数据集和数据标注产业的发展。例如,呼和浩特市政府印发《关于构建数据基础制度更好发挥数据要素作用的实施方案》,加快构建数据制度,激活数据要素潜能,更好发挥数据要素作用,增强经济发展新动能。打造内蒙古数据要素产业园,创建数据标注基地。

总体来看,随着“人工智能+”和“数据要素×”等国家战略行动计划的实施,全国各地均在加速推进数据要素市场化配置改革,未来将以高质量数据集建设,夯实人工智能数据基石,推动数字经济高质量发展为目标,围绕数据的汇聚、治理、标注、运营、评测、开发利用以及流通交易全流程,将产生包括数据汇聚、数据治理、数据标注、数据运营、数据评测、数据应用、数据流通、可信数据空间、数据标注基地运营等在内的新业态、新模式,将成为我国数字经济发展的新增长极。

(4)训练数据领域的未来发展趋势

随着DeepSeek、GPT-4o等成为全球范围内的现象级应用,以及以手机、具身智能为代表的AI终端的快速推出,人工智能迎来了新的发展机遇,其背后的大模型技术也正在带来相关数据需求的变化和增长。

a.多模态大模型正成为人工智能发展的新趋势,多模态数据需求显著上升

当前,大模型正经历从单模态到多模态的范式转变。多模态技术的本质在于跨模态信息融合,即通过协同处理文本、图像、音频、视频等不同形式的数据,使AI具备更接近人类的全维度认知能力。这种演进不仅显著提升了模型在跨模态任务中的鲁棒性,更解锁了诸如视觉问答、跨模态生成、智能语音交互等复杂场景的应用潜力。

以视觉问答为例,系统需同时解析图像中的视觉元素和文本问题的语义信息,并通过模态对齐与知识推理生成准确回答。这一过程的实现,依赖于海量高质量的图文对数据。数据服务商需构建覆盖多样化场景的问答对,通过模拟真实世界的视觉推理逻辑,训练AI建立视觉-语言联合表征能力。而在语音合成领域,要实现富有表现力的拟人化发声,仅有时序对齐的文本-语音数据远远不够,还需引入情感标签、语调标记、韵律特征等细粒度标注,让AI精确捕捉人类语言中的情感起伏和表达风格。

实践证明,数据质量与多样性是多模态AI发展的决定性因素:一方面,优质数据定义了模型的能力上限;另一方面,数据分布的广度直接关系到技术落地的普适性。未来,随着多模态数据生态的持续完善,AI的感知与认知能力有望实现新的跨越。

b.大模型发展正在从"规模驱动"向"推理驱动"转型,高质量思维链(CoT)数据成为提升大模型复杂推理能力的关键突破口

随着DeepSeek R1的推出,思维链技术(Chain of Thought,CoT)迅速成为AI领域的研究热点。这项技术通过引导模型模拟人类逐步推理的过程,显著提升了其在逻辑推理、数学计算及复杂问答等任务中的表现。

过往几年,大语言模型(LLM)的发展主要遵循Scaling Law(规模定律),即通过扩大模型参数量和训练数据规模来提升性能。然而,随着知识积累的边际效益逐渐降低,仅单纯依赖规模的增长已难以实现质的飞跃。于是,让AI像人类一样进行深度、有序的“慢思考”,成为突破现有认知能力瓶颈的关键方向。以数学问题为例,传统LLM往往直接输出最终答案,而省略中间推理过程,导致错误率居高不下。相比之下,具备CoT能力的模型会分步骤解析问题,先理解题意,再梳理已知条件,逐步推导计算,并最终验证结果的合理性。这种显式推理机制不仅大幅提高了模型的准确性,还使其决策过程更加透明,便于开发者理解和优化。

然而,思维链能力高度依赖高质量的CoT数据一一即包含详细推理步骤的问答对。这类数据由于专业性强、标注难度高,目前仍属于稀缺资源。具体而言,优质的CoT数据需要领域专家进行人工构建,不仅要确保问题本身的复杂性,还需对解题过程中的每个逻辑进行严格验证,这种双重门槛使得数据生产周期往往长达普通标注任务的数倍。当前即便是最前沿的合成数据技术,在生成具有严密因果关系的多步推理时,仍会有相当概率出现逻辑断层,这也使得高阶人工标注目前仍是不可替代的重要数据来源。

c.从通用到垂直,高质量行业数据需求显著提升

以DeepSeek为代表的开源大模型,以其高性能、低成本,以及允许全球用户无限制商用等特点,进一步加速了AI应用的普及,激发了应用层的创新活力,使AI逐渐从通用大模型向更广泛的应用场景和行业领域拓展,AI不再局限于作为回答通用问题的智能助手,而是能够针对特定行业/场景提供解决方案,或者协助执行各类复杂任务的超级助理(AI Agent)。例如,在医疗领域,AI可以作为影像科医生辅助诊断;在法律领域,AI可以担任法律顾问提供专业咨询;同时,AI Agent也能够独立完成点外卖、制定行程、预订机票等日常任务。

AI不仅在传统行业与生活场景中展现出独特价值,在智能终端领域,同样掀起了革新的浪潮。例如,AI在智能手机上的应用,可以帮助用户通过文字快速创作专业级摄影大片;当海量照片让整理相册成为难题时,可以快速通过文字描述定位对应图像,实现即时快速检索。在交互层面,AI赋能的语音助手也有质的飞跃。如今的语音助手不再是简单的指令执行者,它们能理解各种不同语种、不同场景下,复杂的语义和情感,并用不同的音色情感与用户进行交互。

与以往通用数据处理需求不同,垂向领域的数据处理更加注重专业性。例如,传统的自然语言处理只包括基本的文本处理工作,例如,分词、词性、正则化等标注需求,这些任务无需标注人员具有特定的行业知识;相对地,开发专门领域,例如医疗大模型,则要求标注人员不仅具备扎实的医疗专业知识,还要能够熟练使用医疗术语进行专业场景下的表达,使医疗模型能够理解和生成专业的医疗内容。这种专业化的需求也对数据服务商提出了更高的要求,数据服务商不仅要对行业有深刻的理解,以设计出符合行业需求的数据解决方案,还需要具备更丰富的专家库储备,以提供高质量的数据标注服务以及相关专业咨询服务。

d.具身智能浪潮来袭,数据供给瓶颈亟待突破

具身智能作为通向通用人工智能(AGI)的关键路径与终极载体,正引领着AI发展的下一波浪潮。与传统大模型不同,具身智能的核心在于构建能够与物理世界深度交互的智能体。这不仅需要突破性的多模态感知技术(包括视觉、听觉等),更重要的是要具备基于环境感知的自主决策与执行能力。实现这一目标的关键在于海量的物理世界交互数据,目前行业主要依赖四种数据来源,机器人遥操(通过人工远程操控获取真实场景下的操作数据)、动作捕捉(记录人类在特定环境中的行为模式)、虚拟合成(利用仿真环境生成训练数据)和互联网开源数据集(整合现有的公开机器人数据)等。其中,虚拟合成技术虽解决了初期数据短缺问题,但由于"仿真差距"的存在,其数据质量往往难以满足高精度训练需求。而开源数据集则面临着数据规模有限(通常仅百万级)、采集条件单一等挑战,无法支撑复杂场景下(需要千万级数据)的模型训练需求。当前,在具身智能蓬勃发展的大背景下,高质量的数据供给短缺问题愈发凸显,具身智能的训练数据市场呈现出巨大的供需缺口,需求旺盛且潜力巨大。

e.国家法律法规密集落地,对数据安全及合规提出更高要求

近年来,数字经济规模快速扩张,数据作为数字经济时代核心生产要素,重要性更加凸显,但数据不同于传统生产要素,其中可能涉及个人隐私以及国家安全的重要信息,因此,为更好保障数字经济长期稳定的可持续发展,建设规范、安全、合规、高质量的数据安全体系已成为迫切需求。近年,国家陆续出台包括《数据安全法》、《个人信息保护法》、《网络数据安全管理条例》等主流法律法规,为解决数据安全问题、净化行业快速发展中的不良乱象提供了切实可行的法律依据。

未来,随着AI技术不断革新,应用行业以及场景不断增加,各行业、各领域数据安全规范逐渐落地将成为趋势,对于以数据生产为主营业务的数据服务企业,数据安全及合规能力将成为数据服务能力的核心评价维度,成熟的安全合规管理体系将成为重要评价标准,能持续跟踪法律环境变化,积极响应监管政策,牢牢把握发展与安全并重的原则的企业将具有更强的市场竞争力。

1.2 行业的主要技术门槛

随着AI技术不断演进、产业应用不断丰富,训练数据的市场需求呈现体量、难度、复杂性、合规性持续上升的趋势,数据服务商须同时具备对人工智能核心算法的理解能力、前瞻性的专业数据集设计能力、丰富的语言覆盖能力及场景采集能力、算法辅助数据生产能力、以及数据合规管理能力,这使得行业的技术门槛持续提升,具体体现为:

(1)在训练数据研发、生产全流程中的算法全面介入

随着AI技术应用落地的规模化效应凸显,客户对于数据规模和处理效率的要求不断提升,数据服务商须在研发、生产流程中全面引入算法以实现高效、合理的人机协作模式,进而实现降本增效的目标。一般而言,在训练数据研发、生产全流程中融入算法技术,可用于训练数据集的设计及训练数据生产的各个环节,例如调度不同类型的标注人员应对不同领域的任务、形成算法自动处理能力以帮助标注人员提升效率、降低对人员的依赖(既有人员数量的降低、也有对人员标注能力要求的降低),并构建训练数据设计、加工相关的核心技术;也可用于检查训练数据集对算法模型的训练效果,进而保障训练数据集质量。

(2)平台工具链功能及适配性要求持续提升

当前,客户侧的数据采集、标注需求范围在逐渐拓宽,数据采集与标注需满足的AI应用场景比以往明显更加广泛、复杂,这就对数据服务商的平台工具能力提出了更高要求,平台上处理大规模的数据、这些处理过的数据的多样性和复杂程度如何、算法引擎投票机制如何建立、置信区间如何设置、算法在平台中如何应用、数据流转的工程化程度如何等等这些因素都决定了平台的适配性和能力如何,并最终决定了数据处理的质量、效率、成本。

(3)语音语言学基础研究方面须有深厚积累

伴随语音技术进一步发展落地、并向各行各业和更多垂直场景不断渗透,同时受到中国企业出海需求、国外企业区域拓展需求两方面的支撑,客户在多语种、多音色、音素集、发音规则、发音词典等方面的要求在不断抬升,这意味着只有那些在语音语言学基础研究方面投入更多、拥有深厚积累的数据服务商才能满足客户在这方面的多元化需求。

因此,市场上仅有极少数企业通过长期自主研发的方式能够达到上述核心技术门槛,成为有能力向不同客户群体提供综合、高效、合规的数据产品及服务的供应商。

(2). 公司所处的行业地位分析及其变化情况

作为行业的头部阵营企业,海天瑞声在经营情况、技术实力、以及以数据安全为代表的其他综合能力方面都展示出明显优势,并具有较强国际竞争力。近年来公司紧跟AI技术发展趋势,尤其关注在客户资源、技术实力、产品/服务等方面的竞争优势,树立国内领先基础数据服务商的品牌形象,以巩固公司的行业领先地位。与同行业国内外竞争对手的对比情况及优势体现如下:

注1:数据堂、标贝科技数据:除特别标注外,均为2024年1-12月/截至2024年12月31日数据,前述公司官网及公开披露信息;国家知识产权局中国及多国专利审查信息查询平台(https://www.cnipa.gov.cn/)、中国版权保护中心CPCC微平台等公开信息查询渠道及第三方机构查询信息。

注2:海天瑞声、Appen数据:均为2024年1-12月/截至2024年12月31日数据。

(3). 报告期内新技术、新产业、新业态、新模式的发展情况和未来发展趋势

(1)DeepSeek带火CoT技术,多领域CoT数据需求集中涌现

伴随DeepSeek R1的火爆出圈,其背后的思维链(CoT)技术正在成为AI领域的新焦点。该技术通过模拟人类"慢思考"认知模式,将复杂问题拆解为逻辑严密的推理链条,使AI系统在数学推导、专业决策等场景中准确率大幅提升。

而构建优质的CoT能力体系,需要以结构化思维数据工程为核心基础。通过在训练数据中引入包含中间推理步骤的示例,引导模型学习如何逐步进行推理,并在生成回答时模仿这种推理过程。例如,在数学领域,融入分步证明过程的CoT数据,可以使模型掌握从问题解析、公式推导到结论验证的完整认知闭环,使数学问题解决能力大幅提升;在医疗影像诊断领域,借助CoT数据训练的AI模型可基于影像特征给出逐步推理过程,提高诊断准确性和可解释性。因此,在大模型向应用/垂直领域拓展时,高质量的多领域CoT数据需求将快速增加,并成为推动AI技术发展的关键因素。

(2)DeepSeek加速AI应用拓展,垂向领域数据需求快速增加,标注难度不断提升

以DeepSeek为代表的开源大模型,凭借高性能、低成本和无限制商用等特点,加速了AI应用的普及。该技术民主化浪潮推动行业从"暴力堆参数"的通用模型竞赛,转向面向医疗、金融、制造等领域的深度价值挖掘,催生出行业数据处理需求的指数级增长。与通用类数据处理不同,行业数据处理难度更大、更加注重专业性,对数据服务商的综合能力也提出了更高的要求。一方面,数据服务商需具备行业knowhow,以设计出符合行业需求的数据解决方案;另一方面,随着模型向更专业化和精细化方向发展,丰富的高质量的垂类专家资源也至关重要,目前数据服务公司会在高校密集地区建立数据标注基地,以获取更广泛的高质量的数据标注资源。

(3)具身智能的训练数据市场呈现出巨大的供需缺口,需求旺盛且潜力巨大

具身智能作为实现通用人工智能(AGI)的关键路径与终极载体,正在受到更多的关注。国家层面,工信部等七部门联合印发《关于推动未来产业创新发展的实施意见》,将具身智能纳入未来制造、未来信息等六大战略方向。地方层面,北京、深圳、广州、上海等城市已出台专项行动计划,通过资金以及政策支持,深入推动具身智能产业发展。具身智能需要机器人在复杂的真实世界中实现自主感知、学习和适应,而该能力的构建则依赖大量的高质量的数据。目前,业内主要包含四种数据获取方式,分别是遥操作技术收集的真机数据、3D环境中模拟的合成数据、动作捕捉获取的人类动作数据、以及从互联网收集的非结构化视频或图像数据。

然而,具身智能若想达到更佳的训练效果,尤其是在泛化能力提升方面(即让机器人能够在陌生环境下自主识别和完成任务),仍需要海量的(约数十亿级别)来自“真实物理环境”的动态交互数据进行训练,而非简单的合成数据或互联网获取的数据。但目前,由于真实世界数据获取成本高、时间长,数据体量远无法支持通用机器人的发

证券代码:688787 证券简称:海天瑞声

本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、准确性和完整性依法承担法律责任。

重要内容提示

公司董事会、监事会及董事、监事、高级管理人员保证季度报告内容的真实、准确、完整,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。

公司负责人、主管会计工作负责人及会计机构负责人(会计主管人员)保证季度报告中财务信息的真实、准确、完整。

第一季度财务报表是否经审计

□是 √否

一、主要财务数据

(一)主要会计数据和财务指标

单位:元 币种:人民币

(二)非经常性损益项目和金额

√适用 □不适用

单位:元 币种:人民币

对公司将《公开发行证券的公司信息披露解释性公告第1号一一非经常性损益》未列举的项目认定为非经常性损益项目且金额重大的,以及将《公开发行证券的公司信息披露解释性公告第1号一非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目,应说明原因。

□适用 √不适用

(三)主要会计数据、财务指标发生变动的情况、原因

√适用 □不适用

二、股东信息

(一)普通股股东总数和表决权恢复的优先股股东数量及前十名股东持股情况表

单位:股

注:1、北京中瑞安投资中心(有限合伙)已于2024年11月26日更名为北京中瑞安企业管理中心(有限合伙)。

2、截至本报告期末,北京海天瑞声科技股份有限公司回购专用证券账户持有公司股份466,117股,占公司总股本的0.77%,在公司前十名股东和前十名无限售条件股东中。根据相关规定,不列示在上方表格中。

持股5%以上股东、前10名股东及前10名无限售流通股股东参与转融通业务出借股份情况

□适用 √不适用

前10名股东及前10名无限售流通股股东因转融通出借/归还原因导致较上期发生变化

□适用 √不适用

三、其他提醒事项

需提醒投资者关注的关于公司报告期经营情况的其他重要信息

□适用 √不适用

四、季度财务报表

(一)审计意见类型

□适用 √不适用

(二)财务报表

合并资产负债表

2025年3月31日

编制单位:北京海天瑞声科技股份有限公司

单位:元 币种:人民币 审计类型:未经审计

公司负责人:贺琳 主管会计工作负责人:吕思遥 会计机构负责人:王超

合并利润表

2025年1一3月

编制单位:北京海天瑞声科技股份有限公司

单位:元 币种:人民币 审计类型:未经审计

本期发生同一控制下企业合并的,被合并方在合并前实现的净利润为:0元,上期被合并方实现的净利润为:0 元。

公司负责人:贺琳 主管会计工作负责人:吕思遥 会计机构负责人:王超

合并现金流量表

2025年1一3月

编制单位:北京海天瑞声科技股份有限公司

单位:元 币种:人民币 审计类型:未经审计

公司负责人:贺琳 主管会计工作负责人:吕思遥 会计机构负责人:王超

(三)2025年起首次执行新会计准则或准则解释等涉及调整首次执行当年年初的财务报表

□适用 √不适用

特此公告

北京海天瑞声科技股份有限公司董事会

2025年4月25日

北京海天瑞声科技股份有限公司 2025年第一季度报告

(下转962版)