海天瑞声: 海天瑞声2023年度向特定对象发行A股股票预案

证券之星 2023-06-22 00:00:00
关注证券之星官方微博:
证券简称:海天瑞声                                    证券代码:688787
    北京海天瑞声科技股份有限公司
     (Beijing Haitian Ruisheng Science Technology Ltd.)
           (北京市海淀区成府路 28 号 4-801)
                     二〇二三年六月
                 公司声明
记载、误导性陈述或重大遗漏。
制。
本次向特定对象发行股票引致的投资风险,由投资者自行负责。
均属不实陈述。
业顾问。
质性判断、确认、批准或核准,本预案所述本次向特定对象发行股票相关事项的生效和
完成尚待公司股东大会审议通过、上海证券交易所审核通过并经中国证监会作出予以注
册决定。
                      特别提示
  本部分所述的词语或简称与本预案“释义”中所定义的词语或简称具有相同的含义。
议通过。根据有关法律法规的规定,本次发行尚需获得公司股东大会审议通过、上海证
券交易所审核通过并经中国证监会作出予以注册决定后方可实施。
件的特定投资者,包括符合规定条件的证券投资基金管理公司、证券公司、信托公司、
财务公司、保险机构投资者、合格境外机构投资者以及其他符合相关法律、法规规定条
件的法人、自然人或其他合格的机构投资者等。其中,证券投资基金管理公司、证券公
司、合格境外机构投资者、人民币合格境外机构投资者以其管理的二只以上产品认购的,
视为一个发行对象;信托公司作为发行对象的,只能以自有资金认购。
  最终发行对象将在本次发行申请经上海证券交易所审核通过并由中国证监会作出
予以注册决定后,按照相关法律法规的规定及监管部门要求,由公司董事会或董事会授
权人士在股东大会的授权范围内,与保荐机构(主承销商)根据询价结果协商确定。若
国家法律、法规对向特定对象发行 A 股股票的发行对象有新的规定,公司将按新的规
定进行调整。
数量不超过本次发行前公司总股本 60,325,180 股的 20%即 12,065,036 股(含本数),最
终发行数量上限以中国证监会予以注册决定要求的发行数量上限为准。在前述范围内,
最终发行数量将在本次发行由中国证监会作出予以注册决定后,由公司董事会或董事会
授权人士根据股东大会的授权和发行时的实际情况与本次发行的保荐机构(主承销商)
协商确定。
  在本次发行的董事会决议公告日至发行日期间,若公司发生送红股、资本公积金转
增股本、股权激励、股票回购注销等事项引起公司股份变动,本次发行股票数量的上限
将进行相应调整。
  若国家法律、法规及规范性文件对本次发行的股票数量有新的规定或中国证监会予
以注册的决定要求调整的,则本次发行的股票数量届时相应调整。
                                                                     目           录
 一、本次发行后公司业务及资产、公司章程、股东结构、高管人员结构、业务结构的
 三、上市公司与控股股东及其关联人之间的业务关系、管理关系、关联交易及同业竞
 四、本次发行完成后,公司是否存在资金、资产被控股股东及其关联人占用的情形,
第五节 本次向特定对象发行股票摊薄即期回报对公司主要财务指标的影响及公司采
 四、本次募集资金投资项目与公司现有业务的关系及公司从事募投项目在人员、技术、
 六、相关主体对公司本次向特定对象发行摊薄即期回报采取填补措施出具的承诺 .... 52
 一、董事会关于除本次发行外未来十二个月内是否有其他股权融资计划的声明 ........ 54
                         释       义
  在本预案中,除非文义另有所指,下列简称具有如下含义:
一、基本定义
公司/本公司/海天瑞声/发行
                 指 北京海天瑞声科技股份有限公司
人/上市公司
                     北京海天瑞声科技股份有限公司 2023 年度向特定对象发行 A 股
本预案              指
                     股票预案
本次向特定对象发行/本          北京海天瑞声科技股份有限公司 2023 年度向特定对象发行 A 股
                 指
次发行                  股票的行为
A股               指 人民币普通股
定价基准日            指 本次发行的发行期首日
股东大会             指 北京海天瑞声科技股份有限公司股东大会
董事会              指 北京海天瑞声科技股份有限公司董事会
监事会              指 北京海天瑞声科技股份有限公司监事会
中国证监会/证监会        指 中国证券监督管理委员会
上交所              指 上海证券交易所
《公司法》            指 《中华人民共和国公司法》
《证券法》            指 《中华人民共和国证券法》
《科创板上市规则》        指 《上海证券交易所科创板股票上市规则》
《注册管理办法》         指 《上市公司证券发行注册管理办法》
《公司章程》           指 《北京海天瑞声科技股份有限公司章程》
元、万元、元/股         指 人民币元、人民币万元、人民币元/股
控股股东、实际控制人       指 贺琳
中瑞安              指 北京中瑞安投资中心(有限合伙),为公司股东
二、专业术语
                     通过采集与处理等步骤形成的、结构化的、可供人工智能算法
训练数据             指
                     模型训练使用的数据
                     解题方案的准确而完整的描述,是一系列解决问题的清晰指令,
算法               指
                     算法代表着用系统的方法描述解决问题的策略机制
算力               指 计算能力
                   英文为 Artificial Intelligence,缩写为 AI,是研究、开发用于模
人工智能/AI          指 拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一
                   门技术科学
                   生成式人工智能(Generative AI)是使用机器学习和深度学习算
生成式人工智能/生成式 AI   指 法,从现有数据中学习并生成新内容的一种人工智能技术。它
                   可以生成各种形式的数据,如图像、音频、视频和文本,并在
                   虚拟现实、自然语言处理、艺术创作和模拟实验等领域有广泛
                   应用
                   大模型就是 Foundation Model(基础模型),指通过在大规模宽
大模型            指
                   泛的数据上进行训练后能适应一系列下游任务的模型
                 海天瑞声数据生产垂直大模型,是公司利用大模型理论和算法,
                 自主打造的面向人工智能数据基础服务的技术底座,实现面向
数据生产垂直大模型      指
                 多个下游数据任务的设计与处理等规则及内容的多项生成能力
                 模型
                 多模态机器学习(Multi-modal Machine Learning)是一种机器学
                 习方法,用于处理多种类型的数据,如图像、文本、音频等。
多模态            指 它通过将来自不同模态的数据进行整合和联合建模,以提取和
                 学习不同模态之间的相关信息和特征。多模态数据是指用于多
                 模态机器学习训练使用的跨形态数据类型
                 英文为 Deep Learning,缩写为 DL,是从机器学习中的人工神经
                 网络发展而来的多层人工神经网络和它的训练方法是一种基于
深度学习(DL)       指
                 人工神经网络的机器学习,其中多层处理被用来从数据中逐步
                 提取更高层次的特征
                 英文为 Reinforcement Learning from Human Feedback,缩写为
                 RLHF,是一种机器学习方法,旨在使智能系统从环境中学习,
人类反馈强化学习       指
                 通过引入“奖励”和“惩罚”信号,让系统自行探索环境并学
                 习最佳行为策略,以最大化某种特定目标
                 人工智能基础数据、训练数据均指通过采集与处理等步骤形成
人工智能基础数据、训练数     的、结构化的、可供人工智能算法模型训练使用的数据;人工
               指
据、人工智能基础数据服务     智能基础数据服务指为 AI 算法训练及优化提供的数据集设计、
                 数据采集/获取、清洗、标注/优化、评测等服务
                 美国 OpenAI 研发的聊天机器人程序,ChatGPT 是人工智能技术
                 驱动的自然语言处理工具,它能够通过理解和学习人类的语言
ChatGPT        指 来进行对话,还能根据聊天的上下文进行互动,真正像人类一
                 样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、
                 代码,写论文等任务
                   实现人机语言的通信,包括语音识别技术(ASR)和语音合成
智能语音           指
                   技术(TTS)
                   Automatic Speech Recognition,是一种将语音信号自动转换为文
语音识别(ASR)      指
                   本的技术,是实现智能人机交互的关键技术之一
                   Text to Speech,即“从文本到语音”,是一种将文字智能地转化为
语音合成(TTS)      指
                   自然语音的技术
                 英文为 Natural Language Processing,缩写为 NLP,是计算机科
自然语言处理         指 学领域与人工智能领域中的一个重要方向,研究能实现人与计
                 算机之间用自然语言进行有效通信的各种理论和方法
                 英文为 Computer Vision,缩写为 CV,是一门研究如何使机器
计算机视觉          指 “看”的科学,是指用摄影机和电脑代替人眼对目标进行识别、跟
                 踪和测量等
原料数据           指 Raw Data,即未经加工处理的原始数据
                        使用软件工具、录音设备、图像拍摄设备等收集、录制和获取
采集                  指
                        原料数据的过程
                        训练数据的生产步骤之一,指对原料数据进行加工,进而生成
标注                  指
                        符合算法模型训练要求的训练数据的过程
                        千兆字节,是数字信息存储容量的一个单位。它被用来衡量文
GB                  指
                        件、文档和数据存储设备的大小。一个千兆字节是 1024 兆字节
                        太字节,是数字信息存储容量的一个单位。一个太字节是 1024
TB                  指
                        个千兆字节
                      Zettabyte,是数字信息存储容量的一个单位。一个 Zetta 字节是
ZB                  指
                      大规模数据中心、全球数据流量或主要组织或行业的存储需求
                      时使用
                        OpenAI 是一家美国人工智能研究实验室和公司,在人工智能的
OpenAI              指
                        各个领域进行前沿研究
                      是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,
OCR                 指 通过检测暗、亮的模式确定其形状,然后用字符识别方法将形
                      状翻译成计算机文字的过程
                        提示文本,提供模型完成下游任务所需的上下文等信息,以帮
Prompt              指
                        助模型更好地理解任务需求,从而更好地完成下游任务
                      预训练是通过在大规模数据集上进行初始训练,学习通用特征
预训练/Pre-training    指 和表示的机器学习方法。预训练模型可用于后续任务,并在多
                      个领域应用广泛
                        微调,是一种常用于预训练模型的模型优化技术,基于已经训
模型微调/Fine-tune      指
                        练好的预训练模型进行微调,使模型能够更好地适应目标任务
                      奖励模型(Reward Model)是在强化学习中使用的一种关键概
                      念。它定义了在特定任务中,智能体所追求的目标和奖励的方
                      式。奖励模型通过指定在智能体采取行动后,所获得的奖励信
奖励模型/Reward Model   指
                      号来引导智能体的学习和决策过程。奖励模型可以基于任务的
                      目标设定,对智能体的行为进行正向奖励或负向惩罚,从而影
                      响智能体的策略优化和决策选择
                        人工智能计算中心,指为人工智能(AI)开发和应用提供所需
智算中心                指
                        算力服务、数据服务和算法服务的机构
                      图文生成模型,Stability AI 公司(英国一家人工智能企业)于
Stable Diffusion    指 2022 年提出开发的一个深度学习模型,用于从提示信息的自然
                      语言描述中生成图像
注:本预案中所列数据可能因四舍五入原因,而与根据相关单项数据直接相加之和在尾数上略有差
异。
        第一节 本次向特定对象发行股票方案概要
一、发行人基本情况
公司名称:    北京海天瑞声科技股份有限公司
英文名称:    Beijing Haitian Ruisheng Science Technology Ltd.
注册地址:    北京市海淀区成府路28号4-801
法定代表人:   贺琳
总股本:     60,325,180股
成立日期:    2005-05-11
电话号码:    86-10-62660772
传真号码:    86-10-62660892
公司网址:    www.dataoceanai.com
电子信箱:    ir@dataoceanai.com
股票简称:    海天瑞声
股票代码:    688787.SH
股票上市交易所: 上海证券交易所
         技术开发、技术服务、技术咨询、技术转让、技术推广;销售计算机、软件;货
         物进出口、技术进出口;出租办公用房。(市场主体依法自主选择经营项目,开
经营范围:
         展经营活动;依法须经批准的项目,经相关部门批准后依批准的内容开展经营活
         动;不得从事本市产业政策禁止和限制类项目的经营活动。)
二、本次向特定对象发行的背景和目的
(一)本次向特定对象发行的背景
  随着互联网、云计算、物联网以及穿戴设备的发展,数据要素价值不断释放,数字
化转型成为大势所趋。目前,全球主要国家均高度重视发展数字经济,纷纷出台战略规
划,重塑数字时代的国际竞争新格局。人工智能作为数字经济发展的底层核心技术之一,
成为数字经济发展的重要战略抓手。2022 年底 ChatGPT 的出现,掀起又一波人工智能
发展热潮,以无监督学习模式为代表的预训练+人类反馈强化学习所构成的大模型技术
路线的落地意味着人工智能开启发展新范式,基础模型能力通过预训练及基于人类反馈
的强化学习得到不断解锁,以解决海量开放式任务。
  根据艾瑞咨询数据,2022 年中国人工智能产业规模达 1,948 亿元,预计 2027 年市
场规模将达到 6,122 亿元,年复合增长率为 25.6%,主要与智算中心建设以及大模型训
练等需求拉动的 AI 芯片市场、无接触服务需求拉动的智能机器人及对话式 AI 市场等
快速增长相关。
            图:2020-2027 年中国人工智能产业规划(单位:亿元)
数据来源:艾瑞咨询
  人工智能大模型因其良好的通用性、泛化性和迁移性,有助于推动人工智能进入大
规模落地应用,已成为人工智能发展新赛道。同时其强大的理解和生成能力,将驱动人
工智能技术加速与实体产业融合,并深刻改变未来人类的生活和工作方式,发展大模型
技术成为全球各国比拼科技实力,提升经济效率,拉升经济增长的重要动能之一。目前,
国际巨头纷纷布局以大模型为核心的通用人工智能产业,产业进入加速发展期。在这一
信息技术重点领域,我国与国际巨头存在一定差距,正加速布局和应对。国内众多研究
机构、企业积极研究生成式 AI 大模型技术的最优路径,并进行产品发布。近期,在国
内科技及投资各领域的高度关注下,百度、商汤、阿里巴巴、华为、科大讯飞、360、
京东、字节跳动等企业均有所行动。
  我国在“十四五”期间,针对人工智能的未来发展陆续出台了相关指导方案和激励政
策,对人工智能的整体发展方向和技术发展重点做出重要规划,同时提出加强算法创新
与应用、推动算力基础设施建设、完善数据基础支撑体系等关键建议,倡导未来不断夯
实产业发展新基础。全国各地亦陆续出台多项数据政策,其中,《北京市促进通用人工
智能创新发展的若干措施》明确提出要“系统构建大模型等通用人工智能技术体系:开
展大模型创新算法及关键技术研究;加强大模型训练数据采集及治理工具研发;建设大
模型评测开放服务平台;构建大模型基础软硬件体系。推动通用人工智能技术创新场景
应用。”《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025
年)》提出“到 2025 年,人工智能基础理论研究取得突破;关键核心技术基本实现自主
可控,其中部分技术与应用研究达到世界先进水平;人工智能高水平应用深度赋能实体
经济,促进经济高质量发展”的目标,并进一步提出了“自然语言、通用视觉、多模态交
互大模型等形成完整技术栈;生成式产品成为国内市场主流应用和生态平台”等具体目
标。
 正催生更多数据及其服务模式新需求
  在人工智能产业链中,算法、算力和数据共同构成技术发展的三大核心要素。过去
十年,人工智能产业以算法为中心,随着算法趋于开源,数据的重要性愈发凸显。在人
工智能模型从技术理论到应用落地的过程中,需要依赖大量的训练数据,相较于以模型
为中心的训练方法,以海量数据为中心的训练方法能够提升模型推断结论的可靠性。万
亿 GB 量级的数据随着互联网、云计算、物联网、大数据等发展源源不断地产生,但数
据质量参差不齐,对海量的复杂数据进行深入挖掘、输出,进而激活和释放数据的深层
价值也成为数据市场的发展重点。根据德勤数据,2022 年中国人工智能基础数据服务
市场规模为 45 亿元,2027 年规模将达到 130-160 亿元,年复合增长率为 23.6%-28.9%。
          图:2017-2027 年中国人工智能基础数据服务市场规模(单位:亿元)
数据来源:德勤
     随着人工智能进入大模型时代,数据需求和数据服务模式不断提升,数据的质量
以及数据清洗的工程化能力会显著拉开大模型预训练阶段的效果差距;同时,更多模
型或将采用类强化学习模式来进行特定领域或特定方向上的优化迭代,以使得机器能
够以更加接近于人类期望的方式提供答案输出。对于大模型训练而言,不仅需要持续
获取大规模、高质量、多模态、多场景、多垂向的数据,更须具备持续迭代的高质量
数据清洗和标注策略,以不断提升包括预训练(Pre-training)、模型微调(Fine-tune)
及奖励模型(Reward Model)等过程中所需数据(例如提示(Prompt)类数据)的质
量,确保语言类和常识性知识之外的其他垂直领域的应用场景的能力提升,为大模型
精确性、通用性及泛化能力的实现奠定坚实基础。
  在以上背景下,一方面,大规模、高质量数据集重要性凸显,成为模型训练效果
的核心支撑之一。除了在通用基础能力方面需要大量高质量数据训练外,大模型算法
训练的需求正逐渐从通用基础能力建设向垂直领域拓展,数据需求向专业化方向发
展。为加速实现人工智能产业化落地,行业将衍生出更多垂直场景的数据需求,大模
型将通过不断学习各个专业领域的行业高质量数据,实现更广阔的垂直拓展。另一方
面,AI 发展所面对的数据前沿性及工程化技术的挑战也较为凸显。长期看,只有 AI
数据处理技术的不断拓新与发展,才能及时适应甚至超前引领大模型技术和应用的发
展。
  近年来,我国数字经济蓬勃发展,数据要素因具有基础性战略资源和关键性生产要
素的双重属性,相关市场规模持续增长。尤其在《中共中央、国务院关于构建数据基础
制度更好发挥数据要素作用的意见》出台后,我国系统性布局了数据基础制度体系的“四
梁八柱”,加速了数据流通交易和数据要素市场发展,进一步推动了公共数据、企业数
据、个人数据合规高效流通使用。为更好响应中央号召,北京、上海、广州、深圳、杭
州等地数据政策陆续出台,逐步构建了多层次、多元化数据要素市场生态体系。
  以北京为例,《北京市促进通用人工智能创新发展的若干措施》和《关于推进北京
市数据专区建设的指导意见》指出,北京市要加快建设“数据基础制度先行先试示范区”
(以下简称“先行先试示范区”),探索打造数据训练基地,归集高质量基础训练数据集,
推动数据要素高水平开放,提升本市人工智能数据标注库规模和质量,并建设针对重大
领域、重点区域或特定场景建设专题数据区域,吸纳市场主体和数据、技术、资本等多
元要素参与。北京市陆续出台的多项文件旨在打破数据壁垒,推动数据融合利用,加快
推动公共数据开放,促进数据要素流通,激发数字市场创新活力,释放和发展数字化生
产力,打造多层级数据要素市场,成为具有竞争力和影响力的数字产业集群。按照“政
府引导、市场运作、创新引领、安全可控”的原则,“先行先试示范区”有望成为国际领
先的数据要素高效流通核心枢纽。
  我国各行业的数据资源较为丰富,根据艾瑞咨询数据,2015 年-2030 年中国数据量
规模由 3ZB 将增长至 175ZB,预计 2030 年中国数据量约占全球的 28.8%,年复合增长
率约为 31%。
              图:2015-2030 年中国数据量规模及全球占比
数据来源:艾瑞咨询
  虽然中国数据资源丰富,但由于数据挖掘不足,以及大量数据无法在市场上自由流
通等原因,优质中文数据集仍然稀缺。以 ChatGPT 为例,其模型训练数据中,中文数
据来源不足千分之一。目前,国内头部科技企业主要基于公开数据集以及自身特有的数
据进行大模型训练,但由于中文优质数据质量以及数据资源的制约,国内大模型的能力
与以 ChatGPT 为代表的国际大模型相比仍存在一定差距。
  国内缺乏高质量数据集的主要原因包括当前国内数据挖掘和数据治理的力度不足、
资金投入较大;数据流通与数据安全保障措施不够健全;国内市场缺乏开源意识,大量
数据无法在市场上自由流通;国内相关公司成立较晚,数据积累较少;学术领域中文数
据集受重视程度低以及国产数据集市场影响力及普及度较低等。从原始数据到可被应用
的数据集产品,需要经历数据集结构设计、数据获取、数据处理(包括数据清洗、数据
标注/优化等)等过程,以形成可供使用的优质数据集,国内数据服务市场的发展有助
于缓解中文数据集数量不足和质量欠佳等问题。
(二)本次向特定对象发行的目的
探索新型业务
  公司作为全球领先的人工智能训练数据提供商,一直深耕人工智能行业,在基础数
据服务领域居于龙头地位,自成立以来,公司致力于为各类机构提供深度学习算法模型
开发训练所需的专业数据集,所提供训练数据涵盖智能语音、计算机数据、自然语言处
理等多个核心领域。
  为更好实现公司业务扩张战略,公司在保障传统业务稳健发展的同时,不断探索寻
求新的业绩增长点。公司将基于过往海量数据服务经验,结合以大模型发展为代表的行
业前沿需求,研发生产大模型领域专业数据集,丰富公司数据集产品类别,拓展 AI 大
模型训练数据领域服务能力,力争将大模型训练数据等创新业务打造成为具有潜在高增
长价值的新型业务板块。并藉此提升行业内面向大模型训练数据集的类别和质量,实现
基于大模型通用能力和垂直领域数据的支撑和训练学习,协助实现公共数据、社会数据
等各类高价值数据资源汇聚。
实力支撑并提升数据服务综合竞争力
  数据集生产各项技术与能力和一体化技术支撑平台是公司核心技术的重要体现。本
次募集资金投资项目的建设将基于公司在深度学习阶段数据集生产所积累的
know-how,自主研发海天瑞声数据生产垂直大模型,构建大模型数据处理技术通用化
解决方案能力,实现完整、可持续迭代的大模型数据技术框架和数据策略;并以数据生
产垂直大模型为核心,升级海天瑞声一体化技术支撑平台中包括设计、获取、清洗、标
注、安全管理、质控评测等不同的环节的功能,对大模型时代的数据处理需求形成全面
支撑。以上举措均将进一步提高公司在人工智能基础数据服务领域的智能化水平,巩固
公司的核心技术壁垒,形成长期技术实力支撑。
  此外,本项目有助于进一步优化公司的数据处理技术,促进数据资源处理经验的进
一步沉淀,长期来看,可以大幅提高公司的数据处理能力、效率,提升服务范围和水平,
适应人工智能发展的新阶段,获得有效长期的发展动力,进一步巩固和提升公司在数据
服务领域的竞争力。
三、本次向特定对象发行股票的发行对象及其与公司的关系
  本次发行的发行对象为不超过三十五名(含三十五名)符合中国证监会规定条件的
特定投资者,包括符合规定条件的证券投资基金管理公司、证券公司、信托公司、财务
公司、保险机构投资者、合格境外机构投资者以及其他符合相关规定的法人、自然人或
其他合格的投资者等。其中,证券投资基金管理公司、证券公司、合格境外机构投资者、
人民币合格境外机构投资者以其管理的二只以上产品认购的,视为一个发行对象;信托
公司作为发行对象的,只能以自有资金认购。
  最终发行对象将在本次发行申请获得上交所审核通过并由中国证监会作出予以注
册决定后,按照相关法律法规的规定及监管部门要求,由公司董事会或董事会授权人士
在股东大会的授权范围内,与保荐机构(主承销商)根据询价结果协商确定。若国家法
律、法规对向特定对象发行 A 股股票的发行对象有新的规定,公司将按新的规定进行
调整。
  截至本预案出具日,本次向特定对象发行尚无确定的发行对象,因而无法确定发行
对象与公司的关系。发行对象与公司之间的关系将在发行完成后公告的发行情况报告书
中披露。
四、本次向特定对象发行股票方案概要
(一)发行股票的种类和面值
  本次发行的股票种类为境内上市人民币普通股(A 股),每股面值为 1.00 元。
(二)发行方式和发行时间
  本次发行全部采用向特定对象发行 A 股股票的方式进行,公司将在通过股东大会
审议、上交所审核,并经中国证监会作出予以注册决定后的有效期内,选择适当时机向
特定对象发行。
(三)发行对象和认购方式
  本次发行的发行对象为不超过三十五名(含三十五名)符合中国证监会规定条件的
特定投资者,包括符合规定条件的证券投资基金管理公司、证券公司、信托公司、财务
公司、保险机构投资者、合格境外机构投资者以及其他符合相关规定的法人、自然人或
其他合格的投资者等。其中,证券投资基金管理公司、证券公司、合格境外机构投资者、
人民币合格境外机构投资者以其管理的二只以上产品认购的,视为一个发行对象;信托
公司作为发行对象的,只能以自有资金认购。
  最终发行对象将在本次发行申请获得上交所审核通过并由中国证监会作出予以注
册决定后,按照相关法律法规的规定及监管部门要求,由公司董事会或董事会授权人士
在股东大会的授权范围内,与保荐机构(主承销商)根据询价结果协商确定。若国家法
律、法规对向特定对象发行 A 股股票的发行对象有新的规定,公司将按新的规定进行
调整。
  所有发行对象均以人民币现金方式按照同一价格认购本次发行的股票。
(四)定价基准日、定价原则和发行价格
  本次发行采取询价发行方式,定价基准日为发行期首日。
  本次发行价格不低于定价基准日前 20 个交易日(不含定价基准日,下同)公司股
票交易均价的 80%(即“发行底价”)。定价基准日前 20 个交易日公司股票交易均价
=定价基准日前 20 个交易日公司股票交易总额/定价基准日前 20 个交易日公司股票交易
总量。
  若公司股票在定价基准日至发行日期间发生派息、送股、资本公积转增股本等除权
除息事项,本次发行底价将按以下办法作相应调整。调整公式为:
  派发现金股利:P1=P0-D
  送红股或转增股本:P1=P0/(1+N)
  两项同时进行:P1=(P0-D)/(1+N)
  其中,P0 为调整前发行底价,P1 为调整后发行底价,每股派息/现金分红为 D,每
股送红股或转增股本数为 N。
     本次发行的最终发行价格将在公司本次发行申请获得上交所审核通过并经中国证
监会作出予以注册决定后,由董事会或董事会授权人士根据股东大会的授权和保荐机构
(主承销商)根据询价结果协商确定,但不低于前述发行底价。
(五)发行数量
     本次发行的股票数量按照募集资金总额除以发行价格确定,同时本次发行股票数量
不超过本次发行前公司总股本 60,325,180 股的 20%即 12,065,036 股(含本数),最终发
行数量上限以中国证监会予以注册决定要求的发行数量上限为准。在前述范围内,最终
发行数量将在本次发行由中国证监会作出予以注册决定后,由公司董事会或董事会授权
人士根据公司股东大会的授权和发行时的实际情况与本次发行的保荐机构(主承销商)
协商确定。
     在本次发行的董事会决议公告日至发行日期间,若公司发生送红股、资本公积金转
增股本、股权激励、股票回购注销等事项引起公司股份变动,本次发行股票数量的上限
将进行相应调整。
     若国家法律、法规及规范性文件对本次发行的股票数量有新的规定或中国证监会予
以注册的决定要求调整的,则本次发行的股票数量届时相应调整。
(六)限售期
     本次发行的发行对象认购的股份自发行结束之日起 6 个月内不得转让。法律法规、
规范性文件对限售期另有规定的,依其规定。
     本次发行结束后,发行对象取得的本次发行的股份由于公司送红股、资本公积金转
增股本等原因所衍生取得的公司股份,亦应遵守上述限售期安排。限售期结束后发行对
象减持认购的本次发行的股票将按届时有效的中国证监会及上交所的有关规定执行。
(七)募集资金金额和用途
     本次发行股票募集资金总额不超过 78,989.00 万元(含本数),扣除相关发行费用
后将用于投资以下项目:
                                                  单位:万元
序号           项目名称              项目投资总额        拟投入募集资金金额
             合计               78,989.00    78,989.00
注:项目名称最终以主管部门核准或备案名称为准
     在本次发行募集资金到位前,公司将根据募集资金投资项目的实际情况,以自筹资
金先行投入,并在募集资金到位后按照相关法律、法规规定的程序予以置换。募集资金
到位后,若扣除发行费用后的实际募集资金净额少于拟投入募集资金总额,在本次发行
募集资金投资项目范围内,公司将根据实际募集资金数额,按照项目的轻重缓急等情况,
调整并决定募集资金的具体投资项目、优先顺序及各项目的具体投资金额,募集资金不
足部分由公司自筹解决。
     若本次发行募集资金总额因监管政策变化或发行注册文件的要求予以调整的,则届
时将相应调整。
(八)本次发行前滚存未分配利润的安排
     本次发行前公司滚存的未分配利润,由本次向特定对象发行股票完成后的新老股东
按照本次发行后的股份比例共享。
(九)上市地点
     本次发行的股票将在上交所科创板上市。
(十)决议的有效期
     本次发行决议的有效期为自公司股东大会审议通过之日起十二个月。
五、本次发行是否构成关联交易
     截至本预案出具日,本次发行尚未确定具体发行对象,最终是否存在因关联方认购
公司本次向特定对象发行股票构成关联交易的情形,将在发行结束后公告的发行情况报
告书中予以披露。
六、本次发行是否导致公司控制权发生变化
     本次发行前,公司控股股东及实际控制人为贺琳,贺琳直接持有公司 12,137,615 股
股份(占总股本的 20.12%),并通过控制中瑞安间接控制公司 6,935,779 股股份(占总
股本的 11.50%),合计控制公司 31.62%的股份,为公司实际控制人。若假设本次发行
股票数量为发行上限 12,065,036 股,则本次发行完成后(仅考虑本次发行导致的公司股
份数量变化),公司的总股本为 72,390,216 股,贺琳、中瑞安分别占公司股本的 16.77%、
本次发行不会导致公司的控制权发生变化。
七、本次向特定对象发行股票的实施是否可能导致股权分布不具备上
市条件
  本次向特定对象发行股票方案的实施不会导致股权分布不具备上市条件。
八、本次发行方案已经取得有关主管部门批准的情况以及尚需报批的
程序
  本次向特定对象发行股票相关事项已于 2023 年 6 月 21 日经公司第二届董事会第十
七次会议审议通过。尚需履行以下审批:
     第二节 董事会关于本次募集资金使用的可行性分析
一、本次向特定对象发行募集资金的使用计划
     本次发行拟募集资金总额不超过 78,989.00 万元(含本数),扣除相关发行费用后
将用于投资以下项目:
                                                 单位:万元
序号           项目名称             项目投资总额        拟投入募集资金金额
             合计                 78,989.00        78,989.00
注:项目名称最终以主管部门核准或备案名称为准
     在本次发行募集资金到位前,公司将根据募集资金投资项目的实际情况,以自筹资
金先行投入,并在募集资金到位后按照相关法律、法规规定的程序予以置换。募集资金
到位后,若扣除发行费用后的实际募集资金净额少于拟投入募集资金总额,在本次发行
募集资金投资项目范围内,公司将根据实际募集资金数额,按照项目的轻重缓急等情况,
调整并最终决定募集资金的具体投资项目、优先顺序及各项目的具体投资金额,募集资
金不足部分由公司自筹解决。
     若本次发行募集资金总额因监管政策变化或发行注册文件的要求予以调整的,则届
时将相应调整。
二、本次募集资金使用的必要性和可行性分析
(一)项目概况
     本项目的实施主体为北京海天瑞声科技股份有限公司及/或下属子公司。鉴于大模
型训练数据通常具备数据规模大、数据质量高、数据类型丰富等特点,本项目拟建设
AI 大模型训练数据集,即生产用于通用型、及各种垂直领域大模型训练的海量、高品
质数据集。本项目拟购置办公楼作为建设大模型训练数据研发生产基地,并购置数据采
集、数据处理、数据存储和办公等软硬件设备,利用海量、高质量、多样化的公共数据
资源、社会数据资源和稀缺性数据源,通过数据集设计、数据采集/获取、清洗/分类/
标准化、标注/优化、评测等全流程的任务执行进行高质量大模型训练数据集建设。
  本项目将充分利用“先行先试示范区”在基础制度、数据供给等方面的先行先试政
策,采用多元化的方式获取大规模原始数据;利用工程化的数据处理技术进行预训练阶
段的数据清洗;采用人类反馈强化学习模式,基于微调和奖励模型训练的方法,以人类
撰写少量的典型问题和标准答案与深度学习阶段基础性标注相结合的模式,生产出市场
适用性较强的大模型训练数据集。
  本项目建成后,将提供可供大模型训练和评测的不少于 10 个品类的专业数据集,
显著提升行业内面向大模型训练数据集的类别和质量,协助实现公共数据、社会数据
等各类高价值数据资源汇聚,实现基于大模型通用能力和垂直领域数据的训练学习。
本项目的数据集产品具体可分为三大类:
  ①通用及特定垂直领域的大语言模型训练数据集,包括但不限于:
  A、中文大模型预训练语料数据集(含通用场景、特定场景、对话场景、指令集
等);
  B、多语言大模型预训练语料数据集(含通用场景、对话场景、指令集等)。
  ②多模态大模型训练数据集:可应用于多语言图文大模型训练、多模态数字人训
练、多语种语音大模型训练、全场景自动驾驶大模型训练等场景的跨模态数据集。
  ③大模型评测数据集:可应用于大模型的能力、任务、指标等方面的评测。
  本项目建设目标为通过大模型基础研究,研发海天瑞声数据生产垂直大模型,并
以海天瑞声数据生产垂直大模型为核心,升级海天瑞声一体化技术支撑平台。本项目
的实施主体为北京海天瑞声科技股份有限公司及/或下属子公司。
  为应对大模型时代下数据规模量极大、复杂性和多样性高,数据服务规则设计难
度指数级提升等诸多问题,且为更高效高质完成数据规则的规模化生产,公司将采用
全栈自研的数据生产垂直大模型技术,辅助完成面向多个下游任务的数据设计与处理
规则。同时,为更好实现数据生产垂直大模型的生成能力,公司将研发并引入多项新
兴技术,夯实数据生产垂直大模型构建的基础。
  此外,基于大模型的核心能力,项目还将升级海天瑞声一体化技术支撑平台,使
其能够全面拥有大模型范式下的数据服务能力。通过嵌入预训练数据下载工具、预训
练数据清洗工具、指令数据集筛选工具、指令数据集生成与调优工具、大模型评测数
据集评测工具、大模型评测数据集质检工具、多模态数据集生产工具等模块,完成大
模型的数据获取与处理工作,打造模型训练、模型评测的能力。
        图:海天瑞声新一代基于数据生产垂直大模型的数据服务技术架构图
(二)项目实施的必要性和可行性
  (1)项目建设必要性
  ①本项目建设是响应国家建立数据基础制度,落实北京建设“先行先试示范区”的
必然选择
  党的十八大以来,习近平总书记屡次强调建设数字中国以及构建数据要素的重要
性,并明确指出数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。
为进一步推动国家数字经济发展,发挥数据要素在经济发展中的重要价值,我国推出《中
共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》,从顶层设计角
度,在数据产权、流通交易、收益分配、安全治理等方面构建了数据发展的基础制度和
规划纲要,以促进数据合规高效流通使用,充分发挥中国海量数据规模和丰富应用场景
优势,赋能实体经济,激活数据要素的潜能。
  北京市则率先开展国家数据基础制度“先行先试示范区”建设, 2023 年 5 月发布的
《北京市促进通用人工智能创新发展的若干措施》指出,充分发挥政府引导作用和创新
平台催化作用,整合创新资源,加强要素配置,营造创新生态,提升高质量数据要素供
给能力,归集高质量基础训练数据集。公司作为人工智能基础数据服务领域具有较强国
际竞争力的国内头部企业,有义务和责任积极响应北京建设“先行先试示范区”的号召,
通过本项目的实施有效助力数据要素市场培育,推动数字经济创新发展,为北京市加快
建设全球数字经济标杆城市提供助力。
  ②本项目建设是践行国家规范生成式人工智能产品要求的重要举措
  生成式人工智能产品因其复杂性可能带来社会风险、技术伦理风险、企业商业秘密
和个人信息泄露风险、虚假信息风险、知识产权侵权风险及其他潜在风险。为了更好地
促进生成式人工智能技术健康发展和规范应用,国家网信办于 2023 年 4 月出台了《生
成式人工智能服务管理办法(征求意见稿)》,该办法从内容合规、数据来源合法性、
知识产权及商业秘密保护、虚假信息防范等方面,对生成式人工智能产品提出了全方位
的合规要求。该办法明确提出,“提供者应当对生成式人工智能产品的预训练数据、优
化训练数据来源的合法性负责”、“能够保证数据的真实性、准确性、客观性、多样性”、
“生成式人工智能产品研制中采用人工标注时,提供者应当制定符合本办法要求,清晰、
具体、可操作的标注规则,对标注人员进行必要培训,抽样核验标注内容的正确性”、“提
供者应当根据国家网信部门和有关主管部门的要求,提供可以影响用户信任、选择的必
要信息,包括预训练和优化训练数据的来源、规模、类型、质量等描述,人工标注规则,
人工标注数据的规模和类型,基础算法和技术体系等”。
  根据前述规定,数据获取、数据处理的高标准意味着数据获取难度及处理成本将大
幅增加,以预训练阶段为例,由于大量数据来源应合法合规,需投入大量成本完成数据
获取。因此,出于成本与数据集质量的平衡性考量,在大模型训练中,大模型厂商通常
会选择与专业的第三方数据集厂商合作,由专业第三方提供的合规、高质量数据集或相
关解决方案将成为践行国家规范生成式人工智能产品要求的重要举措。
 ③本项目建设是支撑大模型训练,提升大模型输出能力的有效方式
  随着人工智能应用场景日益丰富、产品智能化要求的不断提升,数据需求逐渐向海
量、高质量、多元化方向演进。从自然数据源简单收集、获取的数据资源,通常无法直
接满足大模型的训练需求,需经专业化的数据分类设计、清洗、加工处理,形成相应的
工程化数据,以供大模型训练使用。一般而言,符合大模型训练标准的数据需具备质量
高、规模大、样本丰富等三个特点。首先,海量具有无毒害性、公平性等高质量特征的
数据集能够提高模型效果(例如,精度与可解释性),并且减少收敛到最优解的时间;
其次,在强化学习阶段,原始数据由于存在信息量低、含有噪声或需补齐等问题,使用
前需要进行数据对齐等诸多微调操作,优秀的指令数据集能够帮助大模型更好的泛化适
配更多下游任务。再次,数据丰富程度能够显著提高大模型的泛化能力,减少过拟合情
况的发生,达到更优的模型效果。
     当前国内数据资源虽然丰富,但优质的中文大模型训练数据仍然稀缺,中文大模型
训练数据数量与质量,受国内产业环境、数据积累程度、数据运营生态等因素影响,与
全球领先国家仍存在一定差距,使得国内大模型难以拥有足够专业的数据资源进行训
练。本项目通过提供覆盖预训练、强化学习及应用拓展阶段的海量、高质量专业数据集,
更好的支撑大模型训练,提升大模型输出能力。
     ④本项目建设符合公司“夯实传统业务,探索新型业务”的战略目标
     为更好实现公司业务发展战略,公司在保障人工智能基础数据业务稳健发展的同
时,不断探索寻求新的业绩增长点。如前文所述,数字经济时代下,数据要素市场发展
前景广阔,大模型等人工智能技术已成为国家科技发展的重要抓手,但国内数据仍存在
数据质量差、各领域数据无法流通等问题制约了人工智能行业的发展。公司将基于过往
的数据服务经验,结合行业前沿需求,积极拓展大模型训练数据服务领域,力争将大模
型训练数据等创新业务打造成为具有潜在高增长价值的新型业务板块。
     (2)项目建设可行性
     ①数据要素政策红利持续释放,利好政策支撑数据服务产业发展
     国家高度重视数字经济发展,而数据要素作为数字经济深化发展的核心引擎重要性
更加凸显,多项政策密集出台为本项目的顺利实施提供了政策保障,具体内容如下:
                           表:数据要素相关政策
                           主要行业政策及
序号     发布时间        颁布主体                     相关内容
                            法律法规
                   北京市科              归集高质量基础训练数据集:组织有关机构
                   学技术委              整合、清洗中文预训练数据,形成安全合规
                           人工智能创新发
                   员会、中关             的开放基础训练数据集;持续扩展多模态数
                  村科技园   展的若干措施      据来源,建设高质量的文字、图片、音频、
                  区管理委               视频等大模型预训练语料库。谋划建设数据
                   员会                训练基地:加快建设数据基础制度先行先试
                                     示范区,探索打造数据训练基地,推动数据
                                     要素高水平开放,提升本市人工智能数据标
                                     注库规模和质量。
                                提供者应当对生成式人工智能产品的预训练
                                数据、优化训练数据的真实性、准确性、客
                                观性、多样性负责,并需要提供规定部门要
                  国家互联 《生成式人工智 求的,包括预训练和优化训练数据的来源、
                   公室  (征求意见稿)》 人工标注数据的规模和类型等必要信息。
                                     对于采用人工标注的,应当制定符合本办法
                                     要求,且清晰、具体、可操作的标注规则。
                        《关于构建数据
                                     数据作为新型生产要素,是数字化、网络化、
                  中共中央、 基础制度更好发
                   国务院  挥数据要素作用
                                     据合规高效流通使用。
                          的意见》
                                     从立法层面,加强数字基础设施建设,培育
                  北京市人   《北京市数字经     数据要素市场,规范公共数据的汇聚、清洗、
                  大常委会    济促进条例》     共享、开放、应用和评估管理机制,开展公
                                     共数据专区授权运营。
                                     强化高质量数据要素供给、加快数据要素市
                         《“十四五”数字
                         经济发展规划》
                                     点任务举措
                         《中华人民共和
                         国国民经济和社
                  十三届全
                         会发展第十四个     加强关键数字技术创新应用,建设重点行业
                          五年规划和      人工智能数据集,发展算法推理训练场景。
                  次会议
                           标纲要》
    ②大模型驱动人工智能发展全面提速,新型训练数据服务具备市场空间
    随着人工智能大模型技术的发展,行业对数据的依赖程度逐步加深。本项目产出的
大模型训练数据集拟显著改善大模型训练中,包括预训练数据获取、清洗、强化学习调
优、对齐、应用阶段评测等各个阶段的数据规模与质量问题。该类数据集将有效提升行
业内面向大模型训练数据集的类别和质量,并保障数据来源与处理合法合规,也将发挥
规模化运营的优势,平衡数据集成本与市场效益,实现基于大模型通用能力和垂直领域
数据的支撑和训练学习,协助实现公共数据、社会数据等各类高价值数据资源汇聚。本
项目与公司多年发展中持续运行的商业模式相契合,市场空间广阔,具备可行性。
  ③公司具备较强的数据生产及服务等综合能力,为项目实施奠定基础
  A 公司拥有深度学习的技术储备,为新业务提供技术支撑
  自 2005 年以来,公司始终致力于为 AI 深度学习提供算法模型开发训练所需的专业
数据集,提升模型推断结论的可靠性。公司现已积累较为完备的综合性、一体化数据处
理平台及工具体系,覆盖智能语音、计算机视觉、自然语言等全业态领域,可服务于市
面上绝大多数数据处理需求。截至 2022 年 12 月 31 日,公司已取得 31 项专利和 163
项计算机软件著作权,覆盖平台工具开发、算法研究、产品设计等多方面。此外,公司
还设置了 AI+研发部门,前瞻性挖掘和布局新兴市场需求,抢占市场先机。
  公司现有的深度学习模型数据主要是通过定向采集、精细化标注实现,即通过打标
签的方式将数据类别、位置、性状、结构等信息进行精细化标注,提供给深度学习模型
进行学习。大模型的训练则需要以海量数据为基础,对数据的缺失值、异常值、格式等
进行清洗处理,通过高效的、多元化的、专业的人类反馈不断强化和优化模型训练,提
升大模型与用户交互过程中的反馈质量。公司可将现有业务的技术储备复用到大模型业
务中,将深度学习数据集生产中积累的能力延伸使用至大模型数据集生产。
  B 公司具有丰富的、多领域数据集产品生产经验,为新业务奠定经验基础
  公司的标准化数据集产品是公司区别于众多竞争对手以定制化服务为主的特有商
业模式,在多语种及多音色语音数据集和发音词典、动作捕捉等多模态数据集、以及多
语种 OCR 和手写体数据集等方面积累了丰富的标准化产品资源。截至 2022 年 12 月 31
日,公司拥有智能语音数据集产品储备 927 个、计算机视觉数据集产品储备 125 个、自
然语言数据集产品储备 282 个。经过多年积累,公司已向下游客户提供了累计约 6,000
次/个定制或标准化训练数据集,覆盖个人助手、语音输入、智能家居、智能客服、机
器人、语音导航、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧金融、智
慧交通、智慧城市、机器翻译、智能问答、信息提取、情感分析、OCR 识别等 19 类创
新应用领域,构建出独具特色的训练数据资源及服务能力集群,公司在标准化数据集产
品的能力获得市场认可,并为后续标准化数据产品生产奠定扎实基础。
  C 公司已经服务全球众多科技巨头,为新业务提供客户资源基础
  公司自 2005 年成立以来,始终致力于挖掘行业客户需求,解决客户痛点,通过在
智能语音、计算机视觉、自然语言等领域的技术积累,获得全球众多客户认可,包括阿
里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科
学院、清华大学等全球主流企业、教育科研机构以及政企机构。截至 2022 年底,公司
累计服务客户数量已达到 810 家。公司的存量客户与新业务的客户重合程度较高,且存
量客户群中的部分头部企业已输出或计划输出其大模型产品与服务,为公司该项新业务
拓展提供了客户资源基础。
  D 公司历来重视数据安全及合规体系能力建设,为新业务提供合规保障
  公司一直以来非常重视数据安全能力及合规体系建设,数据安全管理工作获得市场
认可。资质方面,公司拥有 ISO27001 信息安全管理体系认证、ISO27701 隐私信息管理
体系认证、国家信息安全等级保护三级认证、北京市规划和自然资源委员会行政许可乙
级测绘资质等。行业参与方面,公司入选中共中央网络安全和信息化委员会办公室“人
工智能企业典型应用案例”,成为中国信通院数据安全推进计划成员单位,董事兼副总
经理李科入选该计划数安智库专家,发表《AI 训练数据安全管理实践》等文章,为人
工智能领域数据安全管理建言献策,并荣获数安智库 2022 年度优秀专家称号;公司根
据实践经验总结、撰写的《人工智能基础数据业务之个人信息收集活动的合规审计》案
例获选中国信通院、中国内审协会“全国首届数字化审计论坛”评选的“个人信息保护合
规审计先锋实践案例”。
  公司一直坚持安全与发展并重的原则,持续进行数据安全合规能力建设,建立了较
强的数据合规体系并积累了丰富的数据合规实践经验,为大模型开展合规训练提供合规
保障。
  ④公司实施本项目在经济效益和社会效益上具备可行性
  基于谨慎测算,本项目内部收益率高于社会基准折现率,说明项目的经济效益较好,
盈利能力较强。本项目生产的产品属于国家鼓励的行业发展方向,能够带动产业链上下
游各企业协同发展,具备社会效益。
  综上,从经济效益和社会效益分析来看,该项目具备较强可行性。
  (1)项目建设必要性
  ①本项目建设是落实国家科技创新发展战略的重要举措
  人工智能是战略性新兴产业的重要组成部分,对我国经济发展和提升国家战略安全
具有重要意义。在世界政治经济格局加速重构的影响下,未来逆全球化趋势仍将延续。
全球产业合作格局重构、国际分工体系全面调整,关键环节的国际竞争将加剧,我国在
关键核心技术上的问题愈发突出,战略性新兴产业的产业链安全稳定存在潜在隐患。因
此,我国需要进一步集中优势资源,在重点领域加快突破一批关键核心技术,助力提升
我国新兴产业的产业链关键环节、关键领域、关键产品的安全保障能力,保障国家战略
安全。
  公司是我国人工智能数据服务领域的龙头提供商,本项目以研发数据生产垂直大模
型为核心,并基于该生产垂直大模型对数据集生产的强大支撑能力,升级海天瑞声一体
化技术支撑平台,持续以自主可控的技术与平台为我国人工智能技术与产业发展提供支
撑。本项目的建设是公司落实国家科技创新发展战略的重要举措。
  ②本项目建设是巩固公司的核心技术壁垒,构建长期技术实力支撑的必然手段
  随着人工智能从深度学习阶段走向大模型阶段,对训练数据服务产生了新的需求,
具体可分为预训练阶段和强化学习阶段:在预训练阶段,模型所需的数据量巨大;在强
化学习阶段,模型所需的数据质量较高,并需要以相关领域 know-how 作为模型输入。
此外,随着多模态大模型的不断发展,跨语音、文本和视频图像数据等多种类别的数据
集需求将快速增加。
  数据集生产能力和一体化技术支撑平台是公司核心技术的重要体现。目前 ChatGPT
等模型执行通用生成任务的效果证明了大模型可具备数据生成能力。本项目的建设将基
于公司在深度学习阶段数据集生产所积累的 know-how,自主研发数据生产垂直大模型,
构建大模型数据处理技术通用化解决方案能力,实现完整、可持续迭代的大模型数据技
术框架和数据策略,进一步提高公司在人工智能基础数据服务领域的智能化水平,巩固
公司的核心技术壁垒,形成长期技术实力支撑。
     ③本项目建设是优化公司数据集生产流程,提升数据服务综合竞争力的有力途径
  大模型训练数据集的生产流程包括设计、获取(模型生成)、清洗、标注、安全管
理、质控评测等不同的环节。系统化的开发平台和专业化的软件处理工具对应对大模型
时代的数据处理需求和全流程支撑至关重要。本项目有助于进一步优化公司的数据处理
技术,促进数据资源处理经验的进一步沉淀,长期来看,可以大幅提高公司的数据处理
能力、效率,提升服务范围和水平,适应人工智能发展的新阶段,获得有效长期的发展
动力,进一步巩固和提升公司在数据服务领域的竞争力。
     (2)项目建设可行性
     ①本项目建设符合政策要求和行业发展趋势
(征求意见稿)》,文件明确指出,“国家支持人工智能算法、框架等基础技术的自主
创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源”,
“用于生成式人工智能产品的预训练、优化训练数据,应满足法律法规要求、不侵权、
同时保证数据真实性、准确性、客观性、多样性等若干要求。”该办法从政策层面对生
成式人工智能的数据集提出了明确的合法、合规、合理、准确以及知识产权清晰的高要
求。
  但目前国内大模型的发展普遍存在数据来源不均衡、数据更新实时性弱、垂直类型
数据不足、指令集质量欠佳且存在偏见等问题,由此导致大模型的效果、效率、合规性、
合理性等方面亟待完善与提升,且在大模型持续发展过程中,部分问题的影响可能持续
扩大。因此,建立一套完整、完善、可持续迭代的大模型训练数据技术框架和数据策略,
符合生成式人工智能技术与应用合规、高效发展的趋势。
     ②公司与现有客户、科研院所联系紧密,可确保项目技术框架明确、技术路线可
行有效
  公司自 2005 年成立以来,始终致力于挖掘行业客户需求,解决客户痛点,通过在
智能语音、计算机视觉、自然语言等领域的技术积累,获得全球众多客户认可,截至
度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科学院、清华大学等
全球主流企业、教育科研机构以及政企机构。
  公司部分现有客户是当前大模型领域的积极实践者,通过与客户的长期合作,深度
交流,能够第一时间获取大模型研发中数据痛点与需求,并可在持续交流反馈中不断修
正本项目的建设方案。此外,公司也与科研院所和高校等开展深入合作,可引入外部专
家资源,以保证技术路线的可行性。
  ③公司拥有深厚的技术和人才储备,具有完成本项目的技术基础
  公司深耕行业近 20 年,拥有一支高素质的研发团队,公司高管及核心研发人员大
多毕业于清华、北大、复旦等一流院校,大部分曾在微软、阿里巴巴、英特尔、IBM、
中科院等业内领先的成熟企业与研究机构担任人工智能领域技术研发与管理的领导职
务。截至 2022 年 12 月 31 日,公司研发人员达到 82 人,经验丰富的技术团队为本项目
的执行提供了人才保证。
  截至 2022 年底,公司拥有算法模型框架 16 个、算法模型数量超过 200 个,公司自
然语言理解算法支持包括语义理解、情感分析和意图识别等能力,语音识别算法支持语
种 58 个,计算机视觉算法支持几十大类、上百小类的物体识别。公司在智能语音、自
然语言、计算机视觉领域均有多年算法积累,该等算法模型能够全面支撑公司多个领域
数据生产活动的开展。
三、募集资金投资项目涉及报批事项情况
  目前,公司正在办理本项目立项备案相关手续,尚未取得相关批复文件。
  本项目不同于常规生产性项目,不存在废气、废水、废渣等工业污染物,不属于根
据《中华人民共和国环境影响评价法》和《建设项目环境影响评价分类管理名录》等相
关法律法规需要进行环境影响评价的建设项目。因此,本项目无需进行项目环境影响评
价,亦不需要取得环保主管部门对项目的审批文件。
四、本次发行对公司经营管理、财务状况等的影响
(一)本次向特定对象发行股票对公司经营管理的影响
  本次向特定对象发行募集资金扣除发行费用后,拟投资于“AI 大模型训练数据集建
设项目”和“数据生产垂直大模型研发项目”。“AI 大模型训练数据集建设项目”通过建设
应用于通用和特定垂直领域的 AI 大模型训练数据集提升行业内面向大模型训练数据集
的类别和质量,“数据生产垂直大模型研发项目”以研发海天瑞声数据生产垂直大模型为
核心升级公司一体化技术支撑平台。本次募集资金投资项目是公司在现有主营业务基础
上,结合市场需求和未来发展趋势,加大对公司核心主业重点产品及重要研究方向投资
力度的体现,符合国家大力支持人工智能发展的产业政策以及公司整体战略发展方向,
项目实施可以巩固和发展公司在行业中的竞争优势,具有良好的市场发展前景和经济效
益,符合公司长期发展需求及股东利益。
(二)本次向特定对象发行股票对公司财务状况的影响
  本次向特定对象发行完成后,公司的资本实力进一步增强。公司的总资产和净资产
规模均会有所增长,营运资金得到进一步充实。同时,公司资产负债率将相应下降,公
司的资产结构将得到优化,有利于增强公司的偿债能力,提高公司抵御财务风险的能力。
同时,公司的总股本也有所增加,且本次募投项目存在一定的建设周期,因此在项目实
现效益前,公司净资产收益率、每股收益等财务指标可能存在一定程度的摊薄。从中长
期来看,随着本次募投项目的顺利实施以及募集资金的有效使用,项目效益的逐步释放
将提升公司运营规模和经济效益,从而为公司和股东带来更好的投资回报并促进公司健
康发展。
五、本次募集资金投属于科技创新领域的主营业务说明
(一)本次募集资金投向符合国家产业政策,主要投向科技创新领域
  公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、
组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业
数据集,通过软件形式向客户交付。本次募集资金总额全部用于AI大模型训练数据集生
产和数据生产垂直大模型的研发,系围绕公司主营业务展开。根据国家统计局《战略性
新兴产业分类(2018)》,公司所从事的训练数据生产业务属于“新一代信息技术产业
—新兴软件和新型信息技术服务—新型信息技术服务—信息处理和存储支持服务—数
据加工处理服务”行业,是国家重点支持的“新一代信息技术领域”的战略性新兴产
业。因此,本次募集资金投资项目投向属于科技创新领域。
(二)本次募集资金投资项目将进一步提升公司科技创新水平
  在人工智能产业进入以大模型为代表的新的发展时期,通过本次募投项目的实施,
公司将建设一批适用性较强的大模型训练数据集,拓展潜在高增长价值的新型业务板
块,并藉此进一步扩大公司业务规模;同时,以研发海天瑞声数据生产垂直大模型为核
心,升级海天瑞声一体化技术支撑平台,研发并引入多项新兴技术,促进公司科技创新
水平的不断提升,巩固公司的核心技术壁垒,构建长期技术实力支撑,从而进一步增强
公司核心竞争力。
 第三节 董事会关于本次发行对公司影响的讨论与分析
一、本次发行后公司业务及资产、公司章程、股东结构、高管人员结
构、业务结构的变动情况
(一)本次发行对公司业务及资产的影响
  公司是一家从事 AI 训练数据的研发设计、生产及销售业务的公司,始终致力于为
AI 产业链上的各类机构提供算法模型开发训练所需的专业数据集。公司通过设计数据
集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供 AI 算法模型训练
使用的专业数据集,通过软件形式向客户交付。经过多年发展,海天瑞声已成为人工智
能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标准化产品、定制
化服务、相关应用服务全覆盖。公司所提供的训练数据涵盖智能语音(语音识别、语音
合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能家居、
智能驾驶、智慧金融、智能安防等多种创新应用场景。
  本次向特定对象发行股票募集资金投资项目扣除相关发行费用后将用于 AI 大模型
训练数据集建设项目及数据生产垂直大模型研发项目,符合公司的业务发展方向和战略
布局。其中“AI 大模型训练数据集建设项目”通过建设应用于通用和特定垂直领域的
AI 大模型训练数据集提升行业内面向大模型训练数据集的类别和质量,“数据生产垂
直大模型研发项目”以研发海天瑞声数据生产垂直大模型为核心升级公司一体化技术
支撑平台。本次募集资金投资项目是公司在现有主营业务基础上,结合市场需求和未来
发展趋势,加大对公司核心主业重点产品及重要研究方向投资力度的体现,项目实施可
以巩固和发展公司在行业中的竞争优势。本次发行完成后,公司的主营业务范围不会发
生重大变化,不存在因本次发行而导致的业务及资产整合。
(二)本次发行对公司章程的影响
  本次发行完成后,公司注册资本、股本总额将相应增加,公司将依法根据发行情况
对《公司章程》中有关公司股本等相关条款进行相应调整,并办理工商变更登记。
(三)本次发行对股东结构的影响
  本次发行前,公司控股股东及实际控制人为贺琳,贺琳直接持有公司 12,137,615
股股份(占总股本的 20.12%),并通过控制中瑞安间接控制公司 6,935,779 股股份(占
总股本的 11.50%),合计控制公司 31.62%的股份,为公司实际控制人。
  若假设本次发行股票数量为发行上限 12,065,036 股,则本次发行完成后(仅考虑本
次发行导致的公司股份数量变化),公司的总股本为 72,390,216 股,贺琳、中瑞安分别
占公司股本的 16.77%、9.58%,贺琳合计控制公司 26.35%的股份,仍为公司的控股股
东、实际控制人。因此,本次发行不会导致公司的控制权发生变化。
(四)本次发行对高管人员结构的影响
  本次发行不涉及公司高级管理人员结构的重大变动情况。
  截至本预案出具日,公司尚无对高级管理人员结构进行调整的计划。若公司拟调整
高级管理人员结构,将根据有关规定,履行必要的法律程序和信息披露义务。
(五)本次发行对业务结构的影响
   本次向特定对象发行股票的募集资金投资的项目围绕公司主营业务开展,系对公
司主营业务的拓展和完善,是公司完善产业布局的重要举措。本次发行完成后公司的
业务结构不会发生重大变化。
二、本次发行完成后公司财务状况、盈利能力及现金流量的变动情况
(一)对财务状况的影响
  本次发行完成后,公司的资本实力将进一步增强,总资产和净资产规模均有所增长,
资产负债率将有所下降,营运资金得到进一步充实,有助于优化公司资产负债结构,提
高公司抵御财务风险的能力,为公司后续发展提供良好保障。
(二)对盈利能力的影响
  本次发行完成后,公司总股本将有所增加,由于募集资金投资项目从实施到经营效
益完全释放需要一定时间,存在每股收益等指标在短期内被摊薄的风险。为保障中小投
资者的利益,公司就本次向特定对象发行事项对即期回报摊薄的影响进行了认真分析,
并制定填补被摊薄即期回报的具体措施。相关情况详见《海天瑞声关于 2023 年度向特
定对象发行 A 股股票摊薄即期回报与填补措施及相关主体承诺的公告》。
  本次募集资金是公司在现有主营业务基础上,结合市场需求和未来发展趋势,加大
对公司核心主业重点产品及重要研究方向投资力度的体现,符合国家大力支持人工智能
发展的产业政策以及公司整体战略发展方向,项目实施可以巩固和发展公司在行业中的
竞争优势,具有良好的市场发展前景和经济效益,符合公司长期发展需求及股东利益。
从长远来看,公司的盈利能力有望进一步增强。
(三)对现金流量的影响
  本次发行完成后,随着募集资金的到位,公司筹资活动现金流入将有所增加,公司
资本实力显著增厚,抗风险能力显著增强,为实现可持续发展奠定基础。
三、上市公司与控股股东及其关联人之间的业务关系、管理关系、关
联交易及同业竞争等变化情况
  本次发行前后,公司控股股东、实际控制人均为贺琳,本次向特定对象发行不会导
致上市公司与控股股东、实际控制人贺琳及其关联人之间的业务关系、管理关系、关联
交易及同业竞争等发生变化。
四、本次发行完成后,公司是否存在资金、资产被控股股东及其关联
人占用的情形,或公司为控股股东及其关联人提供担保的情形
  截至本预案公告日,公司不存在资金、资产被控股股东、实际控制人贺琳及其关联
人占用的情形,也不存在为贺琳及其关联人提供担保的情形。
  公司不会因为本次向特定对象发行股票产生资金、资产被控股股东、实际控制人及
其关联人占用的情形,也不会产生为控股股东、实际控制人及其关联人提供担保的情形。
五、本次发行对上市公司负债结构的影响
  截至 2023 年 3 月 31 日,公司合并报表资产负债率为 3.58%,流动比率为 19.06
倍。公司不存在通过本次发行大量增加负债(包括或有负债)的情况。本次发行将提升
公司的资产规模,优化公司资本结构,进一步加强经营抗风险能力。
六、本次股票发行相关的风险说明
  投资者在评价本次向特定对象发行股票时,除本预案提供的其它各项资料外,应特
别注意以下风险:
(一)业绩下滑或亏损风险
长,但同期公司为更好建设长期技术优势和独具特色的标准化产品模式壁垒持续加大研
发投入,且在 2022 年完成管理架构及激励体系升级、全球化营销体系建设等重要事项,
以上因素共同导致公司人工投入及期间费用出现明显增长,使得公司净利润出现一定比
例下滑。2023 年,受宏观经济增速放缓,市场竞争格局加剧以及数据相关法律法规实
施等多重因素影响,公司部分业务进度或将放缓。如果公司收入增长无法覆盖持续加大
的人工投入及期间费用支出,公司业绩存在下滑或亏损的风险。
(二)市场竞争加剧的风险
  公司所在的细分领域为 AI 基础数据服务领域。近年来,参与该行业的公司不断增
多,由于整体行业较新,行业标准和法律监管仍处于规范阶段,因此整体行业目前处于
高速发展且格局未定的状态,导致市场竞争加剧。公司如果不能持续有效地制定并实施
业务发展规划,则将受到竞争者的挑战,从而面临市场竞争加剧而导致的经营状况下滑、
市场地位下降和可能失去主要客户的风险,进而影响公司的盈利能力和发展潜力。
(三)核心技术快速迭代的风险
  由于人工智能行业整体发展较为迅速,应用领域和应用场景不断拓展,下游需求随
着行业发展不断发生变化,公司进行数据开发所需的各项技术也面临着快速迭代更新的
风险。如果公司无法保持对行业发展趋势的洞察能力以及对研发人才的有效组织和研发
经费的经济投入,则可能导致公司在行业技术快速迭代过程中无法持续保持技术先进性
和技术优势,进而对公司的客户拓展、产品创新和经营业绩造成不利影响。
(四)核心技术人员流失风险
  随着行业的持续发展,行业内企业之间对于高端人才的竞争日益激烈,如果公司无
法持续加强核心技术人员的培养及引进并为核心技术人员提供有竞争力的激励机制和
薪资待遇,则将存在核心技术人员流失的风险,公司的技术水平、研发能力也将受到不
利影响。
(五)训练数据标准化产品无法实现授权销售的风险
  公司根据对算法模型应用领域、行业发展趋势、市场需求等的评估和研判,自行设
计并开发多种训练数据集标准化产品,开发完成后根据客户实际需求进行销售,授权给
客户使用。在该种业务类型下,公司开发训练数据集产品,承担开发费用,并拥有训练
数据集产品的知识产权。如果公司开发的训练数据集产品不能满足下游客户对训练数据
的要求,则可能存在无法实现授权销售的风险,进而对公司未来的经营业绩产生不利影
响。
(六)数据安全相关风险
  公司主要从事训练数据的研发设计、生产及销售业务,所提供的产品和服务主要以
数据的形式体现。一方面,随着公司业务的快速发展和规模的持续扩张,原料数据采集
与数据加工的数量持续增长;另外一方面,包括《数据安全法》、《个人信息保护法》
等在内的与数据安全、个人信息保护相关的法律规章体系逐步完善,《数据出境安全评
估办法》等法律法规也加强了对数据跨境行为的规制。如果将来公司未能根据法律规章
的更新要求及时调整现行业务开展方式、公司的数据安全管理体系研发升级未能跟上业
务发展的需要、或客户未能遵守训练数据产品保护相关商业约定,则公司可能面临生产
经营不符合法律规章的要求、训练数据产品被泄露、盗版等数据安全相关风险或可能产
生诉讼纠纷,进而给公司的经营带来不利影响。
(七)募集资金投资项目相关风险
  公司本次募集资金将用于 AI 大模型训练数据集建设项目,该项目实施及未来商业
化应用前景存在一定的不确定性,且公司对募投项目的效益测算系基于历史数据和未来
公司及行业的发展趋势所做出的,但在募投项目的实施过程中,公司将可能面临着宏观
经济及市场环境变化、下游需求放缓、市场竞争加剧、技术迭代更新等不确定或不可控
因素的影响,募投项目有可能存在技术实施难度大、市场推广难、产品收益不及预期等
情况,本次募集资金投资项目存在不能完全实现预期目标或效益的风险。
  本次募投项目实施后公司的固定资产规模将增长较大,每年也将随之新增较多的固
定资产折旧费用。如果市场情况发生重大不利变化,募投项目无法如期推进或不能产生
预期收益,则公司可能存在因固定资产折旧、摊销费用大幅增加而导致利润下滑的风险。
  本次向特定对象发行股票完成后,公司总股本和净资产将有所增加,而募集资金的
使用和实施需要一定的时间。根据本预案“第五节本次向特定对象发行股票摊薄即期回
报对公司主要财务指标的影响及公司采取的措施”所测算,本次向特定对象发行股票后
预计会面临公司每股收益被摊薄的风险。
(八)与本次发行有关的风险
  本次向特定对象发行股票方案尚需公司股东大会审议通过、上交所审核通过并经中
国证监会作出同意注册决定后方可实施。该等审批事项的结果及最终取得批准时间均存
在不确定性。同时,本次向特定对象发行股票的发行对象为不超过三十五名(含三十五
名)特定投资者。投资者的认购意向以及认购能力受到证券市场整体情况、公司股票价
格走势、投资者对本次发行方案的认可程度以及市场资金面情况等多种内、外部因素的
影响,可能面临募集资金不足乃至发行失败。
  股票价格不仅取决于公司的经营状况,同时也受国家的经济政策、经济周期、股票
市场的供求状况、重大自然灾害的发生、投资者心理预期等多种因素的影响。因此,公
司的股票价格存在若干不确定性,并可能因上述风险因素出现波动,直接或间接地给投
资者带来投资收益的不确定性。
       第四节 公司利润分配政策及执行情况
一、公司利润分配政策
  公司现行有效的《公司章程》对利润分配政策规定如下:
  从公司盈利情况和战略发展的实际需要出发,公司实行持续、稳定的利润分配政策,
公司利润分配应重视对投资者的合理、稳定投资回报并兼顾公司的可持续发展。利润分
配不得超过累计可分配利润的范围,不得损害公司持续经营能力。
  公司可以采取现金、股票或现金和股票相结合的方式分配股利。公司优先选择现金
分红的利润分配方式。公司具备现金分红条件的,应当采用现金分红进行利润分配。
  公司当年度实现盈利且累计可供分配利润为正值,若公司无重大投资或重大支出事
项(指金额占公司最近一期经审计净资产的 10%以上,且绝对金额超过 500 万元),
公司每年以现金方式分配的利润不少于当年实现的可分配利润的 10%。
  同时公司实施差异化的现金分红政策
  (1)公司发展阶段属成熟期且无重大资金支出安排的,进行利润分配时,现金分红
在本次利润分配中所占比例最低应达到 80%;
  (2)公司发展阶段属成熟期且有重大资金支出安排的,进行利润分配时,现金分红
在本次利润分配中所占比例最低应达到 40%;
  (3)公司发展阶段属成长期且有重大资金支出安排的,进行利润分配时,现金分红
在本次利润分配中所占比例最低应达到 20%;
  公司发展阶段不易区分但有重大资金支出安排的,可以按照前项规定处理。
  董事会每年综合考虑公司所处行业特点、发展阶段、自身经营模式、盈利水平以及
是否有重大资金支出安排等因素,根据上述原则提出当年的利润分配方案。
  在满足上述现金分配股利之余,在保证公司股本规模和股权结构合理的前提下,基
于回报投资者和分享企业价值的考虑,从公司成长性、每股净资产的摊薄、公司股本规
模和公司股票价格的匹配性等真实合理因素出发,当公司股票估值处于合理范围内,公
司可以提出并实施股票股利分配方案。
  公司符合本章程规定的条件,每年度进行利润分配,也可以根据盈利状况进行中期
利润分配,每年度至少进行一次现金分红。
润分配方案应履行的审议程序具体如下
  在公司实现盈利符合利润分配条件时,公司董事会应当根据公司的具体经营情况和
市场环境,认真研究和论证公司现金分红的时机、条件和最低比例、调整的条件及其决
策程序要求等事宜,制订中期利润分配方案(拟进行中期分配的情况下)、年度利润分
配方案,利润分配方案中应说明当年未分配利润的使用计划。利润分配方案需经全体董
事过半数通过。
  独立董事应当对董事会制订的利润分配方案进行审核并发表明确意见,并经全体独
立董事三分之二以上审核同意。独立董事可以征集中小股东的意见,提出分红提案,并
直接提交董事会审议。
  监事会应当对董事会制订的利润分配方案进行审核并发表审核意见,并经全体监事
过半数通过;如公司有外部监事(不在公司任职的监事),则外部监事应对监事会审核
意见无异议。
  董事会、监事会审议通过利润分配方案后应提交股东大会审议批准。现金股利分配
方案,提交股东大会审议时需经出席股东大会会议的股东(包括股东代理人) 所持表
决权的过半数通过;涉及股票股利分配方案的,提交股东大会审议时需经出席股东大会
会议的股东(包括股东代理人)所持表决权的三分之二以上通过。
  股东大会对现金分红具体方案进行审议前,公司应当通过接听投资者电话、公司公
共邮箱、网络平台、召开投资者见面会等多种渠道主动与股东特别是中小股东 进行沟
通交流,充分听取中小股东的意见和诉求,及时答复中小股东关心的问题。
二、公司最近三年利润分配及未分配利润使用情况
(一)最近三年利润分配方案
    公司于 2021 年度上市,2020 年度未进行利润分配。
配方案如下:以截至 2021 年 12 月 31 日,公司的总股本 42,800,000 股为基数,拟向全
体股东每 10 股派发现金红利 2.50 元(含税),以此计算合计拟派发现金红利
上述利润分配方案通过公司 2021 年年度股东大会审议批准,并于 2022 年 6 月实施完毕。
分配方案如下:(1)以实施权益分派股权登记日登记的总股本为基数,公司拟向全体
股东每 10 股派发现金红利 6.00 元(含税),截至 2022 年年度权益分派实施的股权登
记日,因 2022 年限制性股票激励计划首次授予部分第一个归属期完成归属,新增股份
此计算合计拟派发现金红利 25,853,648.40 元(含税)。(2)公司拟以资本公积向全体
股东每 10 股转增 4 股,按照总股本 43,089,414 股计算合计拟转增 17,235,766 股,转增
后公司的总股本增加至 60,325,180 股。2023 年 5 月 25 日,上述利润分配方案通过公司
(二)公司最近三年现金分红情况
  公司最近三年现金分红情况如下表所示,分红情况均符合法律法规及《公司章程》
的有关规定。
                                                       单位:元/%
                               合并报表中归属于母公司 现金分红占合并报表归属于
   年度      现金分红(含税)
                                  的净利润       母公司净利润的比率
           最近三年累计现金分红金额                               36,553,648.40
        最近三年年均合并报表归属于母公司的净利润                          47,713,530.98
最近三年累计现金分红金额占最近三年合并报表中归属于母公司年
           均净利润的比例
三、公司最近三年未分配利润使用安排情况
  最近三年,公司滚存未分配利润主要用于公司经营,以满足公司各项业务拓展的资
金需求。
四、公司未来三年(2023-2025 年)股东回报规划
  根据《公司法》《上市公司监管指引第 3 号——上市公司现金分红(2022 年修订)》
(中国证监会公告[2022]3 号)、《关于进一步落实上市公司现金分红有关事项的通知》
(证监发[2012]37 号)及《公司章程》的有关规定,为健全公司利润分配事项的决策程
序和机制,增加股利分配决策透明度和可操作性,积极回报投资者,公司在兼顾公司持
续发展的基础上,制定了公司《未来三年(2023 年-2025 年)股东分红回报规划》,并
经第二届董事会第十七次会议审议通过。公司未来三年(2023 年-2025 年)股东回报规
划主要内容如下:
(一)股东分红回报规划制定考虑因素
  公司着眼于公司的长远和可持续发展,在综合分析公司经营发展实际、股东要求和
意愿、社会资金成本、外部融资环境等因素,征求和听取股东尤其是中小股东的要求和
意愿,充分考虑公司目前及未来盈利规模、现金流量状况、发展所处阶段、项目投资资
金需求、本次发行融资、银行信贷及债权融资环境等因素,平衡股东的短期利益和长期
利益的基础上制定股东分红回报规划,建立对投资者持续、稳定、科学的回报规划与机
制,对股利分配做出制度性安排,并藉此保持公司利润分配政策的连续性和稳定性。
(二)股东分红回报规划制定原则
政策,公司利润分配应重视对投资者的合理、稳定投资回报并兼顾公司的可持续发展。
利润分配不得超过累计可分配利润的范围,不得损害公司持续经营能力;
方式;
情况及资金需求情况可以进行中期分红。
(三)股东分红回报规划制定周期和相关决策机制
  公司董事会应根据股东大会制定或调整的利润分配政策,至少每三年重新审阅一次
《股东分红回报规划》,根据股东(特别是公众投资者)、独立董事、监事的意见对公
司正在实施的股利分配政策作出适当且必要的修改,确定该时段的股东分红回报规划,
并确保调整后的股东分红回报规划不违反利润分配政策的有关规定。
  董事会制定的股东分红回报规划应经全体董事过半数并经全体独立董事三分之二
以上同意后提交股东大会并经出席股东大会的股东所持表决权的三分之二以上审议通
过。股东分红回报规划也应经全体监事过半数审议通过。
(四)公司未来三年(2023 年-2025 年)股东分红回报具体规划
  从公司盈利情况和战略发展的实际需要出发,公司实行持续、稳定的利润分配政策,
公司利润分配应重视对投资者的合理、稳定投资回报并兼顾公司的可持续发展。利润分
配不得超过累计可分配利润的范围,不得损害公司持续经营能力。
  公司可以采取现金、股票或现金和股票相结合的方式分配股利。公司优先选择现金
分红的利润分配方式。公司具备现金分红条件的,应当采用现金分红进行利润分配。
  公司当年度实现盈利且累计可供分配利润为正值,若公司无重大投资或重大支出事
项(指金额占公司最近一期经审计净资产的 10%以上,且绝对金额超过 500 万元),
公司每年以现金方式分配的利润不少于当年实现的可分配利润的 10%。
  同时公司实施差异化的现金分红政策:
  (1)公司发展阶段属成熟期且无重大资金支出安排的,进行利润分配时,现金分
红在本次利润分配中所占比例最低应达到 80%;
  (2)公司发展阶段属成熟期且有重大资金支出安排的,进行利润分配时,现金分
红在本次利润分配中所占比例最低应达到 40%;
  (3)公司发展阶段属成长期且有重大资金支出安排的,进行利润分配时,现金分
红在本次利润分配中所占比例最低应达到 20%。
  公司发展阶段不易区分但有重大资金支出安排的,可以按照前项规定处理。董事会
每年综合考虑公司所处行业特点、发展阶段、自身经营模式、盈利水平以及是否有重大
资金支出安排等因素,根据上述原则提出当年的利润分配方案。
  在满足上述现金分配股利之余,在保证公司股本规模和股权结构合理的前提下,基
于回报投资者和分享企业价值的考虑,从公司成长性、每股净资产的摊薄、公司股本规
模和公司股票价格的匹配性等真实合理因素出发,当公司股票估值处于合理范围内,公
司可以提出并实施股票股利分配方案。
  公司符合公司章程规定的条件,每年度进行利润分配,也可以根据盈利状况进行中
期利润分配,每年度至少进行一次现金分红。
  在公司实现盈利符合利润分配条件时,公司董事会应当根据公司的具体经营情况和
市场环境,认真研究和论证公司现金分红的时机、条件和最低比例、调整的条件及其决
策程序要求等事宜,制订中期利润分配方案(拟进行中期分配的情况下)、年度利润分
配方案,利润分配方案中应说明当年未分配利润的使用计划。利润分配方案需经全体董
事过半数通过。
  独立董事应当对董事会制订的利润分配方案进行审核并发表明确意见,并经全体独
立董事三分之二以上审核同意。独立董事可以征集中小股东的意见,提出分红提案,并
直接提交董事会审议。
  监事会应当对董事会制订的利润分配方案进行审核并发表审核意见,并经全体监事
过半数通过;如公司有外部监事(不在公司任职的监事),则外部监事应对监事会审核
意见无异议。
  董事会、监事会审议通过利润分配方案后应提交股东大会审议批准。现金股利分配
方案,提交股东大会审议时需经出席股东大会会议的股东(包括股东代理人)所持表决
权的过半数通过;涉及股票股利分配方案的,提交股东大会审议时需经出席股东大会会
议的股东(包括股东代理人)所持表决权的三分之二以上通过。
  股东大会对现金分红具体方案进行审议前,公司应当通过接听投资者电话、公司公
共邮箱、网络平台、召开投资者见面会等多种渠道主动与股东特别是中小股东进行沟通
交流,充分听取中小股东的意见和诉求,及时答复中小股东关心的问题。
  (1)公司调整利润分配政策时,应以股东权益保护为出发点,由董事会详细论证
和说明原因,并充分听取独立董事、监事和中小股东的意见。当公司遇到战争、自然灾
害等不可抗力、外部经营环境变化对公司生产经营造成重大影响时,或自身经营状况发
生较大变化导致现行利润分配政策无法执行时,或有权部门颁布实施利润分配相关新规
定导致公司利润分配政策必须修改时,公司将适时调整利润分配政策。调整后的利润分
配政策不得违反相关法律法规以及中国证监会、证券交易所的有关规定,董事会应在相
关调整议案中详细论证和说明原因。 公司应依法通过接听投资者电话、公司公共邮箱、
网络平台、召开投资者见面会等多种渠道主动与独立董事、股东特别是中小股东进行沟
通和交流,收集独立董事、股东对公司利润分配政策调整的意见,董事会在论证调整利
润分配政策时应充分考虑中小股东的意见。
  (2)董事会审议调整利润分配政策的议案时,应经全体董事过半数并经全体独立
董事三分之二以上通过。公司监事会应当对董事会调整的利润分配政策进行审议,并且
经全体监事过半数通过。
  公司调整的利润分配政策应经董事会、监事会审议通过后,提请股东大会审议批准,
股东大会应采取现场和网络投票相结合的方式召开。股东大会审议调整利润分配政策的
议案时,需经出席股东大会会议的股东(包括股东代理人)所持表决权的三分之二以上
通过。
(五)本规划的生效机制
  本规划未尽事宜,依照相关法律法规、规范性文件以及公司章程的相关规定执行。
本规划由公司董事会负责解释,自公司股东大会审议通过之日起实施。
第五节 本次向特定对象发行股票摊薄即期回报对公司主
         要财务指标的影响及公司采取的措施
一、 本次向特定对象发行摊薄即期回报对公司主要财务指标的影响
  经公司第二届董事会第十七次会议审议通过,本次向特定对象发行股票募集金额总
额为 78,989.00 万元;本次发行前公司总股本为 60,325,180 股,本次发行股份数量不超
过本次发行前上市公司总股本 60,325,180 股的 20%,即不超过 12,065,036 股(含本数)。
  本次发行完成后,公司总股本和归属于母公司股东权益将有一定幅度增加,公司即
期及未来每股收益和净资产收益率面临下降的风险。为充分保障投资者的利益,公司对
本次融资的必要性、合理性、本次募集资金投资项目与公司现有业务的关系、以及公司
填补回报的具体措施进行分析以及作出相关承诺。
(一)测算假设和前提
等方面未发生重大不利变化。
于本测算的估计,最终以经中国证监会同意注册并实际发行完成时间为准。
设本次向特定对象发行股票数量为 12,065,036 股,募集资金为 78,989.00 万元,该发行
股票数量仅为公司用于本测算的估计,最终以经中国证监会同意注册后实际发行股票数
量为准。
收入、财务费用、投资收益)等的影响。
市公司股东的净利润为 1,014.91 万元。
上市公司股东的净利润分别在上年同期的基础上按照下降 20%、持平和增长 20%的业
绩变动幅度测算。
同时仅考虑本次向特定对象发行对总股本的影响,不考虑其他可能产生的股权变动事宜
(如资本公积转增股本、股票股利分配、可转债转股)。
  上述假设仅为测算本次向特定对象发行股票对公司即期回报主要财务指标的摊薄
影响,不代表公司对 2023 年经营情况及财务状况的判断,亦不构成盈利预测,2023 年
公司收益的实现取决于国家宏观经济政策、行业发展状况、市场竞争情况、公司业务发
展状况等诸多因素,存在较大不确定性。投资者不应据此进行投资决策,投资者据此进
行投资决策造成损失的,公司不承担赔偿责任。
(二)对公司即期回报的摊薄影响
  基于上述假设和说明,公司测算了本次向特定对象发行股票对公司的每股收益等主
要财务指标的影响如下:
         项目
                                          本次发行前          本次发行后
总股本(股)                    42,800,000        60,325,180     72,390,216
假设一:公司2023年度归属于母公司股东的净利润和扣除非经常性损益后归属于母公司股东的净利
润较2022年度下降20%
归属于母公司股东净利润(万元)                2,945.41       2,356.33       2,356.33
扣除非经常性损益后归属于母公司
股东的净利润(万元)
基本每股收益(元/股)                       0.69            0.39            0.38
稀释每股收益(元/股)                       0.69            0.39            0.38
扣除非经常性损益后基本每股收益
(元/股)
扣除非经常性损益后稀释每股收益
(元/股)
假设二:公司2023年度归属于母公司股东的净利润和扣除非经常性损益后归属于母公司股东的净利
润与2022年度持平
归属于母公司股东净利润(万元)                2,945.41       2,945.41       2,945.41
扣除非经常性损益后归属于母公司
股东的净利润(万元)
       项目
                                          本次发行前          本次发行后
基本每股收益(元/股)                       0.69           0.49           0.48
稀释每股收益(元/股)                       0.69           0.49           0.48
扣除非经常性损益后基本每股收益
(元/股)
扣除非经常性损益后稀释每股收益
(元/股)
假设三:公司2023年度归属于母公司股东的净利润和扣除非经常性损益后归属于母公司股东的净利
润较2022年度增长20%
归属于母公司股东净利润(万元)                2,945.41       3,534.50      3,534.50
扣除非经常性损益后归属于母公司
股东的净利润(万元)
基本每股收益(元/股)                       0.69           0.59           0.58
稀释每股收益(元/股)                       0.69           0.59           0.58
扣除非经常性损益后基本每股收益
(元/股)
扣除非经常性损益后稀释每股收益
(元/股)
注:每股收益按照《公开发行证券的公司信息披露编报规则第 9 号——净资产收益率和每股收益的
计算及披露》规定计算,测算 2023 年度相关数据及指标时,不考虑已授予限制性股票的发行、回
购、解锁及稀释性影响,不考虑可能发生的权益分派及其他因素的影响。
二、关于本次向特定对象发行摊薄即期回报的特别风险提示
  由于本次募集资金到位后从投入使用至募投项目投产和产生效益需要一定周期,在
募投项目产生效益之前,股东回报仍然依赖于公司现有的业务基础,由于公司总股本增
加,本次发行后将可能导致公司每股收益指标下降。本次向特定对象发行 A 股股票当
年存在摊薄公司即期回报的风险。敬请广大投资者理性投资,并注意投资风险。
  公司对相关财务数据的假设仅用于计算相关财务指标,不代表公司对经营情况及趋
势的判断,也不构成对公司的盈利预测或盈利承诺。投资者不应根据上述假设进行投资
决策,投资者据此进行投资决策造成损失的公司不承担赔偿责任。
三、本次向特定对象发行股票的必要性和合理性
  本次募集资金投资项目有利于公司进一步优化业务结构、扩大经营规模、提升公司
核心竞争力。本次募集资金投资项目符合国家相关产业政策、行业发展趋势以及公司自
身发展战略,具有较好的市场前景和经济效益,符合公司以及公司全体股东的利益。
  关于本次向特定对象发行股票必要性和合理性论述的具体内容,请参见公司《北京
海天瑞声科技股份有限公司 2023 年度向特定对象发行 A 股股票预案》“第二节 董事会
关于本次募集资金使用的可行性分析”。
四、本次募集资金投资项目与公司现有业务的关系及公司从事募投项
目在人员、技术、市场等方面的储备情况
(一)本次募集资金投资项目与公司现有业务的关系
  本次募集资金拟用于“AI 大模型训练数据集建设项目”和“数据生产垂直大模型
研发项目”,募集资金投资项目均围绕公司主营业务进行。
  AI 大模型训练数据集建设项目将拓展训练数据产品体系,公司顺应人工智能大模
型的发展趋势,大幅提升训练数据产品的数据规模、广度、质量和精度,扩大产品覆盖
的场景和领域,是前瞻性布局大模型领域、拓展潜在高增长价值的新型业务板块的重要
举措;数据生产垂直大模型研发项目以研发海天瑞声数据生产垂直大模型为核心,升级
海天瑞声一体化技术支撑平台,进一步延伸大模型领域综合数据服务能力,旨在提高公
司业务能力的维度、广度、效率和水平,巩固公司的核心技术壁垒,构建长期技术实力
支撑,不断提高公司核心竞争力。
(二)公司从事募投项目在人员、技术、市场等方面的储备情况
  公司拥有高素质的管理、运营及研发团队,公司高管及核心研发人员大多毕业于清
华、北大、复旦等一流院校,大部分曾在微软、阿里巴巴、英特尔、IBM、中科院等业
内领先成熟企业与研究机构担任人工智能领域技术研发与管理的领导职务。截至 2022
年 12 月 31 日,公司研发人员达到 82 人,经验丰富的技术团队为本项目的执行提供了
人才保证。
  截至2022年底,公司拥有算法模型框架16个、算法模型数量超过200个,公司自然
语言理解算法支持包括语义理解、情感分析和意图识别等能力,语音识别算法支持语种
言、计算机视觉领域均有多年算法积累,该等算法模型能够全面支撑公司多个领域数据
生产活动的开展。
  公司自 2005 年成立以来,始终致力于挖掘行业客户需求,解决客户痛点,通过在
智能语音、计算机视觉、自然语言等领域的技术积累,获得全球众多客户认可,截至
度、科大讯飞、海康威视、字节跳动、微软、亚马逊、三星、中国科学院、清华大学等
全球主流企业、教育科研机构以及政企机构。产品广泛应用于客户所研发的个人助手、
智能音箱、语音导航、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相
关的算法模型训练过程中。公司的存量客户与本次募集资金投向新业务领域的客户重合
程度较高,本次募集资金投资项目具有稳定的客户资源和市场储备。
五、公司应对本次向特定对象发行摊薄即期回报采取的主要措施
  为保护广大投资者的合法权益,降低本次向特定对象发行可能摊薄即期回报的影
响,公司拟采取多种措施保证本次向特定对象发行募集资金有效使用、有效防范即期回
报被摊薄的风险。公司填补即期回报的具体措施如下:
(一)强化募集资金管理,提高募集资金使用效率
  根据《上市公司监管指引第 2 号——上市公司募集资金管理和使用的监管要求》
                                      《科
创板上市规则》等法律法规的要求,结合公司实际情况,公司已制定《募集资金使用管
理办法》,明确了公司对募集资金专户存储、使用、用途变更、管理和监督的规定。募
集资金将存放于公司董事会决定的专项账户集中管理,做到专款专用,以保证募集资金
合理规范使用。
(二)积极落实募集资金投资项目,助力公司业务发展
  本次募集资金投资项目的实施,将推动公司业务发展,加强公司主营业务的研发能
力及生产能力,进一步提高公司市场竞争力,为公司的战略发展带来积极影响,发行募
集资金到位后,公司将积极推进募集资金投资项目,从而降低本次发行对股东即期回报
摊薄的风险。
(三)不断完善公司治理,加强经营管理和内部控制
  公司将严格遵循《公司法》《证券法》《科创板上市规则》等法律、法规和规范性
文件的要求,不断完善公司治理结构,建立健全公司内部控制制度,促进公司规范运作
并不断提高质量,维护公司整体利益,尤其是中小股东的合法权益。同时,公司将努力
提高资金的使用效率,合理运用各种融资工具和渠道,控制资金成本,提升资金使用效
率,节省公司的各项费用支出,全面有效地控制经营和管控风险,保障公司持续、稳定、
健康发展。
(四)严格执行利润分配政策,强化投资者回报机制
  为完善公司利润分配政策,更好地维护全体股东及投资者利益,公司按照相关法律
法规的要求并结合公司的实际情况,在《公司章程》中规定了有关利润分配的相关制度
条款,明确了公司现金分红的具体条件和比例、股票股利发放条件以及公司利润分配的
决策程序和机制。为了进一步落实利润分配政策,公司还制定了《未来三年(2023 年-2025
年)股东分红回报规划》,持续优化投资者回报机制。公司未来将严格执行分红政策,
在符合利润分配条件的情况下,积极推动对股东的利润分配,切实维护投资者合法权益,
努力提升股东回报水平。
(五)完善员工激励机制,加强人才队伍建设
  公司将完善薪酬和激励机制,建立有市场竞争力的薪酬体系,引进市场优秀人才,
建立与公司发展相匹配的人才结构,最大限度地激发员工积极性,挖掘员工的创造力和
潜在动力,为公司的可持续发展提供可靠的人才保障。
(六)持续完善公司治理,为公司发展提供制度保障
  公司已建立、健全了法人治理结构,具有完善的股东大会、董事会、监事会和管理
层的独立运行机制,设置了与公司生产经营相适应的组织职能机构,并制定了相应的岗
位职责,各职能部门之间职责明确,相互制约。公司组织机构设置合理、运行有效,股
东大会、董事会、监事会和管理层之间权责分明、相互制衡、运行良好,形成了一套合
理、完整、有效的公司治理与经营管理框架。
  公司将继续严格遵循《公司法》《证券法》以及《上市公司治理准则》等法律、法
规和规范性文件的要求,不断完善公司治理结构,切实保护投资者尤其是中小投资者权
益,为公司发展提供制度保障。
  公司提示投资者,上述填补回报措施不等于对公司未来利润作出保证。
六、相关主体对公司本次向特定对象发行摊薄即期回报采取填补措施
出具的承诺
(一)公司董事、高级管理人员对公司填补回报措施能够得到切实履行做出的承诺
  “1、不无偿或以不公平条件向其他单位或者个人输送利益,也不采用其他方式损
害公司利益。
相挂钩。
报措施的执行情况相挂钩。
监督管理委员会、上海证券交易所等证券监管机构作出关于填补回报措施及其承诺的其
他新的监管规定,且上述承诺相关内容不能满足中国证券监督管理委员会、上海证券交
易所等证券监管机构的该等规定时,本人承诺届时将按照中国证券监督管理委员会、上
海证券交易所等证券监管机构的最新规定出具补充承诺。
回报措施的承诺,若违反该等承诺并给公司或者投资者造成损失的,本人愿意依法承担
对公司或者投资者的补偿责任。
本人同意按照中国证券监督管理委员会、上海证券交易所等证券监管机构制定或发布的
有关规定、规则,对本人作出相关处罚或采取相关管理措施。”
(二)公司控股股东、实控人、董事长贺琳对公司填补回报措施能够得到切实履行作
出的承诺
  “1、不越权干预公司经营管理活动,不侵占公司利益,切实履行公司填补即期回
报的相关措施。
公司利益。
情况相挂钩。
公司填补被摊薄即期回报措施的执行情况相挂钩。
监督管理委员会、上海证券交易所等证券监管机构作出关于填补回报措施及其承诺的其
他新的监管规定,且上述承诺相关内容不能满足中国证券监督管理委员会、上海证券交
易所等证券监管机构的该等规定时,本人承诺届时将按照中国证券监督管理委员会、上
海证券交易所等证券监管机构的最新规定出具补充承诺。
回报措施的承诺,若违反该等承诺并给公司或者投资者造成损失的,本人愿意依法承担
对公司或者投资者的补偿责任。
本人同意按照中国证券监督管理委员会、上海证券交易所等证券监管机构制定或发布的
有关规定、规则,对本人作出相关处罚或采取相关管理措施。”
  第六节 与本次发行相关的董事会声明及承诺事项
一、董事会关于除本次发行外未来十二个月内是否有其他股权融资计
划的声明
  除本次发行外,公司在未来十二个月内暂无其他股权融资计划。若未来公司根据业
务发展需要及资产负债状况安排股权融资,将按照相关法律法规履行相关审议程序和信
息披露义务。
                       北京海天瑞声科技股份有限公司
                                       董事会

微信
扫描二维码
关注
证券之星微信
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示海天瑞声盈利能力一般,未来营收成长性较差。综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-