截至2025年5月15日收盘,海天瑞声(688787)报收于93.31元,下跌3.73%,换手率2.73%,成交量1.65万手,成交额1.55亿元。
5月15日,海天瑞声的资金流向情况如下:- 主力资金净流出1652.91万元,占总成交额10.68%;- 游资资金净流入449.43万元,占总成交额2.91%;- 散户资金净流入1203.48万元,占总成交额7.78%。
随着多模态大模型的快速迭代及行业应用渗透提速,公司计算机视觉业务和自然语言业务分别实现高速增长。大型客户持续加码高质量图像/视频等多模态数据采购,政务、法律合规等场景应用的落地,以及东南亚新增数据交付体系进入爬坡运营阶段,共同驱动公司2025年第一季度营业收入显著增长。
公司正积极探索与实践数据产业新业务和新模式,包括与多地政府、地方运营商等开展战略合作,探索数据要素市场化与产业化的创新路径,联合当地高校培训数据标注人才,以及助力地方及产业园区打造数据标注基地和构建数据标注产业新生态。
公司凭借在数据领域的核心优势,已成为运营商类客户重要的数据服务供应商。未来,随着运营商在多模态大模型方向的持续加码,预计相关数据需求将进一步增长,为公司收入带来持续的增长动能。
2025年公司营收增长的核心驱动力来自AI产业的两大发展趋势:多模态AI技术的快速演进催生了跨模态融合数据的增量需求,AI在垂直行业的深度应用创造了新的市场机遇,东南亚新增数据交付体系进入爬坡运营阶段,预计可为公司带来可观的收入增量。
产品数据集是先于客户需求形成的模拟数据,属于一次性投入、未来重复授权销售,对于公司的营收、毛利有着重要作用;而定制业务的需求来源是客户的定向化需求,公司提供纯加工的服务。产品+服务的组合是公司向市场提供的综合解决方案,服务于不同客户的不同研发阶段需求。
公司标准数据集产品的积累方式主要为基于公司对市场需求趋势的判断和共性需求的提炼能力,先于客户需求开发数据集。数据集产品的这种商业模式在行业内往往具有较高壁垒,需要公司对未来需求趋势有精准把握,并具备充足的资金保障。
境外业务当中标准化数据集产品的销售占比相对更高,而标准化产品的销售毛利率为100%,远大于定制服务毛利水平。此外,境外客户更认同数据服务商的综合能力及品牌价值,价格敏感度相对较低。
训练垂直领域大模型的核心数据来源可分为三类:公开数据、客户自有数据和垂直场景定向采集数据。这些原始数据必须经过专业处理流程才能投入使用,主要包括数据清洗与标准化、格式转换、领域专家标注与校验。
DeepSeek推出的一系列模型,特别是V3模型,依然使用了预训练和SFT等训练方式,预训练阶段的token使用量远超同类大模型。尽管R1模型在某些推理类任务上表现出色,但对于其他领域的复杂问题,依然需要高阶数据专家的参与。高质量数据对于模型能力提升至关重要,未来大模型技术将深入渗透到各个行业中,需要更多数据及数据专家的参与。
公司的核心竞争力体现在业务模式、技术平台能力、供应链资源管理能力和数据安全及合规能力。截至2024年12月末,公司已积累超过1,700个自有知识产权的训练数据标准化产品,数据库存量稳居全球企业前列。
公司在国内的主要竞争对手是数据堂、标贝等品牌数据提供商,国外的主要竞争对手是Appen。与竞争对手相比,海天瑞声拥有丰富的产品积累、成熟的数据处理技术和平台、全球化的供应链管理能力等显著竞争优势。未来,公司将面临来自Scale AI等具有更强技术属性的同业公司的竞争。
以上内容为证券之星据公开信息整理,由AI算法生成(网信算备310104345710301240019号),不构成投资建议。