近日,拓尔思信息技术股份有限公司数字经济研究院编写的《拓尔思数据要素白皮书》正式发布,白皮书从我国数据市场的发展情况讲起,介绍了公司在数据要素的布局,并分析了数据要素未来的产品变现点与盈利空间。值得注意的是,这份白皮书,是在拟组建国家数据局的消息发布后,A股上市公司中发布的首个数据要素相关的白皮书。
不过,这篇白皮书报告总计85页,全文近四万字,且业内专业术语不在少数,部分投资者在拓尔思发布白皮书后,反映“太长看不懂”“看不明白,但好像很厉害”等等。那么,本篇文章就将针对白皮书相对专业且篇幅较长的特点,结合部分白皮书之外的资料,重点概括分析未来数据要素行业的盈利模式、市场空间,并指出拓尔思在数据要素行业的业务布局。
一、数据要素定义及市场空间
数据要素尽管至今没有一个十分准确的定义,但其可以大致理解为以数据形式存在的,进行社会生产经营活动时所需要的各种社会资源。具体来看,组成数据的各种元素,如数字、文本、图像等,都可以是数据要素。(本文探讨的数据,均指包含了各种文本图像的广义数据,并非指狭义的数字)。
作为数据要素白皮书,拓尔思数据要素白皮书第一部分就对数据要素市场进行了概述,其核心思想是:数据要素已成为一种商品,同时随着数据要素的流动性越来越好。数据要素与数字经济,将逐渐划上等号。通俗点说,小到一段摄影作品、一篇文章,大到全国交通热力数据、全国用户使用流量的数据,只要能够加工成数据要素,都可以在交易所“卖钱”,而且由于数据要素的可复制性,数据可以反复出售多次。只是有数据价值、信息量不同,卖价不同的区别。
为了保证数字经济时代数据要素的流动性,就要有足够多的各级数据交易平台来进行交易,从下图来看,数据交易平台的建设在近年来特别是21年开始,确实有加速落地的迹象。从表中看,目前全国已建成各级大数据交易平台47个。
图片来源:拓尔思白皮书
有了数据交易所作为变现的场所,数据要素的交易类型也越来越丰富。随着交易环境的不断优化、交易规模的持续扩大,我国数据产品交易变现能力显著提高。加之数据量的指数级增长,预计至25年我国数据要素市场的规模仍将大幅增长,按照预测图表的数据,数据要素市场22年至25年的年化复合增长率将达到24.6%。若实际市场按照此速度持续上升,2026年我国数据要素市场规模就将突破2000亿元。
图片来源:拓尔思白皮书
面对增速如此之高的新兴业务市场,行业内的上市公司自然也是摩拳擦掌,不过,市场的长期发展,离不开成熟的商业化模式,那么,在数据要素这条赛道上,行业内公司如何变现呢?
二、数据要素行业盈利模式及对应产品
1、数据是如何变成资产的
了解数据要素行业的模式,需要首先理解散乱数据变成资产的过程。
数据变成资产,第一步就是采集,由于采集的结果,就是数据要素的“原料”,因此数据采集对于数据要素的最终质量至关重要。其中,数据采集方式主要有传感器采集(摄像头、指纹传感器、各种声光电热传感器)、爬虫技术爬取公开数据(公示文件、网站信息等)、以及通过特定API(应用程序编程接口)接入,以及人工录入、人工创作等。
第二步,是数据清洗和加工,即数据处理。由于采集来的数据,大多会出现乱码、无意义数据等等影响数据质量的问题,因此需要分析数据,定义哪些是“脏数据”,再设法将其转换为干净数据,反复重复这一步骤,直到所有数据完成清洗,得到有意义的数据。、
数据清洗,需要删除的就是这种无意义的乱码数据
清洗完成后,有规律、有意义的数据就可以以数据生产者设想的方式进行加工,并形成各种数据产品了。例如将视频产品转换为文字产品,将图片产品转换为视频产品,将不同数字产品重新组合拆分等等,都是可以实现的。
第三步,则是数据的评估、确权。既然数据是一种要素,那么其也必然有价值。数据处理好之后,需要由专业人员评估其价值,以确保其能够以合理的价格进行交易,从而达到数据应有的对应“成交量”。更重要的是,数据要素需要权威机构确定其归属,即谁拥有数据,用有哪些数据,这些数据有怎样的权力(哪些是公有的,哪些是私有的)。
最后一步,处理完成的数据,经过各交易所确认,就可以在交易所挂牌交易了。
当然,以上这些只是数据变为资产的一般步骤,涉及到具体的应用层面,还会有更多的落地场景,例如在交易所挂牌的,也可以是各种数据服务。最终数据要素的变现,也并不一定要在数据交易所实现,但数据要素最核心的本质不变,即有价值的数据在处理完成后变为生产要素,变为可变现的商品。
2、数据要素行业盈利点及部分上市公司
(1)数据采集
数据要素的产业链,自然是从生成数据、采集数据开始,无论是直接经营采集设备的公司,还是从事数据采集具体业务的公司,都属于这一行业。
据华经产业研究院数据,2025年,国内自动识别及数据采集行业市场规模有望突破200亿元,2022年-2025年,按预测数据计算,年化复合增长率可达15.27%。
数据来源:华经产业研究院
在白皮书中,拓尔思对信息采集的部分细分市场未来三年的整体市场规模也做出了预测,其中专利检索服务市场的总体规模将达 504 亿元(168 亿/年*3 年)。舆情大数据市场的总体规模将达 403 亿元(134.38 亿/年*3 年)。
上市公司中,近期反复活跃的工业富联,部分业务就涉及工业互联网信息的采集,而主营监控设备的大华股份、海康威视,则可以理解为卖数据采集设备的公司:监控设备就可以理解为采集视频数据要素的设备。此外,机器视觉、身份识别认证、条码扫描识别、网络爬虫爬取、行车记录仪、智能手环等等,均涉及数据采集。
(2)数据处理
数据处理也是数据要素化的重要环节,其包括数据清洗和加工等,前文已简述了数据处理的步骤。其盈利点主要在于处理后的数据的资产化。
上市公司中,有很多公司涉及数据处理业务,不过这个大多是系列业务的一部分,其中比较有代表性的是生意宝、上海钢联、卓创资讯这样的特定行业数据服务商,这些公司提供数据产品时,会进行大量的数据清洗、处理,最终再以数字报告、图表、产品报价等多种形式,向会员提供数据服务业务。
行业数据服务商将相关交易数据筛选加工后,呈现在网站上
(3)数据确权与评估
数据确权与评估,在未来的数字经济时代也会是一个重要的服务。其盈利点主要在于收取数据确权和评估的服务费用和其他增值费用。由于数据确权和评估涉及数据要素交易的核心利益,在这一方面,国资企业得益于其在对政策敏感度、信用背书等方面的优势,或将获得更大的市场空间。
数据确权评估相关上市公司中,共有十八家公司为国企,其中央企、国资委控股企业共五家,分别是美亚柏科,深桑达A,人民网,易华录和新华网。
(4)底座:国资云(数据存储、数据安全)
在数据处理完成、确立归属权并完成股价后,还有关键的一步:安全地长期存放以便在有人需要买入数据资产时随时取用。
以往的数据资产储存,多集中在民间的各种行业云中,在数据安全日益重要,甚至事关国家利益的今天,数据安全性相对较弱的较小的云产品已难以满足数据安全存储的需要。这时,国资云作为国家级别的,由各地国资委牵头投资、设立、运营,通过建设高安全防护水平的数据安全基础设施底座,重要性便凸显了出来。
在国家高度重视数据安全的背景下,国资云有望成为行业发展的重要趋势,并实现超越整体云市场的增长速度。根据《2021-2022年中国国资云市场发展状况研究报告》统计,2021年中国国资云市场规模约36.5亿,预计到2025年中国国资云市场规模将达到约146.48亿元,年均复合增长率将达到41.53%,整体保持高速增长。
上市公司中,三大运营商无疑是国资云建设的重点,根据2022年上半年报表来看,电信天翼云收入280.82亿元,同比增长100.8%;移动云收入234亿元,同比增长103.6%;联通云收入187亿元,同比增长143%。“三朵云”均以同比大于100%的势头增长,增速远高于行业平均水平。
不过,数据存储和数据安全市场也并非会由国资云完全占据。在白皮书中拓尔思也提到,拓尔思全资子公司天行网安也参与了数据安全一体化业务,根据IDC(国际数据公司)预测,到2026年,中国IT安全市场投资规模将达到 319 亿美元。金融监管4个应用场景的总体规模将达 96.5 亿。金融风控数据服务市场的总体规模将达150亿(49.1亿元/年*3年)。
(5)数据流通交易
数据的流通交易部分,主要涉及的是数据交易所,交易所可以凭借其信息整合的能力,“挂牌”各种数据,进行买卖,并收取服务费或挂牌费。多家上市公司都有参股数据交易所,例如万达信息、中南建设、华扬联众参与上海数据交易所,广电运通参股广州数据交易所等。
(6)应用端
数据流通交易,有卖方自然也有买方。在未来的数字经济时代中,科研机构、企业、个人都可能是数据要素的买方,他们将会使用这些数据,支持决策或者业务运营,进行科学研究或数据分析等等,买方购买数据要素后,一般进行商业决策等等,产生更多的价值。
(7)小结
整体来看,以数据采集、数据存储和数据加工为代表的数据供给环节,和以数据交易、数据分析、数据服务为代表的数据流通环节市场规模接近,从2021年数据看,细分领域中数据存储和数据分析部分市场规模较大。
图片来源:华经产业研究院
当然,大多数数据要素行业的上市公司,都并非单纯只涉及其中的某一项业务,例如发布了白皮书的拓尔思,通过“云和”数据服务生产模式,就涉及了这些数据要素产业链的绝大部分业务。
3、“云逛街”数据交易所
针对白皮书专业术语较多的问题,这里笔者带大家“云逛”一下各地的数据交易所,来更为直观、具体地了解数据要素的商业化场景。
先来看成立较早的贵阳大数据交易所,从最近更新日期可以发现,数据资产的卖方挂牌还是比较积极的,最新商品均为一周内发布。
图片来源:贵阳大数据交易所官网
这款高分辨率卫星遥感数据分析产品,尽管出价20万元,但仍成交了七笔,其提供的数据安全的评估服务,就属于数据要素中数据安全服务的典型案例。
图片来源:贵阳大数据交易所官网
而这款12000元的产品,提供的是空间信息数据,具有定制化强,适用面广的特点,值得注意的是,截至目前其已累计成交31笔。这家公司提供的产品,则属于比较标准的提供用户所需数据——变现的过程。
图片来源:贵阳大数据交易所官网
再来看上海大数据交易所,其相较于贵阳大数据交易所,有更多的企业入驻,从上面可以看到,工业互联网的卡奥斯工业数擎、电信提供的升级人口热力查询、宝信软件提供的钢铁产业数据等等大数据,都是可以变现的。
图片来源:上海大数据交易所官网
三、拓尔思数据要素部分业务分析
了解了数据要素行业的全景,这里回到发布者本身,看一下拓尔思数据要素部分的布局如何。
拓尔思并不是一家纯粹做数据要素处理的公司,公司在人工智能方面也有布局。不过,在巨头能级远高于其他公司的人工智能市场中,公司的实力与华为、百度、腾讯等大厂还存在不小的差距。而在数据要素部分,作为民企的拓尔思,似乎在与众多大型国央企的竞争中也难言优势。但是,成立于1993年,在技术更新换代非常之快的行业已走过30个年头的拓尔思,也一定有它独特的生存之道。
1、产业链覆盖较全
在数据要素产业链内,拓尔思白皮书中展现的其中一点,便是其产业链的覆盖度较高,其不仅有大数据底座(数据存储),在数据安全、数据处理等方面均有布局。特别是在语言的数据处理方面,公司积累了较为丰富的经验。
下图反映了拓尔思的数据要素业务架构,可以看到公司的业务覆盖面和行业覆盖面较广,这也就意味着,公司自身产出合格的数据要素产品进行挂牌,相较于其他公司需要的外部支持将会更少。
拓尔思数据要素业务运营架构
2、另类数据业务有“特色”
近日,拓尔思接受机构调研表示,目前公司积累了1300亿条基础数据,日均增加1亿条,以上数据全部来源于互联网公开数据,即另类数据。
另类数据不同于传统的交易所、公司公告等披露的金融数据,它是由各类信息终端、平台或者系统产生的数据。一般来说,这类数据尽管数据量较大,但同样非常零散,变现的难度较大。
不过,拓尔思在白皮书中指出,公司有望成为国内另类数据服务龙头,例如其“冒烟指数”通过互联网公开信息的收集监测,防范金融风险,已应用在400多家金融监管单位,成为官方防范金融风险的助手之一。
将另类数据处理后建立模型,提供信号发出预警,这便是拓尔思在另类数据业务上的“特色”。
值得注意的是,白皮书还提到要加快推进拓尔思数据产品在各地数据交易所挂牌,丰富数据要素的流通与变现渠道。如相关产品销量较好,未来也有望为公司提供更多的营收利润。
结语:
在这里,首先感谢拓尔思作为上市公司,在国家数据局拟成立后率先发布了数据要素白皮书,从而让更多投资者了解了数据要素市场和公司在数据要素领域的布局,这对于公司的投资者交流来说,也无疑是非常有利的。
此外,笔者在浏览数据交易所挂牌信息时,也不由得惊讶于如此多的大数据和信息服务,都已成为生产要素,服务着一个有一个有需求的企业或个人。事实上,从数字列入新兴生产要素开始,就注定了其在未来社会,会占据越来越多的GDP比重。虽然从数据列为要素之初,类似于企业成本增加,个人隐私暴露风险加大等唱衰的声音就不绝于耳,但大的国家政策和时代背景之下,伴随着人工智能、物联网、大数据等技术的快速发展,数据要素领域将会吸引更多的企业和资本进入。假以时日,数据要素将在更广泛的领域发挥重要作用,并成为企业和研究机构的核心竞争力,到那时,“数据要素也是生产力”的概念,或许也将深入人们的心中。