工业数据筑基行动重磅落地:一场由数据主导的工业革命正启幕
2026-04-13 11:16 来源:中国工业新闻网
4月9日,为贯彻落实党中央、国务院关于人工智能发展的决策部署,加快探索工业数据“采”“集”“用”有效路径,按照《工业和信息化部办公厅关于启动工业数据筑基行动开展面向人工智能赋能的高质量行业数据集建设先行先试的通知》(以下简称行动或《通知》),工业和信息化部公布14个先行先试联合体名单。
这不是一次普通的数字化试点,而是我国争夺工业数据主权、打造自主可控工业数据生态的国家战略落子。当前,美国布局工业数据共享池、德国依托“制造—X”计划构建可信数据生态、日本投入万亿日元整合制造业数据,全球工业竞争已从设备、技术比拼,转向数据与生态的终极较量。而我国虽拥有全球最完整工业体系,却深陷数据“采不全、通不动、用不好”的困境:中小企业数据利用率不足30%,高质量可流通数据产品不足千个,近四成数据沉睡沉淀,数据治理成本占到智能化改造成本的一半以上。工业数据筑基行动,正是破局这场数据困局、让数据真正成为AI赋能制造业核心燃料的关键一招。
工信部信息技术发展司司长王彦青在3月24日国新办发布会上明确表示,下一步,工信部将从支撑保障、政策引导、生态培育三方面持续发力,联合地方部门为试点提供资源支持,出台数据要素赋能新型工业化政策,加快数据标准研制,壮大数据服务产业,做强AI开源社区,为工业数据要素高效流通与价值释放保驾护航。
全面重构 AI时代的工业“精粮”
高质量行业数据集是工业数据筑基行动的核心载体,也是区别于普通工业数据、互联网数据的关键存在。中国工业互联网研究院副院长田野向中国工业报表示,按照TC609(全国数据标准化技术委员会)定义,高质量数据集是指经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,能有效提升模型性能的数据的集合它不在于“数据多”,而是数据好用、敢用、能用。
田野指出,普通工业数据是“原材料”,工业高质量数据集则是可直接赋能AI、驱动生产的“工业精粮”。互联网数据是网民在互联网上各种行为活动产生的数据,具有较强的开放属性,获取相对容易。但其数据权属界定模糊,开发利用权存在争议。相比之下,由制造企业供给形成的高质量行业数据集权属清晰。数据产生于企业真实的生产经营活动,其权属明确归属于企业,具有极高的合规性。
从工厂一线落地视角出发,工业互联网产业联盟(AII)工业大数据特设组副主席、上海优也信息科技有限公司首席科学家郭朝晖向中国工业报表示,企业真正能用、好用的高质量工业数据集,必须以客户实际需求为核心导向,满足“时间连续、空间完整、可识别因果”三大核心要求,同时具备数据精度高、采集频度高、时钟统一度高的特点,能够从生产源头获取并长期稳定存储,真正实现“像管产品质量一样管数据质量”。他强调,工业数据覆盖人机料法环测全维度,结构复杂且侧重因果关系研究。
面向AI赋能制造业的全新定位,工业数据建设被提出颠覆传统的新标准、新要求,中国信息通信研究院工业互联网与物联网研究所数据与智能业务部副主任尹子航告诉中国工业报,这一定位让工业数据建设从传统治理模式转向AI适配模式,迎来四大核心变革:一是数据模态从单一结构化数据,转向文本、图像、时序数据兼备的多模态体系,覆盖操作手册、设计图纸、设备运行参数等全类型工业知识;二是数据加工必须由行业专家深度参与标注,同步通过极端场景数据合成技术,补齐故障、异常工况等长尾稀缺数据,避免模型训练出现样本偏差;三是数据流通必须统一格式、接口、质量评估标准,打破企业内部封闭使用壁垒,实现跨企业、跨领域数据高效互通调用;四是数据共享从私有化持有转向安全前提下的开源共享,依托国家级AI开源社区建设工业数据开源专区,形成行业公共数据资源池。
尹子航强调,从部委视角评估,高质量行业数据集的核心标准排序为安全、价值、质量、规模。安全是数据流通共享的前提,工业数据涉及企业商业秘密与国家经济安全,需依托区块链、可信数据空间等技术筑牢安全防线;价值是数据集建设的核心目标,必须能支撑研发设计、生产制造、产业协同等场景智能化应用,真正实现制造业提质降本增效;质量是数据有效使用的基础,需满足准确性、完整性、一致性、时效性要求,保障模型训练效果;规模并非首要追求,行动强调“小切口”先行先试,细分场景下的高价值、高质量数据,同样能支撑关键AI应用落地。
田野还提到,高质量行业数据集是破解工业大模型“无米下锅”困境的核心引擎,能推动工业大模型从通识走向专业、从实验室走向生产线,同时形成“数据-模型-应用”迭代闭环,大幅降低企业数据治理成本。当前工业大模型训练最紧缺两类数据:一是覆盖研发、制造、经营、运维全流程的跨企业规模化数据,二是贴合工艺机理、匹配真实工况、带完整语义描述的深度标注数据。目前可供给数据的企业数量偏少、供给规模偏小,仍是制约工业AI深度落地的核心瓶颈。
谁先受益 “1+4+N”体系深度解码
工业数据筑基行动构建“1+4+N”核心实施框架,即1个可信互联平台、4类核心资源库、N个AI应用场景,旨在打通工业数据采集、治理、流通、应用全链条,形成数据要素高效配置生态。田野表示,这一体系落地最难突破的环节是数据可持续供给,工业企业普遍坚守“数据不出域”安全底线,必须构建“集中统一数据目录+数联网+分布式可信数据空间”的技术体系,实现数据“可用不可见、可控可计量”,同时配套创新商业模式,解决数据供给侧企业的核心诉求,保障数据持续稳定供给。
在行业数据合作联合体中,企业、平台、科研机构三方主体分工明确、协同发力:企业开放高价值生产场景、共享合规工业数据、沉淀行业机理知识,牵头开展工业大模型与工业智能体应用试点,形成可复制案例向全产业链推广;平台机构聚合制造企业、数据服务商、云厂商、大模型企业等多元主体,搭建行业数据可信互联平台,提供数据采集、标注、合成一站式服务,开发标准化数据产品,降低中小企业参与门槛;科研机构聚焦数据技术攻关与标准研制,提供落地解决方案,推动技术成果与工业场景深度融合,形成统一行业规范。
田野强调,为避免重复建设、资源浪费,行动明确三大核心原则:坚持垂直化统筹,一个重点行业仅建设一套共性基础库,由链主企业牵头联合体统一管理;实施需求牵引机制,以AI应用场景倒推数据集需求目录,杜绝盲目建库;强化存量数据复用与标准统一,已建成的合格数据集直接纳入体系,行业共用一套数据字典、接口与质量规范,实现跨平台互认互通。
尹子航认为,此次行动将率先让三类主体成为标杆示范,抢占工业数据要素发展先机。行业层面,钢铁、汽车产业链长、数字化基础扎实、关键工序数控化率高,优先受益,先进制造业集群、新材料重大专项覆盖行业,依托政策资金支持快速推进试点;区域层面,国家先进制造业集群所在区域产业集中度高,便于数据协同供给与公共基础设施建设,中小企业数字化转型城市试点,依托现有改造基础延伸建设数据训练基地、探索流通交易机制;企业层面,产业链龙头企业牵头联合体,主导标准制定与平台建设,率先实现数据资产化;工业互联网平台、大数据中心等平台机构,承担核心平台建设任务,获得政策与资源双重支持;数据咨询、治理、标注等专业服务企业,迎来广阔市场空间。
中央财经大学数字经济融合创新发展中心主任陈端向中国工业报判断,数据服务订阅/租赁、数据价值分成、数据信贷、数据资产作价入股四类商业模式将在工业领域逐步跑通,其中数据服务订阅/租赁模式最易落地,能精准匹配中小企业轻量化用数需求,成为工业数据商业化的首个突破口;数据价值共享的“分成模式”深度绑定多方利益,促进数据持续贡献与价值共创,是行动鼓励探索的方向;数据信贷与数据资产融资模式:随着数据资产入表等相关会计制度的完善,以及数据价值评估体系的建立,企业持有的高质量数据集可被评估为无形资产进行抵押融资;“数据资产作价入股”模式(创新前沿),是将数据资产直接资本化的高级形式,这种模式能极大激发数据持有方的积极性,促进数据要素与技术、资本的深度融合。
针对企业“不愿共享、不敢共享、不会共享”的行业痛点,北京物联网智能技术应用协会副会长、中关村大数据产业联盟副秘书长颜阳向中国工业报表示,协会与联盟层面将搭建破局机制:建立基于“三权分置”的利益分配机制,明确数据资源持有权、加工使用权、产品经营权,保障数据供给方获得持续收益;推广隐私计算、联邦学习、区块链确权技术,实现数据“可用不可见”,消除企业数据泄露顾虑;牵头制定行业统一数据标准与评价体系,搭建公共数据运营平台,降低企业数据治理与对接门槛,变“独自摸索”为“集体协同”。
对于最受关注的中小企业,陈端表示,这是中小企业数字化转型的重大发展机遇,行动通过联合体模式打破数据垄断,推动利益公平共享,中小企业无需投入高昂成本自建系统,即可低成本接入行业资源库,获取标准化高质量数据与技术支持,真正实现“数据普惠”。同时,行动探索数据确权、价值评估与收益分配机制,中小企业可通过数据供给获得合理收益,数据话语权不再依赖数据占有量,而是取决于对数据价值的贡献度。
颜阳向中国工业报补充,对中小企业而言,此次行动既是生存压力也是转型红利。压力在于AI原生时代,无法实现数据化生存的企业将被高效率的“一人公司”或极简团队降维打击;机遇在于中小企业可依托行业联盟、公共服务平台,通过API调用、订阅服务等轻量化按需付费模式,无需巨额研发投入就能拥抱大模型赋能,实现低成本数智化跃升。
长期战略 为新质生产力打造核心数据基座
从数字经济与新质生产力的角度看,工业数据筑基行动的长期意义,在于为工业领域新质生产力的勃兴构筑不可或缺的“数据基座”,并从根本上推动工业增长范式的重构,这也是在国家层面为人工智能时代工业竞争力的重构进行的一次系统性、前瞻性的“地基”工程。
陈端表示,此次行动没有采取“大水漫灌”,而是精准地依托重点行业企业、平台机构、先进制造业集群、中小企业数字化转型城市试点四类主体,以“行业数据合作联合体”这一创新组织模式开展先行先试。这实际上是在探索如何将我国“全国一盘棋”的体制优势与市场机制结合,在保障数据安全与权益的前提下,激活跨企业、跨产业链的数据协同价值,为全国统一数据要素大市场在工业领域的建设投石问路。
尹子航明确,在国家数据要素整体布局中,工业数据筑基行动是“数据二十条”“数据要素×”从顶层设计走向工业实操落地的关键环节。与“数据二十条”相比,筑基行动将数据产权、流通交易、收益分配、安全治理四大基础制度,落到工业场景实操层面,实践检验“三权分置”原则在产业链中的应用方式;与“数据要素×”相比,筑基行动聚焦解决高质量数据供给痛点,为“数据要素×工业制造”提供核心资源支撑,释放数据要素乘数效应。
尹子航表示,此次先行先试核心要探索四项可复制制度成果:一是工业数据确权操作规范,明确产业链数据权利边界,形成标准化协议模板;二是场景驱动的数据估值方法,适配工业数据价值特性,为数据交易、资产入表提供依据;三是创新数据流通交易机制,推广订阅制、分成制等适配数据特性的模式;四是多方共赢收益分配机制,打通中小企业数据收益通道,建立可持续数据供给激励。
陈端还提到,对地方政府而言,参与先行先试是抢占产业发展制高点的战略机遇:一是打造产业集聚与招商引资新抓手,吸引龙头企业、平台机构、数据服务商集聚,培育数据标注、治理、咨询等生产性服务业;二是成为传统产业转型升级加速器,破解本地产业“数据孤岛”痛点,提升企业智能化水平;三是抢占政策资源支持窗口期,获得国家专项资金、指导支持与经验推广;四是培育未来经济增长极,提前布局数据租赁、数据信贷、数据保险等新兴业态,在区域经济竞争中占据主动。
格局重塑 数据价值决定新的话语权
“掌握某一行业的高质量、权威数据集,意味着掌握了定义该行业数字空间标准的话语权。这不仅能吸引上下游企业聚集,形成生态,更能通过数据服务衍生出新的商业模式和利润中心,具备长远的战略价值。”陈端表示,未来不再是简单的“谁占有数据谁有话语权”,而是构建“共建、共治、共享”的协作型话语权体系,话语权向三类核心主体集中。
第一类是数据枢纽平台,牵头建设行业可信互联平台的主体,成为工业数据汇流、治理、分发的核心枢纽,在数据流通规则、技术标准制定、收益分配机制中占据主导地位,掌控数据要素配置主动权;第二类是产业链链主企业,牵头联合体整合物理供应链与数据供应链,将管理规范、技术知识转化为数据标准向全产业链输出,巩固链主地位的同时,开拓数据服务全新营收增长点;第三类是数据价值贡献者,中小企业、数据服务商、科研机构等,凭借数据供给、技术攻关、标准研制等贡献获得合理收益,话语权由价值创造能力决定。
颜阳补充,行动将推动全产业链角色全面转型:制造企业从传统“黑盒生产”转向“白盒化”数据驱动,依托数据资产实现个性化定制升级;工业互联网平台商成为“双边市场连接器”,整合设备商、服务商与终端用户;数据服务商成为数据资产化“翻译官”,提供确权、清洗、脱敏、入表等专业服务;AI公司从单纯算法提供商转型为AI原生基础设施构建者,基于工业数据驱动生产逻辑重构。
在颜阳看来,未来数据服务市场将涌现出更具颗粒度和专业化的新需求。首先是“数据合成”需求,当真实世界数据受限时,利用AI生成高质量合成数据来训练模型将成为刚需;其次是动态的“数据治理与合规审计”服务,随着跨境数据流动和隐私保护法规的完善,企业需要实时性的合规监控。此外,数据交易市场将从粗放的整包交易转向精细化的“价值精调”需求,即根据业务场景对数据价值进行动态评估和定价。最后,随着会计准则的演进,电子凭证全生命周期的数智化管理,以及辅助数据资产“入表”的咨询与审计服务将迎来爆发式增长。
这场由数据主导的工业革命,已从顶层设计走向落地实操。随着14个联合体名单的公布,先行先试经验逐步推广、制度体系持续完善、产业生态不断成熟,高质量工业数据在AI时代中赋能智能制造将获得更持久的生命力。