人工智能时代我国工业大模型发展的现状、挑战与对策
先进制造业·导读
近日,《数字化转型》2025年第5期刊发工业和信息化部电子第五研究所工程师闫一新等署名文章《人工智能时代我国工业大模型发展的现状、挑战与对策》。
本研究详细介绍了我国工业大模型在国家和地方层面的产业政策体系、模式构建、当前场景探索成效和产业生态发展情况,总结了当前工业大模型落地应用亟待解决的五方面挑战,包括跨系统整合部署等技术能力薄弱、企业数据开放意愿不高和工业数据采集处理难度大导致的高水平工业数据集供给不足、工业大模型可靠性和安全性不高、工业大模型能耗较大、工业企业投资决策不畅。
作者简介:
闫一新,中国电子产品可靠性与环境试验研究所,硕士,工程师,研究方向:人工智能、工业数字化转型;
李锐,中国电子产品可靠性与环境试验研究所,硕士,工程师,研究方向:软件、人工智能、新型工业化;
刘璐(通信作者),工业和信息化部电子第五研究所,学士,工程师,研究方向:人工智能、数字经济。
全文为您分享如下:
人工智能时代我国工业大模型发展的现状、挑战与对策
闫一新 李锐 刘璐
工业是国民经济的主导力量,是国家综合实力的核心支撑,是建设农业强国、科技强国、质量强国、航天强国、交通强国、网络强国、数字中国的战略基础。党的十八大以来,我国工业体系综合实力大幅提升,制造业增加值规模连续10多年位居世界首位,重点领域创新取得重大突破,企业竞争力显著增强。但需要清醒地认识到,我国工业仍处于全球价值链中低端,正处在由制造大国、网络大国向制造强国、网络强国转变的关键时期。为此,必须大力推进新型工业化,加快建设制造强国,为中国式现代化构筑强大物质技术基础。
作为引领新一轮科技革命和产业变革的重要驱动力量,人工智能正深刻重构全球经济发展模式和人类文明进程。近年来,国内人工智能蓬勃发展,工业和信息化部数据显示,我国人工智能核心产业规模不断提升,企业数量超过4500家,能为公众提供服务的生成式人工智能服务大模型超过200个,注册用户超过6亿,数字化车间和智能工厂加快建设,智能基础设施不断夯实,为人工智能赋能新型工业化奠定了良好基础。
大模型是人工智能的高阶形态和核心载体,能够在工业领域构建“数据-知识-决策”的智能闭环,拓宽人工智能技术在工业领域应用的深度、广度。在此背景下,摸清工业领域人工智能大模型在数据集、算力、技术等方面发展的困难与挑战,找准应对之策,已成为推动人工智能赋能新型工业化的关键。
一、我国工业大模型发展现状概述
(一)国家和各省市纷纷发力布局
国家层面,2024年7月,李强总理在江苏调研时指出,要深入推进人工智能赋能,加快设备数字化普及,大力推动“人工智能+”制造业。2024年3月,政府工作报告提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动。2023年10月,工业和信息化部等6部门联合印发《算力基础设施高质量发展行动计划》,提出结合人工智能产业发展和业务需求,开展智算中心建设,提升智能算力占比。
展开全文
地方层面,各地结合实际出台系列支持工业大模型产业发展的政策措施,2024年1月,浙江省人民政府办公厅印发《关于加快人工智能产业发展的指导意见》,提出实施“AI+未来工厂”创新引领行动,推进AI大模型在工业领域落地应用,建立完善分级诊断评估标准,引导企业数字化转型和智能化升级。2024年6月,山东省工业和信息化厅发布《关于加快大模型产业高质量发展的指导意见》,提出聚焦构建“6997”现代化工业体系、优质高效服务业新体系等,鼓励行业企业联合大模型企业主动布局特色优势行业,形成一批行业级大模型产品,助力场景级大模型产品研发。
2024年7月,上海市人民政府办公厅印发《促进工业服务业赋能产业升级行动方案(2024—2027年)》,提出聚焦人工智能在生产制造、研发设计中的落地应用,加快培育为制造业提供人工智能解决方案的供应商,开发故障分析、流程工艺等工业语料产品,推动工业大模型发展,促进制造业全流程智能化。
(二)工业大模型构建模式多样
当前,国内工业大模型构建模式呈现多元化发展趋势,为企业提供了从快速部署到深度定制的多层次解决方案。一是直接应用通用大模型,为工业企业提供知识问答、逻辑推理等服务。二是微调,用标注的工业数据集对通用大模型进行调整优化,使模型能够完成工业领域特定任务。三是检索增强生成,将通用大模型接入特定行业或企业的私有知识库(不改变大模型),在提升信任度和访问控制的基础上,实现对工业知识的理解利用。四是针对特定领域开发工业大模型,用大量有标记和无标记的工业数据集预训练出大模型,加强模型对工业通用知识的理解,实现最优性能和稳定性,但由于门槛较高,只有少数头部企业有能力开展研发。
(三)工业大模型场景探索成效显现
目前,国内大模型在工业企业中的应用已覆盖众多环节。在文档生成、知识问答等经营管理和售后服务环节,大模型应用最为广泛,大幅提升了运营效率,如海尔利用大模型自动生成家电产品说明书、宣传图文近10万条,内容制作效率提升250%以上。在辅助编程、仿真合成等研发设计环节,大模型应用也较为广泛,如讯飞星火的代码能力已经达到GPT-4Turbo的96%,在与软通动力、华为等企业的合作应用中取得良好效果。在生产制造环节,相对成熟的场景是智能检测,如中国电信基于星辰视觉大模型,面向服装纺织行业提供智能验布服务,检验准确率提升25%。
(四)工业大模型生态格局初具雏形
国内企业、行业协会纷纷发力,从模型、数据、算力等方面完善工业大模型生态。模型服务方面,阿里云基于MaaS(模型即服务)理念,打造开源共享平台魔搭,为工业企业提供灵活、易用、低成本的一站式模型服务产品,平台拥有阿里自研的通义千问等超5000个模型,支持工业企业对模型进行定制与微调,打造企业专属大模型。数据集方面,海天瑞声打造一体化人工智能服务平台,集成了200多种算法、上千个专业级数据处理工具,形成了工业质检等高质量数据集,围绕工业数据采集生成、自动标注、质检交付等提供整体数据解决方案。智源人工智能研究院发布开源数据处理工具项目FlagData,包含数据清洗、标注、压缩等功能在内的多个数据处理工具与算法,供企业自建数据集。算力方面,中国电信聚焦大模型训练场景,在上海打造全国首个AI公共算力服务平台,并构建城域毫秒级算力网络,为工业大模型训练提供高性能计算、存储、网络等云服务。
二、当前工业大模型落地应用面临的挑战
(一)工业大模型技术能力不强
工业大模型技术能力不强主要体现在跨系统整合、行业适配性、标准化供给等方面,现有工业大模型很少具备与实际生产所匹配的专业知识、复杂逻辑推理能力、任务分解能力、规划能力和不确定性推断能力,难以全面满足工业场景的复杂需求。
一是跨系统整合部署难度大。工业制造环境往往由多个系统和设备组成,来自不同的厂商,使用不同的标准和协议,将大模型技术整合到现有质量控制、工艺优化环节中,需要大量系统改造,突破多系统协调联动的技术难题。
二是不同行业定制化开发难度大。不同行业产品类型不一、零部件型号繁杂,导致工业大模型算法适配复杂、调试难度大。即使对于智能检测这类行业共性需求大的应用,也需要根据具体场景逐一适配。
三是整体性技术供给不足。工业领域各环节的场景较为碎片化,每个场景需求的方案设计、模型训练及后续维护的程序多、泛化性差,能够提供标准化、体系化稳定解决方案的工业大模型几乎没有。相比之下,各环节零散分布的判别式小模型成本投入低,推理速度快,在有限的硬件条件下能够稳定运行,支撑精准判别和决策,特别是在工业生产制造过程中应用较为广泛。腾讯研究院对当前市场上507个工业小模型和99个工业大模型应用案例的分析显示,在工业研发设计、生产制造、经营管理、产品服务环节,大模型的分布为33%、24%、32%、11%,小模型的分布为14%、57%、16%、13%。
(二)高水平工业数据集供给不足
大规模、高质量、多样化的数据集是工业大模型性能突破的核心。艾瑞咨询发布的《2024年中国工业大模型行业发展研究报告》指出,工业互联网、工业智能制造等工作,已经让部分工业领域企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程,部分场景已经准备好向基础大模型投喂的“数据原料”,但整体而言当前国内工业数据集数量、质量都不高,使得大模型的工业知识较为匮乏。
一方面,企业数据开放意愿不高。工业企业认为数据是其核心命脉,出于保密、合规等考虑不愿开源共享或市场交易,往往要求私有化部署大模型。因此,大模型厂商只能驻扎在客户车间,花费大量时间在局域网内进行私有化部署、调试,但大模型技术迭代速度快,最新版本基本以公有云的形式提供服务,在局域网内部署既浪费大量人力物力,也延缓了企业使用最新技术。另一方面,数据采集处理难度大。工业数据主要来源于生产线、传感器、控制系统、工艺设备等不同的系统与设备,涉及不同的数据格式和技术协议,缺乏统一的数据标准和质量标准,数据存在大量噪声、冗余信息,导致工业数据集质量整体不高。例如,在钢铁行业中,大模型厂商开发智能废钢定级应用从数据积累到商用耗时半年到1年,单项目数据标注量超过2万,如果有行业标准数据集,开发周期可缩短80%。
(三)工业大模型可靠性和安全性不高
在系统和数据安全方面,工业大模型系统特别是依赖网络联机的系统可能成为黑客攻击的目标,受到安全威胁,一旦出现敏感数据泄露、勒索病毒等事故或故障,后果不堪设想,且责任归属难以划分。据亚信安全监测,过去短短1年时间内,针对大模型的攻击手段已出现40种不同的类型。可靠性方面,工业生产制造对准确性和稳定性要求极高,工业大模型因为算法漏洞或者数据问题做出错误决策,即“幻觉”现象,很可能导致产品质量下降和生产线停工,甚至引发安全生产事故,给利润率本就低下的工业企业带来灾难。实时性方面,工业生产制造对实时性要求也非常高,很多工序以毫秒甚至微秒为单位,但工业产线往往没有部署足够的算力,制约了模型性能的发挥。
(四)工业大模型对能源提出更高需求
工业大模型的训练、推理等都离不开高性能GPU集群提供算力支撑,其广泛应用也对算力网络提出了更为复杂和严峻的实时性需求,未来,随着工业大模型的进一步普及应用,相应的能耗也将进一步增长,据阿里研究院测算,短期来看,2023年国内服务于大模型训练和推理的GPU算力集群消耗电力约87亿度,2024年预计消耗271亿度,同比增长超210%,占全国电力消耗的0.28%,短期内不会引发全国范围内电力短缺。
长期来看,预计到2030年,国内GPU算力集群全年电力消耗将达到3063亿度,占全国2.7%,逼近重点用能行业规模,因此,需要提前进行电力政策的统筹规划管理。智算中心高效运转离不开电力支撑,电力系统平稳运行也离不开算力支撑,统筹算力电力协同布局,有助于促进风光绿电消纳,加快实现“双碳”目标。智算中心用电需求的快速增长可能对局部电力供给带来压力,亟需提升绿电消纳水平,但目前国内绿电使用率依然偏低。
一是绿电入网、并网难,现阶段国内绿电入网技术、输配电基础设施等仍需优化完善,导致部分算力枢纽节点地区存在弃风、弃光现象。二是绿电直供难,体现在电网“过网费”机制不够灵活,源网荷储项目认证实施条件严苛。三是绿电交易流通难,跨区域绿电交易流通流程复杂、交易周期不固定,且采购成本往往高于传统电力。
(五)工业企业投资决策不畅
随着大模型技术加速向工业核心场景渗透,其降本增效价值日益凸显。然而,当前工业企业在引入大模型技术时普遍面临投资决策路径模糊、风险收益评估困难等问题,客观上制约了规模化应用进程。
一是企业认知存在误区。部分传统工业企业没有真正意识到大模型对于制造业的颠覆性影响,大而化之地使用人工智能、算力等营销词汇,利用十多年前的传统人工智能技术如机器视觉等包装概念,“新瓶装旧酒”。
二是容错机制不健全。工业企业特别是央国企对于信息系统方面建设较为谨慎,在项目立项、执行阶段需评估投入产出比,但大模型的能力边界和产业价值正处于快速迭代和摸索之中,目前难以清晰核算在特定场景的经济价值,因此企业往往持犹豫和审慎态度,一定程度上延缓了工业大模型的应用步伐。
三是经济成本较高。当前,工业企业部署、训练、维护工业大模型的成本不菲、对人才要求高,这些都需要企业追加投入并及时转化为收益,很多企业特别是中小企业难以负担。
三、我国工业大模型落地应用的对策建议
(一)夯实工业大模型技术底座
工业大模型技术底座的自主化、高效化与协同化水平直接影响规模化应用效果。亟需通过多维度技术协同创新,构建安全可靠、敏捷迭代的底层支撑能力,形成大模型、小模型融合互补、协同发展的格局。
一是加强软件、算法等技术攻关,鼓励大模型企业积极与工业企业、科研机构、高校等联合,围绕工业大数据计算框架、分布式数据库、轻量化模型、数据安全等前沿技术领域开展攻关,进行大模型数据集流通、交付技术等探索。二是提升体系化技术供给。鼓励各方开发兼容性强、适配性广的工业人工智能产品或解决方案,构建可复用的大模型开发应用工具集,提升工业人工智能的产品化程度。
三是优化模型研发流程,鼓励企业开展架构创新、模型剪枝、知识蒸馏等探索,减少工业大模型的复杂性,降低工业大模型对硬件资源的依赖,提高工业大模型训练和推理效率。四是加强开源生态建设,对标国际一流人工智能开源社区,建设国内工业领域人工智能大模型生态社区,降低工业大模型应用落地过程中的整体技术门槛,促进技术的通用性和互操作性。
(二)提升工业数据集供给质量
高质量数据集是驱动工业大模型应用突破的基础支撑,亟需通过完善标准体系、强化数据治理、创新开源开放机制,不断提升工业数据集供给质量,构建安全可信、高效流通的工业数据生态。
一是建设工业数据标准体系,探索研制工业数据采集、生产加工、质量管控、安全等标准,完善工业数据相关法律法规,保护个人隐私和企业商业秘密。
二是引导企业加大数据集建设投入,鼓励工业企业特别是链主企业结合行业智能化转型工作,加大工业数据集建设投入,实现研发、中试、生产等领域数据集的收集清洗,形成高质量工业数据集,持续向工业大模型注入行业领域专业知识。
三是探索分级分类的工业数据开放体系,鼓励各方联合建立工业数据社区、联盟等,建设分级分类的工业数据集合作机制,探索完全开源开放、联盟内部开源共享、安全可信环境中开发利用等工业数据开放形式。
四是强化工业数据集质量管控,加强工业大模型数据质量管理标准、评估工具、评测体系的研发应用、从准确性、合规性、完备性、及时性、一致性、重复性等维度全方位提升工业大模型数据集质量。
(三)加快工业算力绿色化发展
强化算力电力协同,通过算力电力的双向协同优化调度,为庞大的工业大模型算力提供有竞争力的低碳电力。
一是算力节点与电力节点协同。以国家算力枢纽节点为单位,构建源网荷储一体化等新型电力系统模式,与“东数西算”工程有效衔接,提升绿电与工商业用电的源荷匹配度,形成柔性调节能力,保障对GPU算力集群的稳定供电。
二是算力网络与电力网络协同。借鉴电力网络的布局、调度等经验,开展跨区域、跨时空的电力与算力协同调度,实现电网为算网提供电力,算网为电网提供算力,算网闲置电力反向给电网输送,形成波峰波谷的双向调节,降低用电损耗及算力成本。
三是算力市场与电力市场协同。参考电力市场建设成熟经验,推动算力价格与电力价格的交叉关联,形成算力与电力市场之间的横向交易。完善跨区域绿电、绿证交易规则,优化源网荷储项目审批流程,提升智算中心绿电使用比例。
(四)培育工业大模型发展生态
构建自主可控、开放协同的产业生态已成为推动人工智能与制造业深度融合的关键。我国工业大模型发展亟待从政策支持、算力支撑、场景牵引、生态共建等多维度协同发力,破解技术应用瓶颈,激发产业链上下游协同创新活力。
一是优化企业投资决策环境,加强宣传引导,提升工业企业对大模型技术的认知水平,通过财政补贴、税收减免等激励措施,建立容错机制,降低工业企业在大模型技术应用的经济风险。
二是加强工业智算布局,不断优化工业大模型算力网络产品和服务,降低工业企业特别是中小企业用算成本,提升智能算力普惠易用水平。
三是以大赛、案例遴选等为抓手,引导工业领域向大模型企业开放有价值的核心业务场景,打造“场景调研分析-方案设计-算法开发-应用开发-交付服务-常态化使用-复制推广”的工业大模型落地应用标杆案例。
四是推动研究出台工业大模型相关软硬件技术标准和政府采购标准,鼓励大型央企、国企和事业单位优先采购国产工业大模型软硬件产品,通过规模化应用倒逼国产大模型生态不断完善。
四、结语
本研究详细介绍了我国工业大模型在国家和地方层面的产业政策体系、模式构建、当前场景探索成效和产业生态发展情况,总结了当前工业大模型落地应用亟待解决的五方面挑战,包括跨系统整合部署等技术能力薄弱、企业数据开放意愿不高和工业数据采集处理难度大导致的高水平工业数据集供给不足、工业大模型可靠性和安全性不高、工业大模型能耗较大、工业企业投资决策不畅。
展望未来,需聚焦夯实工业大模型技术底座、提升工业数据集供给质量、推进算力绿色低碳转型、培育工业大模型发展生态等关键领域精准发力,着力加快工业大模型的研发创新和智能应用规模化落地,推动人工智能高水平赋能新型工业化,在人工智能大国竞争中形成优势,为中国式现代化构筑强大物质技术基础。
评论