流水线开跑,大模型量产!走进浪潮探访国内首个人工智能模型工厂
2025-09-17 09:09 大众新闻·大众日报
实际上,它们也遵循着同样的生产逻辑——将复杂生产过程拆分为若干简单工序,由特定“工人”完成,从而提升生产效率。
以一件市民服务热线大模型订单生产为例。
相关数据首先汇入数据车间。
数据车间外的显示屏上,展示着订单数据多维度的统计指标。点击原始数据的分类占比,资讯类为60%,建议类仅为0.2%。
真实世界生成的数据往往并不均衡。市民服务热线收集到的信息绝大多数是咨询、求助,投诉、建议很少。数据不均衡会严重降低大模型的准确度。
数据车间需要做的,除了抽检、清洗、脱敏等常规处理,重要的一环就是增广——补齐“瘸腿”的数据。
举个例子。系统会自动从建议类中选取一条“拓宽养老金发放渠道”,在其基础上延伸到拓宽住房公积金、失业保险金、伤残补助金等发放渠道,数据就可以实现“一变多”。
再看数据占比:经过增广,这件订单的6类数据占比全部被调整至14%-15%,成为生成模型的合格原料。
处理后的数据进入模型车间。模型车间是整个工厂的核心区域,主要任务是训练模型,即通过各类工具模型的使用将数据训练为满足用户需求的模型产品。
与一般数据中心配置的2.5千瓦处理器标柜不同,这里配备的是50千瓦的“大块头”——无论是数据处理还是模型训练,都需要大量的算力支撑。模型工厂布局了2000多台服务器,超1000P的智算算力。
最快数小时的训练完成后,模型初现雏形。但这还不是最终产品。