济南出台一揽子扶持政策:“喂养”人工智能,培育数据标注产业
2025-09-20 16:10 大众日报
“专家标注的数据,投喂出来的大模型就是专家水准,实习生标注的数据,最终训练出来实习生水平。”在历下区医疗数据标注产业基地内,山东宣驰信息科技有限公司负责人宋勇表示,数据决定了大模型的性能上限。他从医科院校招聘了上百名临床医学的大学毕业生,为客户标注医学数据。“比如我们这个项目是识别标注钙化灶,客户拿来训练大模型用于肺癌早筛。不能标错,必须医学专业的来做。数据合格率保持在98%以上。”他们之前接的金融数据标注业务,则要求一本以上金融专业、三年以上券商从业经验。当AI能力越强,对数据规模、质量的要求就越高,对标注员的知识背景和专业能力要求也随之攀升。
宋勇服务的客户多数是阿里、字节跳动、腾讯等互联网大厂,规模小了接不住大单、急活。在济南市大数据局和历下区政府的支持下,他开始牵头孵化数据标注产业基地,抱团发展,目前已经成功培育出7家企业,从业人员300多人,预计到明年年底能达到1500人的规模。宋勇计划,通过争取卫健系统的支持,发展高技术含量、高知识密度、高价值应用的医学数据标注业务,积极参与制定行业的团体标准、地方标准和国家标准,摆脱“劳动密集型产业”标签。