AI训练师走红:给大模型当老师,高需求岗位月薪三五万
2025-02-27 14:26 北京日报客户端
自从大模型诞生,这项工作变得复杂许多。“现在任务类型多种多样,除了文本以外,还可能有图像、音频等,大模型根据语料推理出来的答案也更加不可控。”小磊提到,DeepSeek的出现也给行业带来很大变化。“过去大家都在堆语料,觉得越多越好,但现在要打个问号,思考是不是应该调整方向。”小磊说,以往做小模型的知识库构建时也曾遇到过类似问题,“一开始确实堆的知识越多效果越好,但超过临界值以后,反而会出现意图缠绕,知识变得混淆不清。”
尽管大模型的功能日益强大,但小磊发现问题也逐渐凸显。“大模型确实很擅长公文写作,只是精准度依然有限。像央国企的公文,通常要求比较高,大模型暂时还很难达到这个标准。”
此外,“AI幻觉”也成为备受关注的热门话题。“大模型在回答时出现错误,甚至‘一本正经地胡说八道’,背后原因可能是多种多样的,其中就包括语料的质量问题。”小磊说,需要针对案例进行排查,确认到底是哪个环节出了问题,然后再调整大模型本身的策略。
为了提升语料的质量,小磊会严格筛选可靠信源。“比如,文本类主要选择权威新闻、期刊和实体书等,而不是一些营销号的内容。”在标注过程中,小磊也会对标注人员进行规范培训,要求他们按照标准流程进行信息采集和处理。同时,团队还会参考其他大模型的回复,“相互借鉴,不断优化自己的模型。”