我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
近日,阿里巴巴(中国)有限公司申请公布“一种基于思维链训练大型语言模型的方法、装置和设备”专利。专利摘要显示,本发明实施例中,通过获取多个初始采样数据,初始采样数据包括图像、图像的辅助文本信息以及图像的标准审核结果;根据每个初始采用数据生成思维链数据,并确定思维链数据集合;根据思维链数据集合对基础大型语言模型进行全量微调,确定中间大型语言模型;根据中间大型语言模型以及多个所述初始采样数据,迭代生成多个中间思维链数据;进而根据预先设置的奖励函数,确定各所述中间思维链数据的奖励数值;最后采用组相对策略优化算法GRPO对所述中间大型语言模型进行强化学习,确定目标大型语言模型。通过上述方法,可以提高大型语言模型的可解释性和审核精度。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2026-02-13 20:45:04
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: