• 我的订阅
  • 科技

腾讯推出 DRT-o1 系列 AI:长链思考推理实现文学翻译“信达雅”

类别:科技 发布时间:2024-12-27 09:39:00 来源:IT之家

IT之家 12 月 26 日消息,腾讯研究院最新推出了 DRT-o1 系列模型,主要通过长思维链(long chain-of-thought,简称 CoT),更能理解比喻和隐喻等,从而提高文学作品的翻译质量。

项目背景

IT之家注:神经机器翻译(NMT)在处理日常文本翻译方面已取得显著进展,但在翻译文学作品时,特别是隐喻和明喻等修辞手法时,仍面临巨大挑战。

这些表达通常蕴含深厚的文化和语境含义,简单的直译往往无法准确传达其内涵,而腾讯开发的 DRT-o1 系统,为解决这一难题提供了新的思路。

项目介绍

研究人员从古腾堡(Project Gutenberg)计划中选取 400 本公共领域英文书籍,提取 577600 个句子,并筛选出 63000 个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。

DRT-o1 采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供修改建议,评估员则根据预设指标对翻译质量进行评分,通过反复迭代,不断提升翻译质量。

工作流程包括三个主要步骤:

关键词翻译:翻译者首先识别句子中的关键词,并提供它们的翻译。

初步翻译:然后,翻译者根据源句子和关键词的双语对应关系提供一个初步的翻译。

翻译精炼循环:在精炼循环中,顾问评估前一步的翻译并提供反馈,评估者根据预定义的评分标准给出整体评分。翻译者根据反馈和评分提供新的翻译。当评分达到预定义的阈值或迭代次数达到最大值时,循环停止。

最终的翻译结果会由 GPT-4o 进行润色,确保流畅性和可读性,最终数据集包含 22264 个经过深度思考的机器翻译样本。

腾讯推出 DRT-o1 系列 AI:长链思考推理实现文学翻译“信达雅”

腾讯推出 DRT-o1 系列 AI:长链思考推理实现文学翻译“信达雅”

开发者提到了一个例子,原文是:

The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.

这句话中的“struck her all of a heap”是一个成语,表示某事对她产生了强烈的影响。DRT-o1 模型通过长链思考过程,最终将其翻译为:

母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。

这个翻译不仅传达了原文的意思,还保留了原文的情感色彩。作为对比,IT之家附上谷歌翻译如下:

母亲双脚撑在凳子上,似乎想弄清楚这个答案的真相,其女性的深刻性让她大吃一惊。

Deepl 的翻译如下:

母亲把脚支在凳子上,似乎想弄清这个答案的来龙去脉,而这个答案的女性化深刻性让她茅塞顿开。

DRT-o1 系列共有 DRT-o1-7B 和 DRT-o1-14B 两个规模版本。

实验结果表明,与 Qwen2.5-7B-Instruct 相比,DRT-o1-7B 的 BLEU 分数提高了 8.26 分,CometScore 提高了 3.36 分;与 Qwen2.5-14B-Instruct 相比,DRT-o1-14B 的 BLEU 提高了 7.33,CometScore 提高了 1.66。

腾讯推出 DRT-o1 系列 AI:长链思考推理实现文学翻译“信达雅”

腾讯推出 DRT-o1 系列 AI:长链思考推理实现文学翻译“信达雅”

DRT-o1-7B 的性能甚至超过了更大的模型 QwQ-32B,BLEU 分数高出 7.82 分,CometScore 高出 1.46 分,展现了其在处理复杂语言结构方面的强大能力。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-27 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

人工智能翻译助力网文“一键出海”
...降到人工翻译的1%中文翻译本来就难,文学翻译更难。“信达雅”是文学翻译的基本标准,网络文学翻译也不例外。在中国社科院研究员陈定家看来,网文在翻译上要尽量满足三个标准:准确性、
2024-01-06 03:45:00
一套书,一人高的审校样
...仍有提升优化空间的译文进一步润色修改,力求译文更为信达雅。四本书近1000页,出版之后我把所有的审校样汇集一处,摞起来足有一人高,由此可见这套书翻译、编辑、出版过程中我们经历
2024-06-25 10:16:00
本文转自:荆门日报想锻炼孩子的逻辑推理能力?这些侦探小说适合青少年阅读□明天前不久与一位高考考生家长聊天,说起他家的孩子物理获得满分的体会,这位家长说孩子从小爱看侦探小说,所以逻
2023-07-31 08:38:00
书讯 |《妙探寻凶》全世界聪明的人都在玩!
...创了剧本杀与数独游戏结合的独特玩法,一上市就引起了推理迷们的轰动。本书的玩法很简单,你将化身为推理学院毕业生洛基克(Logico),闯入一个疑云重重的新世界。这里有100起谋
2025-05-14 10:41:00
...在世界文学史上影响深远。他被誉为世界侦探小说之父、推理小说鼻祖和科幻小说开山。连香港和内地不久前隆重纪念百岁诞辰的金庸金大侠,也曾受到爱伦·坡的启发,他的小说《连城诀》中“砌
2024-05-23 07:24:00
我们当然不能把机器人只视为“钳子”
...品才能达到科学性与通俗性、现代性与历史感、前瞻性与深刻性的统一,对其他学科产生重大影响。不过,幻想终究是幻想。科幻作品虽然有预见,有启发,终究无法替代严肃的科学和哲学研究的结
2023-01-31 04:27:00
...营造良好的文化氛围和社会环境。对于译者而言,在英语文学翻译的过程中不仅需要了解文学作品创作的历史背景,掌握中英文在不同语境下的表达方式,以确保译文的准确性,还需要在译文中准确
2023-07-11 05:48:00
□南京日报/紫金山新闻记者王峰作为世界文学的重要组成部分,中国文学与世界文学早已“我中有你,你中有我”,深刻形塑着彼此的面貌。文学顺利“走出去”“请进来”,与从事翻译工作的“中介
2025-07-20 09:56:00
...。我们在读这些作品的时候,既是在读原作者,更是在读翻译者。翻译和文学翻译是有着本质区别的。从翻译到文学翻译,译者决定了关键的飞跃。雅努斯资助计划恰恰是把文学翻译的一个主体照亮
2024-04-25 22:47:00
更多关于科技的资讯:
第八届进博会推出入境支付服务台,上海境外来华用户微信支付消费笔数同比增长160%
11月5日,第八届中国国际进口博览会(以下简称“进博会”)开幕。本届进博会将有155个国家、地区和国际组织参与,4108家境外企业参展
2025-11-06 20:20:00
上市“后备军”,钟楼+2!
近日,江苏省科技厅公布2025年度省科技企业上市培育计划拟入库企业名单,常州市共5家企业入选,其中钟楼区有2家,分别是
2025-11-06 09:09:00
□南京日报/紫金山新闻记者何洁实习生杨久久“人工智能+”专项赛中荣获特等奖!11月3日,在第十九届“挑战杯”中国移动全国大学生课外学术科技作品竞赛中
2025-11-06 07:46:00
记者走基层|巧搭“数字积木” 智绘梦想花园
10月29日,承德图布斯科技集团有限公司技术人员正在调试设计图。 河北日报记者 陈宝云摄10月29日,在承德图布斯科技集团有限公司(以下简称“图布斯公司”)的研发中心
2025-11-05 08:12:00
□曹清华党的二十届四中全会提出,实施新时代立德树人工程,促进思政课堂和社会课堂有效融合,加强体育、美育、劳动教育,完善教育评价体系
2025-11-05 08:16:00
2025年沪江网校课程质量高于预期:退费无忧+承诺与践行一致!
一、沪江网校简介为沪江教育旗下品牌,沪江网校自 2009 年成立以来,始终聚焦外语学习者需求,提供网校一对一,凭借专业教学服务与多元课程体系
2025-11-05 14:45:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》显示,2024年我国生成式引擎优化(GEO)市场规模已达47亿元
2025-11-05 14:47:00
在智能体产业快步迈入规模化的当下,南京正以软件产业的深厚积淀、政策生态的精准培育、应用场景的丰富储备,抢占AI科技革命新高点前几天
2025-11-05 15:06:00
Openloong开源社区亮相ROSCon China 2025大会,为智能开源注入新活力
10月31日至11月1日,ROSCon China 2025在上海虹桥新华联索菲特大酒店成功举办。这一汇聚了全球ROS领域顶尖专家与开发者的年度盛会
2025-11-05 15:29:00
职场“反内卷”调研报告 干货多多
近日,智联招聘《职场“反内卷”调研报告》,探究职场人对于“反内卷”的真实态度与选择,了解企业的相应举措。今年“多家知名企业实施强制下班”的新闻冲上热搜
2025-11-05 15:32:00
鲁网11月5日讯“真没想到,资金难题这么快就解决了!东平农商银行的‘同心乐商贷’真是及时雨,我的蛋糕房终于要开起来了。”近日
2025-11-05 15:55:00
中国联通(青岛)智算中心DC1获评“2025年度国家绿色数据中心”
鲁网11月5日讯10月27日,工业和信息化部节能与综合利用司发布《2025年度国家绿色数据中心名单公示》,中国联通(青岛)智算中心DC1荣获“2025年度国家绿色数据中心”称号
2025-11-05 15:57:00
10月19日至20日,2025世界VR产业大会在南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势
2025-11-05 17:44:00
语言、技能与数字化:培生亮相CACIE 2025,共筑未来教育新生态
2025年10月29日至11月1日,第26届中国国际教育年会(CACIE)在北京国家会议中心举行。全球终身学习公司培生(FTS: PSON
2025-11-05 18:00:00
找对 “充电站”,心理从业者进阶不迷路!灵动生活集团幸福心理商学苑全维护航
“考下资格证却接不到个案,能做咨询却不懂怎么运营工作室”—— 这是国内超 70% 心理从业者入行后都会遇到的 “成长困境”
2025-11-05 18:01:00