• 我的订阅
  • 科技

这个大模型,真的治好了我的论文阅读障碍

类别:科技 发布时间:2024-08-13 09:40:00 来源:机器之心Pro

今年 3 月份,英伟达 CEO 黄仁勋举办了一个非常特别的活动。他邀请开创性论文《Attention Is All You Need》的作者们齐聚 GTC,畅谈生成式 AI 的未来发展方向。

「我们所处的领域如今所享有的一切都可以追溯到那一刻…… 你们改变了世界……」黄仁勋在现场说道。

这个大模型,真的治好了我的论文阅读障碍

对于 AI 这种科研导向的行业来说,下一次改变世界的机会,可能也藏在某篇论文里。

因此,我们在这个圈子里看到了一个不寻常的现象:一些非技术背景的 CEO 们也开始熬夜读起了论文,希望借此来降低决策的试错成本。

CEO 尚且如此,领域内的其他从业者就更不用说了。前段时间,OpenAI、谷歌、Meta 连放大招,一些创业公司也在不断推出新模型、新方法,相信很多从业者都会感觉论文多到看不过来。

把论文丢给 AI 去总结是现在常用的阅读方法,但很多 AI 总结的内容缺乏清晰的层次以及对于创新点、局限性的详细描述,我们需要经过几轮追问才能形成对于论文的完整认知。而且,一些关键的模型架构图、实验结果图还要自己去论文里找,实际节省的时间非常有限。

在腾讯「元宝」的最近一次更新中,我们看到了这些问题的解决方案。他们新推出的「深度阅读模式」支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。

为了验证这一新功能的效果,机器之心进行了一手实测。

论文「精读」,精在哪儿?

用 AI 读论文是一种怎样的体验?很多时候是:你丢给它一个 PDF,它返回一段总结 + 若干条概述(有时候可能高达 10 条)。这些信息确实有帮助,但有时候,你很难分清哪些是亮点,以及论文解决了什么、没解决什么,有哪些核心问题值得细看。

我们实测发现,「元宝」是通过提供一系列模块化、结构化信息来解决这些问题的。

以我们测试的一篇 SIGGRAPH 论文为例。如果你直接把论文丢进去,它返回的总结和其他 AI 区别不大。不过,只要你耐心往下拉,就会看到一个「深度阅读该文档」的按钮,这才是「一键直达」论文精读的开关。

这个大模型,真的治好了我的论文阅读障碍

与之前总结论文的界面不同,精读页面会把论文拆解得非常有层次,研究背景、研究方法、实验设计、结果分析、总体结论各自被组织成一个模块,很像机器之心平时介绍论文的布局。所有这些都可以通过左边的大纲迅速跳转。

这个大模型,真的治好了我的论文阅读障碍

别看每个模块字不多,其实这些字是非常有信息量的。比如在研究背景这个模块,「研究难点」段落仅用三个短句就描述了四个难点,「相关工作」更是对第二章「related work」的高度浓缩,一段话就把该领域的主要技术路线介绍清楚了。所以,在读完这个模块之后,我们能基本搞清楚论文研究的是一个什么问题,面临的是怎样一个研究现状。

除了这些常规的结构化信息,元宝的精读还有一个令人眼前一亮的设计 ——它会把论文的优点与不足列出来,方便研究者迅速了解自己能从这篇论文中学到什么,还有什么问题值得继续研究。

这个大模型,真的治好了我的论文阅读障碍

这个大模型,真的治好了我的论文阅读障碍

为什么这个功能如此重要?中国台湾清华大学教授彭明辉在关于论文阅读的一篇文章中曾经写道,论文和课本不同,课本会提供别人整理、组织好的系统性知识,而论文要求读者自己从无组织的知识中检索、筛选、组织知识。其中,分析既有研究优缺点的能力尤其重要,这是批判性思维的关键部分,也是学术研究中自我提升的重要途径。元宝通过快速分析和总结论文的优缺点,可以帮助研究者节省大量筛选和初步理解的时间,使他们能够更快地聚焦于与自己研究直接相关的论文。

不过,如果你觉得前面这些信息太繁琐,你也可以直接跳转到最后的「关键问题与解答」模块。这里会列出几个最关键的问题,让你快速了解到论文的价值,进而判断是否值得花时间去读原文。当然,之前的很多 AI 助手也会在答案末尾呈现一些关键问题,点一下就能得到答案,但如果你是一名初学者或者跨学科背景的读者,你可能不太容易判断哪些问题比较关键。元宝这种直接呈现的方式感觉更加直观。

这个大模型,真的治好了我的论文阅读障碍

原图原数,谁说 AI 读论文不能配图?

在读论文时,很多人都有一个习惯,一边看图,一边看论文描述。这样理解起来更快、更容易。但是,现在市面上大部分 AI 应用返回的都是文字结果,想看图的话需要自己去原文里找。

我们在测试中发现,元宝是为数不多的直接把论文图截出来并放到段落对应位置的 AI。比如,如果在某个模块讲架构,那它会把对应的架构图放上:

这个大模型,真的治好了我的论文阅读障碍

这个大模型,真的治好了我的论文阅读障碍

如果在某个模块讲实验结果,那它会把对应的图表放上:

这个大模型,真的治好了我的论文阅读障碍

这个大模型,真的治好了我的论文阅读障碍

众所周知,大模型的幻觉问题现在还没有办法完全解决。因此,这种原图原数的呈现其实是一种更加可靠的输出方式,方便读者随时验证模型的答案,在用作参考时更加保险。

此外,我们还发现,如果你有写博客等对外输出的需求,元宝还可以帮你绘制图表,而且你不需要告诉它数据去哪里找,它能自己定位到论文中的相关表格,并将数据提取出来进行绘制。这一功能可以通过精读页面右侧的「提问」按钮来唤起。

随时随地想读就读,谁说读论文障碍重重?

除了结构化的信息和图文并茂的输出,我们在测试中还发现,元宝其实有一些非常实用的小功能,能让读论文这件事变得更加方便。

首先是划词翻译和搜索,这是「原文」阅读界面的两个实用小功能。划词翻译可以帮助英语不好的读者随时随地扫清语言障碍,划词搜索则更进一步,像是把元宝的搜索功能做成了一个插件,可以随时搜相关信息。而且,元宝给出的解释不只是简短的总结,还有模块化的展开,真是把「结构化」、「有信息量」做到每一个细节里了。

其次是「离线阅读」。这个功能的实用之处在于:它可以让你在「飞行模式」下回看精读内容及原文,不浪费一点碎片时间。这让航空公司在与高铁的竞争中扳回一局。说不定,研究者们的下一个灵感就是在飞机上回看精读时产生的呢。

最后一个小功能是「计算器」。前段时间,AI 因为分不清 9.9 和 9.11 哪个大而引发了很多讨论。在元宝中,我们发现它集成了计算器功能,能够确保根据准确的计算结果来生成答案。这种功能在我们阅读实验数据时非常有用。

长文精读的背后:原来有专家指导

根据官方信息,腾讯元宝的这次升级主打「长文精读」,可原生支持最长近 50 万字的输入。我们在测试中用到的论文远远没有达到这个长度,日常所接触的论文大多也达不到。所以用元宝来精读论文,大部分情况下上下文窗口都是够用的。它的模块化、图文并茂输出以及划词搜索、翻译等小功能也让读论文这件事真正变得方便、高效,向着「实用性」又迈近了一步。

这种进化离不开其背后模型 —— 腾讯混元大模型的升级。据悉,为了在专业领域中提升模型的专业性和实用性,腾讯混元团队专门邀请领域专家概括各专业领域的核心技能,并制定了专业问题的回答标准,使得模型能够作为真正的领域专家来提供服务。所以我们用下来就感觉,元宝是知道论文读者需要什么信息以及信息应该如何呈现的。

除了论文,这个新功能还可以用来精读财报、研报等长文本。在这些场景中,它可以从多个维度梳理信息,根据报告内容生成杜邦分析图等专业图表,让不懂这些文件的人也能看懂企业的财务状况等信息。不过,就读论文这个场景来说,元宝依然存在一些改进空间,比如在阅读原文界面缺乏完整的原文 - 译文对照,对公式的识别有时不够准确等。我们也希望元宝能在未来的更新中改进这些问题。

但作为一款推出仅两个多月的应用,腾讯元宝的表现已经有点超出预期。它的进化轨迹让我们看到,大模型将如何一步一步变为新的生产力。我们也期待这个 APP 能给我们带来更多惊喜。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-13 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

CVPR最佳论文:大模型成就端到端自动驾驶|焦点分析
...关键在于,提出了一个感知决策一体化的自动驾驶通用大模型UniAD。大会官方组委会认为,论文提出的端到端感知决策一体框架,融合了多任务联合学习的新范式,使得进行更有效的信息交换
2023-06-25 08:52:00
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉
2024-08-09 09:38:00
腾讯混元助手app“腾讯元宝”5月30日发布
...AI产业应用峰会上,腾讯预告将在5月30日发布基于混元大模型的面向C端(消费者端)的助手App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合
2024-05-19 01:08:00
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
...、任意宽高比、不同风格、不同运动幅度的视频,其衍生模型还能够完成视频扩展、视频回溯的功能…… 这便是 360AI 团队和中山大学联合研发的 FancyVideo
2024-08-27 09:52:00
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例
2024-09-26 13:41:00
科学家开发可提高3D感知能力的模型,实现四足机器人自由行走
...有数十年。在以往的研究手段中,研究人员往往采用基于模型的方法开发神经网络控制器。但是,这类方法无法在那些现实世界里没有见过的环境中得到应用。近年来,为了获得更好的泛化性和鲁棒
2023-09-12 14:20:00
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...前在寻找 2025 fall 博士入学机会。最近,lvmin 带来了最新模型 Paints-UNDO。这款 AI 生成工具可以根据图片还原整个绘画过程
2024-07-31 09:39:00
扩散模型和transformer梦幻联动一举拿下新sota
“U-Net已死,Transformer成为扩散模型新SOTA了!”就在ChatGPT占尽AI圈风头时,纽约大学谢赛宁的图像生成模型新论文横空出世
2022-12-24 18:10:00
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
...声,AI应用市场的火热态势依旧不减。30日,基于混元大模型的AI助手App“腾讯元宝”上线,标志着BAT终于在AI消费C端应用领域聚首。据介绍,自2023年9月首次亮相以来,
2024-05-31 18:07:00
更多关于科技的资讯:
从单一爆款到多元化产品矩阵 解码东诚大健康协同发展方程式
大众网记者 王丽 烟台报道在老龄化加速与健康消费升级的双重浪潮下,中国大健康产业正迎来黄金发展期。作为为国内原料药领域企业拓展大健康领域的标杆
2025-08-07 23:59:00
烟台银行数字化转型再提速 获评“数智化转型先锋企业”
大众网记者 李慧 通讯员 李东霞 烟台报道近日,由金科创新社主办的“2025金融科技创新发展论坛暨第八届金融科技管理人年会”在成都举行
2025-08-07 15:23:00
全球销量增20%,份额净增1.2pct!海尔空调郑州发布新成果
持续的高温炙烤与“以旧换新”政策叠加,让今年的空调市场格外火热。面对行业普遍面临的流量枯竭、行业内卷、高运营成本三大挑战
2025-08-07 15:36:00
强冷必然不舒适?海尔云溪“性能神机”两者兼得
长久以来,空调行业似乎藏着一个隐形难题:想拥抱快速制冷的强劲体验,就得忍受冷风直吹的不适;若追求柔和风感,又难免要和制冷效率妥协
2025-08-07 15:38:00
AI空调陷入红海!海尔空调率先主导AI空调标准领先一步
夏天离不开空调,但现在的“AI空调”是不是让你有点懵?语音喊半天它听不懂你的方言?功能按键一大堆,真正有用的没几个?宣传说得天花乱坠
2025-08-07 15:38:00
海尔空调主导制定行业首个AI空调标准
在人工智能技术重塑空调行业的浪潮中,市场涌现大量“AI概念”产品。然而,在快速发展过程中,部分产品未能真正聚焦用户对“智能便捷 + 健康舒适”的核心需求
2025-08-07 15:39:00
医渡科技多篇高质量科研论文见刊,“产品+服务”模式成效显著
近一年,国内AI医疗头部企业医渡科技(2158.HK)在“AI for Science”浪潮中持续发力,深度融合AI技术与疾病洞察力
2025-08-07 15:47:00
营养师团队深度护航,燕教授助力经销商突破事业瓶颈
在健康产业蓬勃发展的今天,经销商们既面临着广阔的市场机遇,也承受着日趋激烈的竞争压力。如何精准把握消费者需求、高效解决服务过程中的疑难问题
2025-08-07 15:47:00
新华网北京8月7日电(韩永先)6月25日,宁德时代(300750.SZ)以不正当竞争纠纷为由,对海辰储能等公司发起的专利技术型诉讼即将在8月12日开庭审理
2025-08-07 15:47:00
华鼎冷链赋能北京餐饮冷链 构建京津冀快速冷链配送网
在餐饮连锁化率突破20%的背景下,北京餐饮市场对冷链运输的需求呈现精细化、高效化特征。作为专注冷链物流基础设施建设的服务商
2025-08-07 15:47:00
企鹅获艾媒咨询“中国户外羽绒服开创者”等多项市场地位确认
近期,企鹅获全球领先的新经济产业第三方数据挖掘和分析机构iiMedia Research(艾媒咨询)授予的“中国户外羽绒服开创者”“企鹅·专注保暖服饰69年”双项市场地位确认
2025-08-07 15:47:00
全民健身日来袭!墨迹天气“AI 生活指数”守护全民健康,让运动更科学!
古语有言,冬练三九,夏练三伏。许多喜欢健身的人都将其奉为圭臬。然而,当运动健身逐渐成为全民共识,天气状况却常常成为人们体重管理计划外的“绊脚石”
2025-08-07 15:47:00
“永动力”品牌全面升级,永升服务打造物业行业“人才富矿”
当前,物业服务行业正面临新一轮转型升级,人才作为推动行业发展的核心动力,其专业能力和服务力直接决定了服务质量与客户满意度
2025-08-07 15:47:00
资管精细化时代,破解运营成本四大困局
在租金增长乏力与国资保值增值的双重压力下,资产运营类企业站在了从"粗放"向"精益运营"转型的十字路口。其中,运营成本的精细化管控成为关键突破口
2025-08-07 15:47:00
微信官方重申:无已读功能,以后也不会有
8月7日,微信官方重申,微信从一开始就没有已读功能,以后也不会有。“微信已读功能”这个话题,年年有人问,年年上热搜,年年在辟谣
2025-08-07 16:12:00