• 我的订阅
  • 头条热搜
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...无法进行类人的演绎和归纳推理,它学习到的仍然是概率相关性。”张奇表示。 他提到,换一些简单题目,与训练语料不同的数据,o1-preview的结果就会变的很差。比如虽然它数学能力突出,但对9.11和9.8哪个大这种问题,第一...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...来的帮助,那么RAG将无法提升推理能力。令 表示标记的相关性,=0 表示标记 第 个token 是噪声,否则该token是相关的。令表示LLM的原始注意力层。我们假设期望的自注意力函数为:对模型的微调可以表示为其中,ΔW 表示其余项。...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
...层推理任务的查询,文档的影响力得分之间存在显著的正相关性,表明了这些文档与「需要对不同数字应用相同程序」的问题相关。研究者计算了所有 500 万个文档得分对于所有查询组合的 Pearson R 相关性(每个模型有 802 个相关...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...ntralized Arena 与 Chatbot Arena 的 “整体” 排名表现出最强的相关性。Decentralized Arena 的关键优势包括:稳健且无偏:去中心化避免了单个或少数评委模型所带来的偏见,并且不容易通过过拟合评委模型进行操控。参与竞技场的 LLM ...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...的语义相似性。这种方法有助于确保分割结果的准确性和相关性:归一化后的相似度用作权重,以加权合成最终的掩码。这个掩码在下一次迭代中有助于生成更优质的背景图片,进而引导更有效的提示生成。这能充分利用幻觉来...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...论引入知识图谱技术的也越来越多。通过知识图谱的语义相关性来提升模型内容的相关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...才能正确回答,但模型通常也能找到候选选项中的捷径或相关性,根据预训练中获得的先验知识来得出正确答案。所以MMMU-Pro在构建的时候,更加细致地考虑问题与图像之间的关联性,以及智能体是否真正理解了问题的本质,而...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...果表明,多模态大模型的可信性与其通用能力存在一定的相关性,但在不同的可信评估维度上模型表现也依然存在差异。当前常见的多模态大模型相关算法,如GPT-4V辅助生成的微调数据集、针对幻觉的RLHF等,尚不足以全面增强...……更多
为什么要重读凯恩斯
...,凯恩斯越是盛名在外,人们对他的误解也就越深。正如复旦大学经济学院韦森教授在最近所写的新作《重读凯恩斯》中所言,“尽管从世界范围来看,20世纪以来在经济学中的影响无人超越凯恩斯,但是直到今天,很少人认真...……更多
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...主题论坛上,上海科学智能研究院院长(下称上智院)、复旦大学浩清特聘教授漆远,讲述了他对于通用人工智能(AGI)和科学智能的发展判断。参与此次论坛的两院院士、国内外知名科学家也认为,AI必须具备超越简单数据处...……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...千言万语,但每个人都能倾听吗?关于图像再创造的文化相关性)这篇来自CMU的论文研究了图像跨文化再创作任务。鉴于多媒体内容兴起,翻译需涵盖图像等模态,传统翻译局限于处理语音和文本中的语言,跨文化再创作应运而...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...0。根据 OpenAI 自己的说法,使用 ChatGPT 来解决这一问题的概率大概是 0.1%。他当时非常好奇 ChatGPT 到底能解答到什么程度。之后,他自己尝试使用不同的提示词,并将不同的中间结果给到 ChatGPT,看看是否可以提高成功率。结果...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...包含大量已发表文献的数据库中,根据与输入查询的语意相关性 x检索到一组段落 ={p1,p2,…,pN},作为下一步的上下文。然后,负责生成的语言模型根据段落和输入查询x产生输出y以及相应的引文, 这个过程可以形式化表示为:其...……更多
...3等于12”。最令人惊讶的是什么?答案往往与基于逻辑和概率的推理脱节。例如,在盒子测试中,“克劳德2”有一半次数能给出正确答案,但它的每次推理看上去都带有逻辑,类似于人类的逻辑推理。更令人吃惊的是,一些大...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...具有强大的数据解释和分析能力,能够有效地从碎片化或相关性不大的数据源中得出连贯的答案。参考资料:https://arxiv.org/abs/2409.14924 ……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...工智能前沿领域的技术创新与未来发展。论坛现场论坛由复旦大学数学科学学院教授林伟主持,来自卡内基梅隆大学、牛津大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见解和实践经验,众多海内外著...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...导致问题重叠。接下来,我们使用LLM来判断问题与段落的相关性,确保这些问题能够完全通过段落中的信息回答。然后,我们将所有相关问题重写为对话语气。最后,我们会进行另一次过滤,分类并剔除那些可能过于笼统的问题...……更多
大语言模型如何宣告心理学的死亡?
...制约领域发展,盘旋上空的三个幽灵:行为主义的遗留,相关性的困惑,以及隐性知识的挑战。每一个幽灵都暗指传统心理学曾经忽略的问题,本文将从大语言模型的视角提供新的见解。行为主义的幽灵延续人类心理学的研究方...……更多
大数据分析方法在期末考试成绩分析中的运用
...件为分析工具,分别从统计分析描述、平均数和标准差、相关性分析和回归分析等方面进行论述;同时,对学生的物理期末成绩做出合理性预测,及时了解和掌握学生对知识的掌握程度,为后续的教学工作提供参考,有利于学校...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...绍主峰会新增参会的嘉宾。在首日进行的大模型峰会上,复旦大学计算机科学技术学院教授、上海市智能信息处理实验室副主任张奇将带来主题报告,联汇科技CEO兼首席科学家赵天成、VAST CTO梁鼎、蚂蚁集团资深算法专家李龙飞...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...括:回复的帮助性,无害性,可靠性,生成 / 检索文档的相关性,推理过程中每一步的可行性,以及生成文本的综合质量。Methodology:如何评判 表 1:LLM-as-a-judge 训练方法(1)微调:最近许多工作开始探索如何使用微调技术来...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...方法后 LLM 前后各维度的性能变化。在准确性、完整性、相关性、连贯性和可靠性方面,LLaMA3-8B-Instruct 和 Qwen2-7B-Instruct 取得了性能的提升(评估方法:通过 GPT-4 筛选进化前和进化后答案的 win rate)。未来工作该工作初步探索和...……更多
...CTL的高浸润与良好的治疗反应和延长的总生存率呈密切正相关性。据悉,该研究成果在线发表于知名学术期刊《Cancer Immunology Research》。(完) ……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...是识别可见字符,而无需理解它们在图像叙事中的上下文相关性。相比之下,VCR 要求模型协同利用可用的部分像素级文本提示和视觉上下文来准确地重建被遮挡的内容。这不仅测试了模型处理嵌入文本和视觉元素的能力,还考...……更多
大模型“翻车”小学题?
...科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
...样,所有大型语言模型都展现出准确性和置信度之间的正相关性。当大型语言模型对自己的决策有信心时,更有可能做出正确的选择。此外,研究人员还在个体层面上拟合了模型困惑度差异与正确性之间的逻辑回归,以及人类置...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...,此时模型无需深层理解用户的全部行为,只需提供较高相关性的推荐即可。而在智能客服场景,银行、零售、物流等企业的在线客服系统往往有高并发的用户咨询,用户问题相对简单、重复性高,不涉及复杂情感理解和多轮对...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单的事实检索能力方面,在更加重要的阅读理解和推理能力方面还有待加强。上下文...……更多
牛津团队提出多年生DToU方案,能有效检查应用程序的使用请求
...程序)是否符合 DToU 的规定。义务识别和合规性检查存在相关性。但是更软性的规定,也就是数据使用者在被赋予了数据使用权之后,还需要额外做哪些事情来满足数据提供方的规定?一个典型例子就是“如果你使用了我们的数...……更多
更多关于科技的资讯:
当5G信号如繁星般铺满城市的每个角落,基站与机房便成了支撑数字世界的“能量心脏”。然而,这些日夜运转的“心脏”也面临着一个棘手的问题
2025-08-29 06:31:00
中科健康用技术创新“榨”出全球第一滴灵芝孢子油,看中药现代化新生——二氧化碳“魔法”榨油 “捕获”中药有效成分编者按质量
2025-08-29 07:37:00
8家宁企入围“2025中国民营企业500强”,同比去年新增3家解读民企“尖子生”的跃升密码□南京日报/紫金山新闻记者 江芬芬 通讯员程太兵8月28日
2025-08-29 07:37:00
【2025数博会】从技术赋能到场景落地,大模型与智慧治理实现创新融合
生成式人工智能如何跨行业发挥力量?大模型如何与智慧治理创新融合?8月27日,在2025中国国际大数据产业博览会智慧政府及公共资源交易治理交流活动第二篇章“理论与融合”中
2025-08-28 12:19:00
【2025数博会】重庆菲利信科技有限公司总裁贝依林:贵州人工智能基础数据服务有很大吸引力
“贵州的人工智能基础数据服务和政府服务给具有很大吸引力。”重庆菲利信科技有限公司总裁贝依林,在参加27日召开的贵州数字产业生态合作交流推荐会上接受记者采访时说
2025-08-28 14:23:00
【2025数博会】上海零数科技有限公司副总裁潘林:数据流通赋能人工智能发展
“在人工智能加速融入经济社会各领域的当下,数据流通正成为驱动这一新型生产工具发展的关键引擎。”8月27日,上海零数科技有限公司副总裁潘林在2025年中国国际大数据产业博览会贵州数字产业生态合作交流推介会上说道
2025-08-28 14:24:00
直播预告|直击2025数博会:探秘六大展馆,解锁硬核“黑科技”
8月27日至30日,2025数博会专业展将在贵阳国际会议展览中心开门迎客,六大展馆共有375家参展企业,华为、百度、超聚变
2025-08-28 14:24:00
【2025数博会】中国工程院院士、清华大学教授郑纬民:AI驱动科研范式变革
“斯坦福大学《2025年AI指数报告》称,去年全球AI市场规模已突破3900亿美元,预计到2030年将达到1.8万亿美元
2025-08-28 14:24:00
【2025数博会】北京合力亿捷股份有限公司副总裁杜宏生:客服AI员工开启企业数智化旅程
“大量高重复沟通工作和情绪积累导致的客服行业高流失率问题突出,对企业和员工都是困境。”在27日上午召开的2025中国国际大数据产业博览会828精选AI企业应用方案宣讲会上
2025-08-28 14:24:00
【2025数博会】诚迈科技(南京)股份有限公司董事长王继平:与贵州共筑国产化数字生态
8月27日,在2025年中国国际大数据产业博览会贵州数字产业生态合作交流推介会上,诚迈科技(南京)股份有限公司董事长王继平介绍公司在黔布局
2025-08-28 14:24:00
果然财经|小瓶酒饮和迷你冰激淋受热捧,“以小切大”占领市场
齐鲁晚报·齐鲁壹点 张志恒点外卖时,商家附赠的那瓶掌心大小的碳酸饮料;逛超市时,冰柜里码得整整齐齐、一口就能咬下的迷你雪糕——如今的消费市场里
2025-08-28 14:29:00
8月25日,由中宣部组织的2025年“活力中国调研行”湖北主题采访活动在武汉启动,百余名记者深入武汉经开区,一系列调研报道生动勾勒出一幅“中国车谷”以科技创新为引擎
2025-08-28 14:34:00
万达影城携手淘票票助推“轮椅友好厅”惠及全国近80城
在《无障碍环境建设法》施行两周年之际,万达影城作为首席合作院线,与淘票票、阿里公益共同宣布,“轮椅友好厅”无障碍观影项目实现突破性进展
2025-08-28 15:03:00
万达电影暑期档“吃谷”挣了1个亿 爆米花桶成“新型谷子”
近日,万达电影继中期披露净利润同比激增 372.55% 后再传捷报——暑期档IP衍生品销售总额达1.06亿元人民币,比去年同期增长94%
2025-08-28 15:04:00
卧兔旗下WotoHub AI小兔数字员工行业首发,创造海外红人营销新纪元
是否大家都有体会:红人营销正从创意campaign变成重复劳动?跨境卖家有好产品、好内容,却总在执行中脱节。人力被机械性工作消耗
2025-08-28 15:35:00