• 我的订阅
  • 头条热搜
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...无法进行类人的演绎和归纳推理,它学习到的仍然是概率相关性。”张奇表示。 他提到,换一些简单题目,与训练语料不同的数据,o1-preview的结果就会变的很差。比如虽然它数学能力突出,但对9.11和9.8哪个大这种问题,第一...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...来的帮助,那么RAG将无法提升推理能力。令 表示标记的相关性,=0 表示标记 第 个token 是噪声,否则该token是相关的。令表示LLM的原始注意力层。我们假设期望的自注意力函数为:对模型的微调可以表示为其中,ΔW 表示其余项。...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
...层推理任务的查询,文档的影响力得分之间存在显著的正相关性,表明了这些文档与「需要对不同数字应用相同程序」的问题相关。研究者计算了所有 500 万个文档得分对于所有查询组合的 Pearson R 相关性(每个模型有 802 个相关...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...ntralized Arena 与 Chatbot Arena 的 “整体” 排名表现出最强的相关性。Decentralized Arena 的关键优势包括:稳健且无偏:去中心化避免了单个或少数评委模型所带来的偏见,并且不容易通过过拟合评委模型进行操控。参与竞技场的 LLM ...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...的语义相似性。这种方法有助于确保分割结果的准确性和相关性:归一化后的相似度用作权重,以加权合成最终的掩码。这个掩码在下一次迭代中有助于生成更优质的背景图片,进而引导更有效的提示生成。这能充分利用幻觉来...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...论引入知识图谱技术的也越来越多。通过知识图谱的语义相关性来提升模型内容的相关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决...……更多
大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究
...狐科技《思想大爆炸——对话科学家》栏目第31期,对话复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏。嘉宾简介:邱锡鹏,复旦大学计算机科学技术学院教授,中国计算机学会会员,国内第一个对话式语言大模型...……更多
中国专家研发针对国人肝癌预测模型 超30万名患者受益
...。沈锋教授告诉记者,该团队将该模型拓展用于慢性丙肝相关性肝癌和非酒精性脂肪肝相关性肝癌的诊断中,显示出令人满意的诊断效能。沈锋教授介绍,年龄(Age)和性别(Sex)是肝癌发生的危险因素,临床血液指标中的甲胎蛋白(A...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...才能正确回答,但模型通常也能找到候选选项中的捷径或相关性,根据预训练中获得的先验知识来得出正确答案。所以MMMU-Pro在构建的时候,更加细致地考虑问题与图像之间的关联性,以及智能体是否真正理解了问题的本质,而...……更多
...转自:解放日报本报讯(记者 俞陶然)记者昨天获悉,复旦大学自然语言处理实验室开发的新版MOSS模型已上线,成为国内首个插件增强的开源对话语言模型,支持搜索引擎、图像生成、计算器、方程求解器等插件工具。目前,...……更多
复旦大学MOSS系统负责人邱锡鹏:会有计划地推出算力更大、推理能力更强的MOSS模型 【复旦大学MOSS系统负责人邱锡鹏:会有计划地推出算力更大、推理能力更强的MOSS模型】财联社6月1日电,运行一个多月来MOSS表现如何?复旦大...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...估与人类决策和认知能力直接相关。2.与现实世界场景的相关性通过选择来自高标准的入学考试和资格考试的任务,可以确保评估结果能够反映个人在不同领域和背景下经常遇到的挑战的复杂性和实用性。这种方法不仅可以衡量...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...果表明,多模态大模型的可信性与其通用能力存在一定的相关性,但在不同的可信评估维度上模型表现也依然存在差异。当前常见的多模态大模型相关算法,如GPT-4V辅助生成的微调数据集、针对幻觉的RLHF等,尚不足以全面增强...……更多
为什么要重读凯恩斯
...,凯恩斯越是盛名在外,人们对他的误解也就越深。正如复旦大学经济学院韦森教授在最近所写的新作《重读凯恩斯》中所言,“尽管从世界范围来看,20世纪以来在经济学中的影响无人超越凯恩斯,但是直到今天,很少人认真...……更多
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...主题论坛上,上海科学智能研究院院长(下称上智院)、复旦大学浩清特聘教授漆远,讲述了他对于通用人工智能(AGI)和科学智能的发展判断。参与此次论坛的两院院士、国内外知名科学家也认为,AI必须具备超越简单数据处...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...千言万语,但每个人都能倾听吗?关于图像再创造的文化相关性)这篇来自CMU的论文研究了图像跨文化再创作任务。鉴于多媒体内容兴起,翻译需涵盖图像等模态,传统翻译局限于处理语音和文本中的语言,跨文化再创作应运而...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...0。根据 OpenAI 自己的说法,使用 ChatGPT 来解决这一问题的概率大概是 0.1%。他当时非常好奇 ChatGPT 到底能解答到什么程度。之后,他自己尝试使用不同的提示词,并将不同的中间结果给到 ChatGPT,看看是否可以提高成功率。结果...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...包含大量已发表文献的数据库中,根据与输入查询的语意相关性 x检索到一组段落 ={p1,p2,…,pN},作为下一步的上下文。然后,负责生成的语言模型根据段落和输入查询x产生输出y以及相应的引文, 这个过程可以形式化表示为:其...……更多
...3等于12”。最令人惊讶的是什么?答案往往与基于逻辑和概率的推理脱节。例如,在盒子测试中,“克劳德2”有一半次数能给出正确答案,但它的每次推理看上去都带有逻辑,类似于人类的逻辑推理。更令人吃惊的是,一些大...……更多
智商超过99.9%人类,ChatGPT到底有多聪明?
...义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...具有强大的数据解释和分析能力,能够有效地从碎片化或相关性不大的数据源中得出连贯的答案。参考资料:https://arxiv.org/abs/2409.14924 ……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...工智能前沿领域的技术创新与未来发展。论坛现场论坛由复旦大学数学科学学院教授林伟主持,来自卡内基梅隆大学、牛津大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见解和实践经验,众多海内外著...……更多
复旦MOSS大模型开源了!Github和Hugging Face同时上线
复旦大模型MOSS,正式开源了!作为国内首个开放测试的类ChatGPT产品,MOSS开源地址一放出,又冲上知乎热搜:从官网介绍来看,MOSS是一个拥有160亿参数的开源对话语言模型。它由约7000亿中英文及代码单词预训练得到,精度要求...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...导致问题重叠。接下来,我们使用LLM来判断问题与段落的相关性,确保这些问题能够完全通过段落中的信息回答。然后,我们将所有相关问题重写为对话语气。最后,我们会进行另一次过滤,分类并剔除那些可能过于笼统的问题...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...绍主峰会新增参会的嘉宾。在首日进行的大模型峰会上,复旦大学计算机科学技术学院教授、上海市智能信息处理实验室副主任张奇将带来主题报告,联汇科技CEO兼首席科学家赵天成、VAST CTO梁鼎、蚂蚁集团资深算法专家李龙飞...……更多
大语言模型如何宣告心理学的死亡?
...制约领域发展,盘旋上空的三个幽灵:行为主义的遗留,相关性的困惑,以及隐性知识的挑战。每一个幽灵都暗指传统心理学曾经忽略的问题,本文将从大语言模型的视角提供新的见解。行为主义的幽灵延续人类心理学的研究方...……更多
大数据分析方法在期末考试成绩分析中的运用
...件为分析工具,分别从统计分析描述、平均数和标准差、相关性分析和回归分析等方面进行论述;同时,对学生的物理期末成绩做出合理性预测,及时了解和掌握学生对知识的掌握程度,为后续的教学工作提供参考,有利于学校...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...方法后 LLM 前后各维度的性能变化。在准确性、完整性、相关性、连贯性和可靠性方面,LLaMA3-8B-Instruct 和 Qwen2-7B-Instruct 取得了性能的提升(评估方法:通过 GPT-4 筛选进化前和进化后答案的 win rate)。未来工作该工作初步探索和...……更多
国泰君安证券:具身智能,人工智能的下一个浪潮
...神经信号闭环系统,对小鼠的行为模式和神经信号进行了相关性分析。通过实验发现机器学习得出行为从模式到脑信号存在映射,并可以建立一个稳定模型。另外,通过构建一套基于机器学习的行为相关的神经回路发现系统,成...……更多
更多关于科技的资讯:
Roxtec电缆和管道密封技术赋能济南地下管廊 为城市生命线安全 “护航”
随着城市化的快速发展,地下综合管廊已成为城市运转不可或缺的“隐形动脉”,承担着输送能源与信息的重要任务。济南市工业北路沿线工厂众多
2025-01-03 19:52:00
华为鸿蒙next5.0来袭,新增应用锁功能
每次提到手机系统的时候,原生鸿蒙就被提及,原因是其证明了中国人独立自主、自力更生的强大精神力量,这也是华为品牌影响力能够得到很大幅度提升的关键
2025-01-03 19:58:00
中新经纬1月3日电 题:电商运营模式差异决定补贴受益程度作者 司东海 巨丰投顾高级投资顾问1月3日上午,国务院新闻办公室举行“中国经济高质量发展成效”系列新闻发布会
2025-01-03 20:57:00
得物App开放日活动,身临其境体验正品保障全流程
如今,线上购物已成为人们日常生活不可或缺的一部分,而如何在海量商品中甄选出真正值得信赖的正品,成为了每一位消费者关注的焦点
2025-01-03 21:14:00
挥杆结缘品味清雅: 国缘V9高尔夫赛事成功营销案例复盘
近日,白酒行业在经济复苏与消费场景恢复的推动下稳步发展,高端白酒市场竞争愈发激烈。在此背景下,今世缘酒业的国缘V9凭借独特的高尔夫赛事营销项目成功突围
2025-01-03 21:49:00
又一位安徽餐饮老板要IPO,老乡鸡9个月收入近50亿,有望成“中式快餐第一股”
快餐的生意越来越不好做。 紧随小菜园,又一安徽餐饮品牌冲击港交所,这次是老乡鸡。撤回上交所主板上市申请近1年半后,1月3日
2025-01-03 22:14:00
美国科研新突破:抗老“神器”PSSOPP诞生,掀起社会热议浪
长生不老,这一人类亘古以来的梦想,正逐渐在科学的助力下变为现实。全球顶尖的研发机构纷纷投入大量的人才和资源,致力于寻找青春永驻的秘诀
2025-01-03 17:01:00
与拜耳分手自建销售团队,糖尿病市场老将陆宇加盟华领医药,华堂宁未来怎么卖?
华领医药组建销售团队。 2025年开年,华领医药(02552.HK)组建销售团队有了新进展。1月1日,华领医药对外宣布
2025-01-03 17:13:00
7000mAh超大电池!真我Neo7限时回归首销价:2099元起
快科技1月3日消息,在今天下午的不良人限定版发布会上,真我Neo7宣布限时重回首销价,2099元起。这是目前2K档最热门的机型之一
2025-01-03 17:14:00
国漫典藏级定制!真我Neo7《画江湖之不良人》限定礼盒发布:2899元
快科技1月3日消息,今天下午,真我Neo7《画江湖之不良人》限定版礼盒正式发布,售价2899元(16GB+512GB)
2025-01-03 17:14:00
老外评PS5十大年度游戏:《宇宙机器人》强势夺冠 《黑神话》第六
PushSquare之前曾开启过“2024年十大PS5游戏”的用户投票,每名玩家最多可以为五款游戏投票,共计12652有效票数
2025-01-03 17:14:00
499元配置良心!王腾:REDMI 14C没做任何宣传的情况下爆火了
快科技1月3日消息,日前,REDMI百元入门新机——REDMI 14C发布,起售价仅499元,新机配置十分良心,不仅有120Hz高刷新率屏幕
2025-01-03 17:15:00
男子利用小程序Bug逃匿28万加油费:获刑4年
1月3日消息,日常生活中确实会有不少“聪明人”,善于发现利用一些漏洞来为自己谋私利,然而这种行为往往会给自己带来严重的后果
2025-01-03 17:15:00
近日,国家医疗保障局(以下简称“国家医保局”)在北京举办“五年筑基 智启未来”医保码五周年活动,渤海银行股份有限公司(以下简称“渤海银行”)受邀参加并荣获“医保码优秀合作伙伴”证书
2025-01-03 17:20:00
本文转自:人民网人民网北京1月3日电 (记者王震)2024年12月29日,由国家制造强国建设战略咨询委员会指导,中国工业经济联合会联合十多家全国性行业联合会(协会)共同举办
2025-01-03 17:36:00