• 我的订阅
  • 头条热搜
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...无法进行类人的演绎和归纳推理,它学习到的仍然是概率相关性。”张奇表示。 他提到,换一些简单题目,与训练语料不同的数据,o1-preview的结果就会变的很差。比如虽然它数学能力突出,但对9.11和9.8哪个大这种问题,第一...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...来的帮助,那么RAG将无法提升推理能力。令 表示标记的相关性,=0 表示标记 第 个token 是噪声,否则该token是相关的。令表示LLM的原始注意力层。我们假设期望的自注意力函数为:对模型的微调可以表示为其中,ΔW 表示其余项。...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...ntralized Arena 与 Chatbot Arena 的 “整体” 排名表现出最强的相关性。Decentralized Arena 的关键优势包括:稳健且无偏:去中心化避免了单个或少数评委模型所带来的偏见,并且不容易通过过拟合评委模型进行操控。参与竞技场的 LLM ...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...的语义相似性。这种方法有助于确保分割结果的准确性和相关性:归一化后的相似度用作权重,以加权合成最终的掩码。这个掩码在下一次迭代中有助于生成更优质的背景图片,进而引导更有效的提示生成。这能充分利用幻觉来...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...论引入知识图谱技术的也越来越多。通过知识图谱的语义相关性来提升模型内容的相关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...才能正确回答,但模型通常也能找到候选选项中的捷径或相关性,根据预训练中获得的先验知识来得出正确答案。所以MMMU-Pro在构建的时候,更加细致地考虑问题与图像之间的关联性,以及智能体是否真正理解了问题的本质,而...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...果表明,多模态大模型的可信性与其通用能力存在一定的相关性,但在不同的可信评估维度上模型表现也依然存在差异。当前常见的多模态大模型相关算法,如GPT-4V辅助生成的微调数据集、针对幻觉的RLHF等,尚不足以全面增强...……更多
为什么要重读凯恩斯
...,凯恩斯越是盛名在外,人们对他的误解也就越深。正如复旦大学经济学院韦森教授在最近所写的新作《重读凯恩斯》中所言,“尽管从世界范围来看,20世纪以来在经济学中的影响无人超越凯恩斯,但是直到今天,很少人认真...……更多
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...主题论坛上,上海科学智能研究院院长(下称上智院)、复旦大学浩清特聘教授漆远,讲述了他对于通用人工智能(AGI)和科学智能的发展判断。参与此次论坛的两院院士、国内外知名科学家也认为,AI必须具备超越简单数据处...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...千言万语,但每个人都能倾听吗?关于图像再创造的文化相关性)这篇来自CMU的论文研究了图像跨文化再创作任务。鉴于多媒体内容兴起,翻译需涵盖图像等模态,传统翻译局限于处理语音和文本中的语言,跨文化再创作应运而...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...0。根据 OpenAI 自己的说法,使用 ChatGPT 来解决这一问题的概率大概是 0.1%。他当时非常好奇 ChatGPT 到底能解答到什么程度。之后,他自己尝试使用不同的提示词,并将不同的中间结果给到 ChatGPT,看看是否可以提高成功率。结果...……更多
...3等于12”。最令人惊讶的是什么?答案往往与基于逻辑和概率的推理脱节。例如,在盒子测试中,“克劳德2”有一半次数能给出正确答案,但它的每次推理看上去都带有逻辑,类似于人类的逻辑推理。更令人吃惊的是,一些大...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着...……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...工智能前沿领域的技术创新与未来发展。论坛现场论坛由复旦大学数学科学学院教授林伟主持,来自卡内基梅隆大学、牛津大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见解和实践经验,众多海内外著...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...导致问题重叠。接下来,我们使用LLM来判断问题与段落的相关性,确保这些问题能够完全通过段落中的信息回答。然后,我们将所有相关问题重写为对话语气。最后,我们会进行另一次过滤,分类并剔除那些可能过于笼统的问题...……更多
大语言模型如何宣告心理学的死亡?
...制约领域发展,盘旋上空的三个幽灵:行为主义的遗留,相关性的困惑,以及隐性知识的挑战。每一个幽灵都暗指传统心理学曾经忽略的问题,本文将从大语言模型的视角提供新的见解。行为主义的幽灵延续人类心理学的研究方...……更多
大数据分析方法在期末考试成绩分析中的运用
...件为分析工具,分别从统计分析描述、平均数和标准差、相关性分析和回归分析等方面进行论述;同时,对学生的物理期末成绩做出合理性预测,及时了解和掌握学生对知识的掌握程度,为后续的教学工作提供参考,有利于学校...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...是识别可见字符,而无需理解它们在图像叙事中的上下文相关性。相比之下,VCR 要求模型协同利用可用的部分像素级文本提示和视觉上下文来准确地重建被遮挡的内容。这不仅测试了模型处理嵌入文本和视觉元素的能力,还考...……更多
大模型“翻车”小学题?
...科生。实际上语言模型在这样的数据训练过程中学到的是相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...,此时模型无需深层理解用户的全部行为,只需提供较高相关性的推荐即可。而在智能客服场景,银行、零售、物流等企业的在线客服系统往往有高并发的用户咨询,用户问题相对简单、重复性高,不涉及复杂情感理解和多轮对...……更多
...CTL的高浸润与良好的治疗反应和延长的总生存率呈密切正相关性。据悉,该研究成果在线发表于知名学术期刊《Cancer Immunology Research》。(完) ……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单的事实检索能力方面,在更加重要的阅读理解和推理能力方面还有待加强。上下文...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...排序的量化分数。图 B 展示了自动指标和人类评估之间的相关性,其中 k 代表拟合直线的斜率,t 代表坎德尔相关系数。公开英文评测基准模型测评为了在英语基准测试上与现有的大型语言模型进行公平比较,研究团队还基于 MMe...……更多
牛津团队提出多年生DToU方案,能有效检查应用程序的使用请求
...程序)是否符合 DToU 的规定。义务识别和合规性检查存在相关性。但是更软性的规定,也就是数据使用者在被赋予了数据使用权之后,还需要额外做哪些事情来满足数据提供方的规定?一个典型例子就是“如果你使用了我们的数...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...景中出现的复杂情况,本文设计的时空编码器在处理空间相关性时不依赖于特定的图结构。这是因为在零样本预测环境中,实体间的空间联系往往是未知的或难以预测的。这样的设计使得UrbanGPT能够在广泛的城市应用场景中保持...……更多
超级干货丨360AI搜索如何准确识别用户意图?
...化为用户的潜在意图,从而匹配上对应的广告,而且它的相关性更好。让搜索广告真正实现从购买“关键词”到购买“用户意图”的转变。比如用户想搜索旅游攻略,这背后可以转化成景点的搜索、交通的搜索、酒店的预定等多...……更多
...临床评估了母亲外周血中galectin-9水平与子痫前期发病的相关性,发现血清中galectin-9具有子痫前期早期预测的潜在价值。(完)【编辑:房家梁】 ……更多
我国学者发现乳腺癌化疗耐药“元凶”
...的耐药“元凶”被找到。为了解耐药“元凶”作用机制和相关性,以便为后续优化治疗策略找到方向,团队开展了相关试验。结果显示,当用相同剂量的多西他赛和阿霉素治疗时,与TSPAN8-CAFs相比,TSPAN8﹢CAFs存活率显著提高,并...……更多
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
...种方式,采样算法把水印引入了next token中(即r(t)和x(t)的相关性),在检测水印的时候,就使用Scoring函数来衡量这种相关性。下面给出一个具体的例子:简单来说就是拿水印key和前几个token(这里是4个),过一个哈希函数,生...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...行的智能解答。在数据和信源的时效性、权威性、质量、相关性,以及内容索引丰富度等方向进行全方位升级,针对用户在复杂问题解决、金融投资、科研学术、文档分析等多领域的需求,带来专业优化和流畅体验。01在处理复...……更多
更多关于科技的资讯:
近日,AI眼镜热潮再度来袭。AI眼镜是集成AI语音助手、蓝牙耳机、翻译、导航、墨镜、出行、聊天服务等功能的可穿戴设备。业内普遍猜测
2025-01-04 11:03:00
调查:87%中国人对日本印象不好 主要从抖音、微博获取日本信息
1月4日消息,你对日本的印象好吗,从实际调查情况来看,大多数都不是太好。日本民间非营利团体“言论NPO”与中国国际传播集团发布的调查报告显示
2025-01-04 11:15:00
洁面不紧绷:多芬第三代氨基酸洁面泡泡26元/瓶大促
多芬氨基酸洗面奶 160ml*2 瓶日常售价 104.9 元,今日下单赠旅行装 30g*2 支 + 官方立减 16 元
2025-01-04 11:15:00
宝莱坞诚不我欺!印度男子用舌头截停57次电风扇叶片创世界记录
1月4日消息,印度宝莱坞电影里,经常会出现一些身怀绝技的“神人”,刀枪不入对于他们而言都是小意思,实际上在现实生活中还有人玩的更花
2025-01-04 11:15:00
酒店行业低谷徘徊,存量酒店改造路在何方?
近年来,全球经济环境的不确定性以及旅游业的波动,给酒店行业带来了前所未有的挑战。加之消费者偏好的快速变化,酒店业正经历着一段艰难的低谷期
2025-01-04 11:24:00
在健康产业蓬勃发展的当下,善百年作为甘油二酯生产厂家脱颖而出,成为行业内的佼佼者,引领着甘油二酯产品的创新与发展潮流。善百年专注于甘油二酯的研发与生产
2025-01-04 11:36:00
九号远航家M3系列电摩发布:高端铅酸电池、6999元起
快科技1月4日消息,九号公司最新推出了远航家M3系列电动摩托车,售价6999元起。该车号称“高端铅酸电摩新标杆”,采用了“MAX级”制动配置
2025-01-04 11:45:00
提前泄密领克900:知名博主陈震同学公开致歉
快科技1月4日消息,昨晚领克全新旗舰SUV车型领克900正式发布,然而昨天上午,网络上就有该车的相关评测视频泄露偷跑。从视频内容可知
2025-01-04 11:45:00
提前泄密领克900 知名汽车博主陈震同学遭索赔500万:已收到律师函
快科技1月4日消息,昨晚就提前泄密公开致歉的汽车博主“陈震同学”发布最新消息,称已收到 “领克900我们违约发布事件”的律师函
2025-01-04 12:15:00
每日一图|高品质温州大黄鱼“游”进杭城
本文转自:人民网-浙江频道孙鹏
2025-01-04 12:16:00
热烈祝贺中昊科技跨境电商寄售平台正式上线
随着全球化人工智能、区块链、电商科技进程的不断推进,跨境电商已成为我国对外贸易的重要发展方向。近日,香港知名科技公司中昊科技有限公司正式推出的中昊科技跨境电商寄售平台(ZHTCEP)于2024年12月15日正式上线
2025-01-04 13:10:00
石头G30 Space/G30定档1月8日:行业首创五轴折叠仿生机械手
快科技1月4日消息,石头科技官宣将于1月8日召开发布会,推出两款新品:石头G30 Space、石头G30。其中,石头G30 Space是最新一代扫拖机器人
2025-01-04 13:15:00
AI大模型、具身智能机器人将集中亮相CES2025,搜狐科技观察团带你看展
全球规模最大、最具影响力的消费电子盛会——国际消费电子展(CES)即将再度来袭。创始于1967年的CES,由美国电子消费品制造商协会(CTA)主办
2025-01-04 13:30:00
韩国客机着火179人遇难 事故赔偿进度神速:每位遇难者获4000万元
快科技1月4日消息,据韩国媒体报道称,韩国客机事故,受害者赔偿额度约合人民币73亿元。据悉,失事飞机共投保约1.5257万亿韩元(约合人民币75
2025-01-04 12:45:00
一生难遇!原来2025是“完美平方年”
快科技1月4日消息,2025年已经拉开序幕,最近“2025是完美平方年”的话题引发热议。首先,2025是一个“完美平方数”
2025-01-04 12:45:00