• 我的订阅
  • 头条热搜
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率。 结果表明:绝大多数模型目前都不能胜...……更多
杭州开启“零磁”医疗深度求索
...了载体。心磁成像设备给患者带来了什么?急性心梗诊断准确率超90%随着医生按下按钮,患者张大伯被缓缓送入一台形似核磁共振的仪器,不到3分钟,一张包含等磁图、电流密度图、心磁图等级等信息的报告单打印完成。“检...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...T-4o mini 仅 37.6 分,ChatGLM3-6B 和 Qwen2.5-1.5B 仅 11.2 和 11.1 的准确率。基于中文 SimpleQA,我们对现有 LLM 的事实性能力进行了全面的评估。并维护一个全面的 leaderboard 榜单。同时我们也在评测集上实验分析了推理 s……更多
11岁就考上中科大的神童谢彦波,后来怎么样了?
...个环境让他有所改变。阴差阳错之下,他竟然得到了美国普林斯顿大学菲利普·安德森教授的青睐。这位教授可是诺贝尔物理学奖的得主啊!按理说,谢彦波应该好好跟着这位大师学习,但他呢?老毛病又犯了。在小组会议上,...……更多
...者选择最可能匹配照片中人的名字;④比较参与者的选择准确率与随机猜测的准确率是否存在显著差异。△实验样式研究结果显示:■名字与外貌存在关联性:参与者通过观察照片猜测名字的准确率为38%,显著高于随机猜测的25%...……更多
新型脑机接口可将大脑信号转化为语音 准确率高达97%
...心开发的新型脑机接口(BCI)能将大脑信号转化为语音,准确率高达 97%,是同类系统中最准确的。研究人员在一名因肌萎缩性脊髓侧索硬化症(ALS)而导致语言能力严重受损的男子的大脑中植入了传感器。这名男子在启动该系...……更多
9个月前刚刚融资13亿美元,如今AI独角兽创始人却带头跑了
... GPT-3.5 和 Meta 的 LLaMA 等知名模型,在所有任务中的平均准确率达到了 72.7%,超过了人类专家和人类评分者。去年11月,Inflection AI推出了一个全新的基础模型——Inflection-2,当时号称是全世界第二的LLM。今年3月,Inflection AI刚刚……更多
她书汇 |《娟娟独立寒塘路》:探索中国古代女性艺术家的光辉之路
...探索。 【作者简介】冯幼衡台湾大学外文系学士,美国普林斯顿大学艺术考古系博士。曾任艺术家张大千私人秘书,并曾服务于台北故宫博物院书画处,先后任教于维吉尼亚理工暨州立大学艺术系、加州州立大学洛杉矶分校艺...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...模型中,LLaMA 3.1 405B 在常规 Blocksworld 测试中表现最佳,准确率达到 62.6%。然而模型在 Mystery Blocksworld 的表现却远远落后——没有一个 LLM 在测试集上达到 5%,并且在一个领域上的性能并不能清楚地预测另一个领域的性能。这种结...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
...突破,最高的测试成绩达到了类人水平。o3软件工程测试准确率比o1高近47% 竞赛数学高15% 人类博士专家级生化物高近13%今年9月,OpenAI 发布o1的预览版o1 preview时称,o1是第一个具备真正通用推理能力的大模型,它的核心能力推理...……更多
...法进行对比测试后,研究人员发现新系统预测感知颜色的准确率超过92%。对于移动速度较慢的动物,该相机系统在2米的距离内效果最佳。该系统适用于许多昆虫、蜘蛛、蜥蜴、海龟、鸟类和哺乳动物。这种新颖的摄像系统为科...……更多
单县中心医院心内科发展优势技术 打造学科品牌
...。从事心内科临床工作30年,曾被国家卫计委委派至美国普林斯顿医院进修。对心内科疾病有丰富的临床经验,尤其擅长于冠心病介入、心脏起搏器植入术与心律失常的射频消融等。门诊时间:周一全天、周四全天李爱玲 心内科...……更多
AI诊断抑郁症,准确率高达97.53%的秘诀何在?
...结合语音和大脑活动数据后,这个模型在诊断抑郁症时的准确率高达97.53%,比其他方法都要好得多。“这是因为语音里有很多我们现在还无法从大脑里直接得到的信息。”Maskeliūnas解释道。参与这项发明的KTU博士生Musyyab Yousufi说...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...了卓越的性能,尤其是在X级耀斑的预测上,达到了95%的准确率和100%的真实阳性率。“入地”对中国科学院的科研人员来说,做学问、做研究是他们的本分,分担国家重大任务是责任,为国民经济服务是目标。在追日问天的同时...……更多
科学家竞相破解大型语言模型背后的谜团
...验证:对比标准提示,新方法在一系列算术推理任务上的准确率都有了显著提高。但美国纽约大学研究人员的一项最新研究表明:LLM并没有利用思维链的推理能力,它只是偷偷加了计算。美国东北大学计算机科学家戴维·鲍表示...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...消失。结果还表明,随着数据集大小的增加,模型的最终准确率会提高(在模型大小之间保持一致)。同样,作者观察到架构大小增加的总体趋势是无论数据集大小如何,整体性能都会提高。通过下表 2 可以得出以下几点:动作...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...中,深度研究所使用的模型在专家级问题上达到了26.6%的准确率,刷新之前的18.2%的纪录。 相比之下,DeepSeek的R1模型的准确率是9.4%。这一测试由全球众多领域专家共同开发,目的是评估人工智能在广泛学科领域的表现,被视为...……更多
o1带火的CoT到底行不行?新论文引发了论战
...篇来自德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的论文引发了热议,其模仿莎士比亚《哈姆雷特》的台词提出了一个对 AI 研究者和实践者来说至关重要的问题:To CoT or not to CoT?论文标题:To CoT or not to CoT? ...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...目前在月球撞击坑年代和形态判别上,月球专业大模型的准确率已达到80%以上。中国科学院院士、中国月球探测工程首任首席科学家欧阳自远表示,随着人类深空探测活动的快速推进,探测数据呈井喷式增长。科学大数据已然成...……更多
无表情人脸预测政治信仰,AI准确率惊人!斯坦福研究登国际顶刊
...以从毫无表情的面部中,识别出一个人的政治倾向,而且准确率惊人。现在,科学家们已经证明,AI能够以惊人的准确度从面部,预测一个人的政治取向。不仅如此,即便是一个毫不「露怯」的面孔,也能精准识别。这么说来,...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
... 3D 场景,空间智能来了》。但这两者也存在一些区别。普林斯顿AI创新中心创始人、主任,终身教授王梦迪告诉机器之心:「飞飞的 World Labs 和 Google 的 Genie2 看上去都是从一张图片生成可以交互的三维场景,但有本质区别。Genie...……更多
...”关注学校政策,努力争取奖学金与助学金。例如,美国普林斯顿大学在2021-2022年的学杂费标价为56010美元,但学生在获得助学金后,当年的平均学费约为16562美元。哈佛大学为55%的本科生提供了平均62613美元的按需奖学金或助学...……更多
湖人惨败热火,哈姆战术失效,詹姆斯低迷拒绝赛后采访
...了湖人的弱点,重点针对防守,特别是湖人队的外线投篮准确率低得令人震惊。斯波教练在第一节的第一个暂停后就开始采取联防策略,让湖人队无法反击。虽然湖人有詹姆斯和戴维斯等经验老将,可以自行解决问题,但即便哈...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...本能力的一种方法)中,360Zhinao-7B-Chat-360K达到98%以上的准确率。360仿照SuperCLUE-200K测评基准构造了中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,...……更多
谷歌推出ai气象模型gencast,预测准确度超越ens
...测试,GenCast在1320种不同变量和提前时间的组合测试中,准确率超过ENS的97.2%,在提前36小时以上的预测中,准确率更是高达99.8%。此外GenCast在预测极端高温、低温和强风等方面持续优于ENS,并能更准确地预测台风/飓风的路径,...……更多
...比特的相干时间提高到了500微秒以上,打破了2020年3月由普林斯顿大学创造的360微秒的世界纪录。”北京量子信息科学研究院研究员于海峰说。这是当时国际文献报道的最高值。这个被称作“量子院”的新型研发机构总能让人眼...……更多
科学周刊|华人科学家发明了神奇的“AI诊断笔” 为何它能手写识别帕金森病?
新闻背景:只需一支笔,即可以高达95%以上的准确率实现帕金森病早期辅助检测。近日,华人科学家Jun Chen研发出AI诊断笔,通过分析帕金森病患者的手写特征实现早期辅助检测,准确率达95%以上;这种诊断笔可能代表一种低成本...……更多
生成一周大气模拟仅需9.2秒,谷歌气候模型登Nature
...候的准确性以及效率。论文显示,NeuralGCM在1到15天的预报准确率与ECMWF不相上下,而ECMWF拥有全世界最先进的传统物理天气预报模型;加入海平面温度后,NeuralGCM的40年气候预测结果与从ECMWF数据中得到的全球变暖趋势一致;NeuralG...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处于一个十分尴尬的地位。作者在推文中表示...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...有正确答案的问题),百融云创大模型在回答非IDK问题时准确率达到67.7%左右,回答IDK问题时的准确率达到33.3%,整体准确率达到50.5%,略高于ChatGPT3.5的50.3%。孔子曰,知之为知之,不知为不知,是知也,一个“聪明”的大模型也...……更多
更多关于科技的资讯:
蚂蚁集团大动作!“阿福”APP来了:新增健康陪伴功能 问答能力升级
12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布APP新版本,升级健康问答、健康陪伴、健康服务三大功能
2025-12-17 10:18:00
项目卡壳90%是资源管理“掉链子” ?易趋教你四步破局
“张总,研发部李工被临时抽去支持紧急项目,咱们的核心模块开发得延期了”,“设备组反馈,原定下周到位的测试服务器,现在还在另一个项目组占用着”
2025-12-17 11:10:00
远见协同:解码米连科技稳健发展的深层动能
在互联网行业潮起潮落、监管环境持续完善的背景下,一家企业如何锚定航向,实现可持续的稳健增长?这不仅考验着创始团队的初心
2025-12-17 11:10:00
赋能印度农业现代化丨潍柴雷沃亮相第33届印度浦那国际农业展
鲁网12月17日讯日前,第33届印度浦那国际农业展KISAN在浦那国际展览中心举办。作为印度西部规模最大、最具影响力的农业展会
2025-12-17 11:18:00
面对“哪些中国企业全球化做的不错?”这一问题,联想集团无疑是具有代表性的答案之一。作为出海时间早、全球化程度深的中国企业
2025-12-17 11:52:00
京东产发与日日顺达成全球战略合作 共建超级供应链新生态
近日,京东产发与日日顺供应链正式达成全球战略合作,建立共创共赢的生态战略合作关系。 双方在物流基础设施、仓配网络、供应链管理等良好的合作基础上
2025-12-17 10:11:00
【宅男财经|专家面对面】当前许多年轻人热衷于“谷子”、棉花娃娃等小众二次元文化产品。针对年轻人为何更偏爱此类小众消费,中国广告协会会长
2025-12-17 10:12:00
“我喜欢我”:vivo S50系列携“告白”美学与长焦Live,开启自我表达新旅程
2025年12月15日,vivo正式发布全新 vivo S50系列,包括 vivo S50 与 vivo S50 Pro mini 两款新品
2025-12-17 10:18:00
聚焦企业福祉与跨境管理 百年人寿协办德国商会专题论坛共话创新解决方案
2025年12月5日,一场聚焦于在华企业福利创新与人力资源挑战的高端论坛于北京成功举行。本次活动由中国德国商会与安顾方胜联合主办
2025-12-17 10:18:00
为积极响应全民消费热潮,充分发挥金融服务实体经济的重要作用,江苏银行围绕 “双十二” 消费节点,精心部署多项线上促消费举措
2025-12-17 10:18:00
王志顺最近,社交平台被一批“装修博主”刷屏了——清一色的夫妻站在新家门口微笑合影,有的怀里还抱着婴儿,配文都是“装修已定”“聊聊感受”
2025-12-17 10:40:00
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00