• 我的订阅
  • 头条热搜
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
【新智元导读】多个LLM联合,可以迈向更强大系统!最新研究发现,GPT-4能够提升同伴的性能,能够让数学能力暴涨11.6%。AI如何成为「更强的AI」?最关键还是,得学会「借力」。来自蒙特利尔大学、剑桥、普林斯顿、谷歌DeepMi...……更多
...动力,全力服务经济社会高质量发展,展现数学基础学科新作为。当日,主办方相关负责人向广大院士、专家、企业家发出诚挚邀约,期盼与大湾区大学等高校以及院士专家们一起,将论坛打造成长期且独具特色、国内顶尖的高...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
基于 ADAS 所发现的智能体的性能大大优于最先进的手工设计的基线。基础模型 (FM) 如 GPT 和 Claude ,正在成为通用智能体的强有力支持,被越来越多的用于多种推理和规划任务。然而,在解决问题时,需要的智能体通常是具有多...……更多
大湾区首个!高水平数学论坛点亮松山湖,为高质量发展贡献数学力量
...动力,全力服务经济社会高质量发展,展现数学基础学科新作为。论坛上,多位院士专家就各自研究领域作主题报告,分享交流数学学科研究成果,共同探讨全球数字经济发展新动向、新趋势,共襄数字盛宴、共话数字未来。鄂...……更多
...请前迪士尼制片人及知名编剧马克·汉德勒,聆听他围绕新作《合作编剧和故事开发》分享心路历程。主打心理学图书出版特色,泰勒弗朗西斯出版集团贯穿整个展会期间的“从‘心’出发”活动将带领观众趣味集卡拍照互动,...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
... GPT-4 的偏见。为了结合这两种方案的优势,通过利用 “群体智能”(Chatbot Arena 依赖于人群智慧)来实现更稳健且更少偏见的评估,同时使该过程自动化且可扩展到多维度能力比较,Maitrix.org 发布了 Decentralized Arena。原文地址: h...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并不能准确表示人类的能力。最...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...-7b-Instruct相比,Orca-3在多个基准测试中,都显示出显著的性能提升。而在数学方面上的表现,性能直接暴涨168%。当「合成数据」遇上智能体过去一年,我们见证了智能体的兴起。 智能体可以生成高质量的数据,通过反思和迭代...……更多
讯飞星火:致力于成为每个人的AI助手
...用。致力于成为每个人的AI助手,讯飞星火针对不同用户群体,研发出不同的AI产品:面向科研人员,推出星火科研助手;面向学生群体,推出AI心理伙伴;面向软件行业,发布了全新升级的智能编程助手iFlyCode2.0。 “讯飞星火...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...降可能会得到恢复。 还有人指出,其实这种现象在人类群体也能观察到,比如在微积分题目中添加不相关的陈述,很多大学新生也会被误导,或许人类在推理方面具有和 LLM 类似的局限性。论文概述论文标题:GSM-Symbolic: Understan...……更多
发哥新作!天玑8400登场,Redmi千元神机首发
嘿,你知道吗?现在的科技发展那叫一个快,尤其是芯片技术,每次有新的突破,智能手机行业就全都得跟着紧张一下。联发科这个大牛级别的半导体公司,每次出新品,就像在科技的海洋里扔了个大石头,一圈圈涟漪荡漾开...……更多
陈思诚新作《解密》发布预告,刘昊然演绎数学天才
近日,电影《解密》发布“人生三幕“版预告及“绝密”版海报。预告中,配合变幻的光影和恢弘的配乐,刘昊然饰演的容金珍的人生在银幕上迅速演进;海报则以复古档案袋风格呈现,片名由无数错综复杂的密码组成,将影...……更多
人工智能数学基础:解锁智能世界的十大密钥
...人工智能中,信息论为我们提供了量化信息量和评估模型性能的工具。学习信息论与编码将有助于我们理解数据压缩、通信协议等概念,并能够运用这些理论优化机器学习模型的性能。第六步:了解图论与网络图论是研究图结构...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...大的成功,但是它们也存在一些问题:数据偏差:LLMs的性能取决于其训练数据。如果训练数据存在偏差,模型就会学到这些偏差,从而影响其性能。偏见:LLMs可能会从其训练数据中学习到偏见,并将这些偏见反映在其生成的文...……更多
...药学、心理学、材料学。核心课程:物理化学、材料物理性能、材料力学性能、生物化学、诊断学、内科学、外科学、老年医学、药事管理与法规、临床药物治疗学、临床营养学、老年心理学、康复医学、医学伦理学、健康教育...……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
【新智元导读】AI评估AI可靠吗?来自Meta、KAUST团队的最新研究中,提出了Agent-as-a-Judge框架,证实了智能体系统能够以类人的方式评估。它不仅减少97%成本和时间,还提供丰富的中间反馈。AI智能体,能否像人类一样有效地评估...……更多
...试”得出了一系列结果,为人们更好地了解大模型产品的性能和特点提供了参考样本。AI高考数学全不及格?换个打开方式试试近期,一则“AI高考测试出分,数学全不及格”的消息登上“热搜”。消息出自上海人工智能实验室...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
【新智元导读】在NLP领域,研究者们已经充分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研究就拿出了非常有力的证据:Representation matters!扩散模型如何突破瓶颈? 成本高又难...……更多
8月院线片单,你最期待哪一部?
8月值得期待的引进片并不多,“异形”系列重磅新作《异形:夺命舰》几乎一枝独秀,还可以算上“绯闻女孩”布蕾克·莱弗利的新片《爱情,到此为止》。暑期档还有多部重磅国产电影上映,包括已经点映了许久的影迷口碑...……更多
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
...阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。 相比上一代模型,Qwen-Max...……更多
...造创新全链条,激发创新活力,赋能产业发展。走进上海数学与交叉学科研究院,无论会议室、办公室还是走廊,随处可见大大小小的黑板。这是数学家们提出的小需求,用来“捕捉”随时闪现的灵感。今年1月,上海数学与交...……更多
丘成桐:解决“卡脖子”问题只是“守”,探寻原创科研方向才是“攻”
1月2日的上海,对于数学界而言,可谓佳事连连。先是菲尔兹奖首位华人得主丘成桐任主席的世界华人数学家联盟年会在复旦大学开幕,接着由上海市、杨浦区和复旦大学共同支持的新型研发机构“上海数学与交叉学科研究院”...……更多
西湖大学新增数学与应用数学、人工智能两个本科专业
... (童笑雨 张弛)3月20日,记者从西湖大学获悉,该校新增数学与应用数学、人工智能两个本科专业,并列入西湖大学2024年本科招生计划,这意味着今年西湖大学本科生招生专业增至7个。近日,教育部公布了2023年度普通高等学校...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
科学家们用一种名为“QuietSTaR”的技术训练了一个人工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理...……更多
聚力实业促发展
...习近平总书记到江苏考察,提出“在强链补链延链上展现新作为”的殷切希望,并在南京听取智能电网国家先进制造业集群总体情况介绍。南京全市上下牢记嘱托,迈出产业强市新步伐。全年新签约百亿级产业项目9个,与驻宁...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...本嵌入模型:text-embedding-3-small和text-embedding-3-large,前者性能比前代模型大幅提升,价格降至1/5;后者能创建最高3072维数的嵌入,性能更强,价格亦十分经济。GPT-3.5 Turbo的新版本也将推出,输入价格降低50%,输出价格减少25%。.……更多
算力增长1000倍!黄仁勋大刀阔斧掀翻AI界
...每秒10太字节的高速链接,结合世界上最先进的SerDes(高性能接口或连接技术)将它们紧密连接在一起。并且,这两片这样的芯片放置在一个计算机节点上,并通过Grace CPU进行高效协调。在GPU的互联方面,Nvidia采用了第五代MV Link...……更多
GF社1TB资料泄露:第十代宝可梦代号曝光、还有多人宝可梦开发中
...作品来给switch撑场。要开创宝可梦新时代? 本次宝可梦新作的代号为“Gaia”,从相关搜索结果来看,比较靠谱的线索是盖亚。希腊神话中的大地女神,众神之母,也是第一位超原始神明。GF社给宝可梦新作这个代号,意味着GF...……更多
...前沿的高难度赛题,提升他们对“人工智能+科学研究+高性能计算”等新研究范式的直观认识,增强交叉学科的学习和应用能力。例如,由中科院数学与系统科学研究院研制的今年第一道题“石油开采渗流数值模拟”,这是一道...……更多
本文转自:解放日报上海数学与交叉学科研究院将集聚世界一流数学家和研究团队做世界一流研究,探寻重大科研方向胡幸阳/黄海华本报记者 胡幸阳 黄海华昨天,由丘成桐院士担任首任理事长的上海数学与交叉学科研究院在...……更多
更多关于科技的资讯:
中国赴泰旅游不降反增:单日入境中国游客超2万人
1月18日消息,据国内媒体报道称,目前的情况是,中国赴泰旅游的人数不降反增,似乎并没有太受外界的影响。泰国旅游与体育部部长索拉翁先生透露
2025-01-18 21:28:00
与辉同行带货阿胶茶未检出驴成分:相关产品已下架
快科技1月18日消息,据媒体报道,有消费者反馈,与辉同行直播间销售的“千年珍红参阿胶女神茶”未检验出驴源性成分。根据消费者提供的检测报告
2025-01-18 21:58:00
券商海通造小米与蔚来“绯闻”:两家车企高管同时下场辟谣
快科技1月18日消息,近日,海通国际证券公司发布研究报告,提出2025年五大猜想。其中一个猜想将蔚来与小米联系在了一起
2025-01-18 22:28:00
选主板务必要看PCIe插槽:教你怎么选
在计算机硬件领域,PCIe(PCI Express)扮演着至关重要的角色,它不仅为高性能硬件设备提供了数据传输的高速通道
2025-01-18 22:58:00
日本特大地震警告:概率升至80%
1月18日消息,据媒体报道,近日日本地震调查小组警告称,未来三十年内南海海槽发生“特大地震”(即8级及以上)的概率已经提升至80%
2025-01-18 22:58:00
下周今年来最大范围雨雪将上线:注意防范
1月18日消息,据气象台消息,从下周开始,也就是春节前几天,我国会有一轮雨雪过程发展。据报道,1月23-25日,中东部地区将自西向东出现一次较大范围降水过程
2025-01-18 22:58:00
2024年全球显示器出货量1.27亿台:戴尔夺第一
快科技1月18日消息,根据洛图科技(RUNTO)最新数据显示,2024年全球显示器市场品牌整机出货量达1.27亿台,较2023年增长1
2025-01-18 17:58:00
那些总戴假睫毛的人 现在都怎么样了
不少女性朋友热衷于过年“三件套”:烫发、美甲、接睫毛。过年新造型,迎接好心情,过年前的仪式感满满。浓密纤长又卷翘的漂亮睫毛能让眼睛变大变美变漂亮
2025-01-18 17:58:00
借鉴visionOS 苹果iOS 19相机界面迎来重大改版:更加简洁透明
快科技1月18日消息,据媒体报道,苹果iOS 19将会借鉴visionOS,对相机界面进行重大调整。根据曝光的渲染图,iOS 19相机界面底部是照片和视频两大按钮
2025-01-18 18:28:00
联想发布异能者S130:英特尔N100处理器+3K触控屏
快科技1月18日消息,联想推出了一款全新的二合一电脑,异能者 S130,该设备属于联想的“生态品牌”系列。外观设计方面
2025-01-18 18:28:00
苏州微短剧产业联盟成立
江南时报讯 1月16日,苏州微短剧产业联盟成立仪式暨《微短剧遇见苏州》主题活动举行。新成立的苏州微短剧产业联盟致力于破解微短剧创作
2025-01-18 18:42:00
买齐至少500元 《王者荣耀》六款蛇限皮肤正式公布:灵感来自南斗六星
快科技1月18日消息,今天《王者荣耀》正式公布了蛇限皮肤,共计6款,将于1月28日(除夕)起正式上线。官方推出了好运卡活动
2025-01-18 18:58:00
OLED屏无望!苹果新款MacBook Air将拥抱TFT LCD屏幕
快科技1月18日消息,苹果公司正在研发一款新的MacBook Air,预计将在2027年发布,笔记本将采用氧化物薄膜晶体管(TFT)液晶显示屏(LCD)
2025-01-18 19:28:00
容貌巨变 确诊渐冻症女生求助蔡磊:我真的快要坚持不下去了
快科技1月18日消息,据媒体报道,湖南渐冻症女生陈静雯发布视频求助蔡磊,因她本人无法说话,所以视频声音为代录。在视频中陈静雯表示
2025-01-18 19:28:00
广东都快干成厂东了:久未下雨 空气湿度不足30%
1月18日消息,据气象台消息,广东久未下雨,多地空气湿度不足30%,南雄更是低至23%。天气如此干燥,有网友表示,广东都快干成“厂东”了
2025-01-18 19:58:00