• 我的订阅
  • 头条热搜
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 ...……更多
...伊丽莎”交流,但当与OpenAI的大语言模型交流时,他们的正确率基本在50%。事实证明,他们的预判相当准确。除了54%的人把GPT-4误认为人之外,刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊...……更多
OpenAI GPT-4 AI 模型无需额外训练可通过日本理疗师考试
...格的问题时显得有些吃力。该模型在常规问题上的表现(正确率为 80.1%)远远好于实际问题(正确率为 46.6%)。 同样,GPT-4 在处理纯文本问题(正确率为 80.5%)时的表现也远好于那些带有图片和表格的问题(正确率为 35.4%)。...……更多
DeepMind最新成果剑指量子力学,FermiNet或将破解近百年计算难题
....livescience.com/24509-light-wave-particle-duality-experiment.html在经典模型中,原子核位于中间,固定数量的电子绕着固定的轨道运行,如同太阳系一般严谨有序。但在量子系统中,电子等粒子完全没有这种精确的轨道,它们的位置是由「概...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...多个APP屏幕识别能力。最新迭代的Ferret-UI 2,就是通用UI模型。可见,「Computer use」已经成为科技大厂们,重点发力的下一个战场。谷歌「贾维斯」年底出世,最强Gemini 2加持代号为Jarvis Project项目,本质上是一个大动作模型(LAM...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...,OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型,和基于它的一系列应用,一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo,新的大模型更聪明,文本处理上限更高,价格也...……更多
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力...……更多
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...领域首次发现!噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果,刚刚登上Science子刊。(相关成果以“关联生成中量子优势的突然消亡”为题发表于综合性子刊Science Adv...……更多
无表情人脸预测政治信仰,AI准确率惊人!斯坦福研究登国际顶刊
...并被用于通过一个将这些描述符映射到政治倾向量表上的模型来预测参与者的政治倾向。结果发现,面部识别算法可以以0.22的相关系数预测政治倾向。这种相关性虽然不高,但具有统计学意义,表明某些稳定的面部特征可能与...……更多
全国首个!湖北为脑机接口医疗服务定价:966元起
...控制机械臂进行书写。在离线状态下100个常用汉字的分类正确率达到了91.3%,在语言模型辅助下,正确率可提高至96.2%。【本文结束】如需转载请务必注明出处:快科技责任编辑:拾柒文章内容举报 ……更多
中新经纬5月24日电 5月23日,清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松在北大光华度小满大模型公开课中,阐述了生成式人工智能对科技、文化和教育的影响。他认为,生成式人工智能(GAI)的基本定位是...……更多
...由谷歌DeepMind和Isomorphic Labs团队研发的最新迭代人工智能模型AlphaFold3,能以较高准确率预测蛋白质与其他生物分子相互作用的结构,其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
清华物理系传奇特奖得主Yao Shunyu,正式投身大模型,加入Anthropic的Claude团队。有意思的是,另一位Yao Shunyu,今年刚刚加入隔壁OpenAI。注意别搞混哦,前者是学物理的姚顺宇,后者是学计算机的姚顺雨。(手动狗头)这次加入Ant...……更多
清华大学新学期首节AI大模型课爆满 系方:课程常态化,培养“AI+”人才
昨日,有网友发帖称,清华大学新学期首节AI大模型课教室爆满,相关话题引发网络热议。网友发布的现场图片显示,课程《大模型与生成式人工智能》教室内座无虚席,过道和台阶上都挤满了听课的学生。在网帖评论区,有网...……更多
本文转自:嘉兴日报首次授予中国大陆学者清华大学柔性电子技术实验室张一慧 获美国工程科学学会詹姆斯·莱斯奖章■记者 何金妹 通讯员 徐晓杰本报讯 美国工程科学学会詹姆斯·莱斯奖章,每年只颁给一位在工程科学领域...……更多
2023 CCF国际AIOps挑战赛决赛成功举办
...局面。本届CCF国际AIOps挑战赛由中国计算机学会(CCF)、清华大学、中国建设银行股份有限公司、南开大学联合主办;CCF互联网专委会、清华大学计算机科学与技术系、中国建设银行股份有限公司运营数据中心、南开大学软件学...……更多
海淀青年创客让前沿科技走进生活
梦塔科技展示虚拟生物Mochi清华科技园已成为中关村科学城首批四个人工智能特色产业园之一在不久前举办的第十二届“东升杯”国际创业大赛全球总决赛上,海淀区了发布“青年友好·海淀AI原点社区原住民计划”。该社区坐...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...经过与模型更进一步的对话,研究人员成功地将ChatGPT的正确率刷新到了77.5%,也就是修复了40个错误中的31个,远超SOTA。至少,目前看来,这件事是完全有可能的:开发人员将不再需要编写样板代码。相反,他们可以专注于复杂...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...分享,欢迎投稿或者联系报道。本文作者来自于港中文、清华和UIC。主要作者包括:余甸之,港中文博士生;张欣妮,港中文博士生;陈焱凯,港中文博士;刘瑷玮,清华大学博士生;张逸飞,港中文博士;Philip S. Yu,UIC教授;...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工智能系统来...……更多
研究人员发现:鸽子使用“暴力算法”
...确答案的比例从55%提高到95%。在相对较难的题目中,其“正确率”也从55%提高到68%。研究人员使用人工智能进行了相同的测试,发现人工智能也学会了减少错误的次数。在这项研究中使用的人工智能模型和鸽子解决问题的方法都...……更多
精准0误差,输入价格打骨折!OpenAI官宣API支持结构化输出,JSON准确率100%
【新智元导读】程序员福音!OpenAI新推出的模型API全部支持结构化输出,JSON Schema匹配率高达100%,成本还立减一半。还在绞尽脑汁想一堆提示词,为一顿操作后五花八门的输出结果而头疼?OpenAI终于听到了群众的呼声,为广大...……更多
陈德亮 资料图据清华大学地球系统科学系官方微信公众号消息,著名气候学家、瑞典皇家科学院院士、中国科学院外籍院士、瑞典哥德堡大学August Röhss讲席教授陈德亮,已于2024年11月全职回国,加盟清华大学任地球系统科学系...……更多
腾讯和清华大学联合推出全新图生视频模型
3月15日消息,腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click”,目前已经上架GitHub(代码四月公开),同时还发表了一篇研究论文(IT之家附DOI:2403.08268)。这款图生视频模型主要功能包括局部动画...……更多
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...成的”,薛娇总会带着这种必胜的信念,一往无前。从大模型重要技术突破到行业应用方案制定,从技术先锋到团队领导者,正是这种将浪漫理想转化为技术现实的独特能力,让她在云计算领域树立起巾帼标杆。当被问及成功秘...……更多
更多关于科技的资讯:
浙江日报讯 (记者 翁云骞 通讯员 李芮) 日前,在宁波举办的2025空间计算大会上,全功能空间计算MR专用芯片“极智G-X100”发布
2025-12-05 09:14:00
三明联通将乐分公司:5G 护航“山水将乐·乐动心声”2025 文化惠民盛宴
网络保障团队开展通信服务。东南网12月5日讯(通讯员 肖锦雯)11月28日,“山水将乐·乐动心声”文化惠民活动在将乐县体育馆田径场盛大举行
2025-12-05 09:16:00
摘要:个性化推荐系统中,用户兴趣的动态演化特征对推荐效果有着直接影响。传统静态建模方法难以满足用户实时变化的偏好需求,兴趣演化建模应运而生
2025-12-05 09:26:00
“如果和父母只剩55天,你最想做什么?”面对这道假设题,许多人在调查问卷与访谈中写下了答案。我们根据回收的数据与采访实录
2025-12-05 10:15:00
中国网12月5日讯 据中国消费者协会官方网站消息,“双十二”购物旺季临近,各类促销活动密集,不少消费者早已选好想买的数码产品
2025-12-05 10:24:00
京东工业助力陕建打造供应链数据融合平台 赢得数据要素x大赛全国技术创新奖
近日,2025年“数据要素×”大赛全国总决赛成绩揭晓,京东工业携手陕建物流集团打造的“建筑行业供应链数据融合平台”项目
2025-12-05 10:58:00
据新华社消息 12月4日,在“AI·镜界—南京人工智能生态街区”,一位女士在“AI诊所”进行健康检测。近年来,江苏南京依托中国(南京)软件谷的软件产业基础
2025-12-05 09:41:00
河北日报讯(张晓超、崔虹)近日,第八届中国国际进口博览会在上海举办,河北省39家企业的70余类“燕赵好物”集中亮相,吸引了国内外客商的目光
2025-12-05 07:40:00
当人类基因组的30亿个碱基对如浩瀚星河般铺展,当大脑1000亿个神经元织就复杂网络,这本写满生命奥秘的“天书”,曾让科学家们望“脑”兴叹
2025-12-05 07:42:00
12月3日上午,一票跨境电商网购保税进口商品经杭州海关所属义乌海关审核验放后,从义乌保税物流中心发往购买的消费者手中。值得注意的是
2025-12-04 09:42:00
腾讯游戏魔方工作室迎来十五周年,《暗区突围》手游爆料地图更新
12月3日,腾讯游戏魔方工作室迎来十五周年庆。魔方多款游戏主创来到直播现场爆料,为玩家带来产品最新进度,备受玩家关注的《洛克王国》IP新作《洛克王国
2025-12-04 14:20:00
从日常随拍到户外探索 年轻人用手持设备定格热爱
脚踩陆冲板的年轻人手持全景相机,以第三人称视角“跟拍”运动瞬间;旅行博主捕捉下360°无死角的风景,剪辑时通过手动调整视角制作出炫酷转场
2025-12-04 14:20:00
在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
中国移动AI听障康复智能体落地 为2780万听障人士架起沟通桥梁
12月3日是国际残疾人日。当日早间,央视财经频道《第一时间》重磅报道了中国移动自主研发的全国首个AI听障康复智能体——“中移无障碍”
2025-12-04 15:22:00
防沉迷+护安全,墨宝·AI学生机成未成年人用机优选
在数字化设备快速发展的当今,未成年教育正面临着网络沉迷、电子产品使用导致近视等前所未有的挑战。那么,究竟有没有科学、有效且合理的解决方案呢
2025-12-04 15:23:00