正确率,清华,模型,全新,科学,方法头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

“AI考生”闯关高考，谁是最会做题大模型？

...报记者赵广立2024年全国高考的“硝烟”刚刚散去，“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱，围绕“大模型技术哪家强”的讨论不绝于耳，各色名目的大模型评测应运而生。作为国...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

哪里不会扫哪里！全球最强数学大模型在线玩，阿里多模态模型加持

现在，最强数学大模型，人人都可上手玩了！一觉醒来，阿里千问大模型团队发布了Qwen2-Math的Demo，抱抱脸在线可玩。惊喜的是，如果嫌输入数学公式比较麻烦，可以把想问的题截图or扫描，上传即可解题。整得挺方便。试玩界...……更多

2024-08-21 09:42:00模型,模态,阿里,数学,全球,在线

OpenAI o1 模型 PlanBench 规划能力实测：

...州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 ...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

美媒：GPT-4通过图灵测试

...伊丽莎”交流，但当与OpenAI的大语言模型交流时，他们的正确率基本在50%。事实证明，他们的预判相当准确。除了54%的人把GPT-4误认为人之外，刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊...……更多

2024-05-21 16:36:00图灵,测试,图灵,圣迭戈,研究,人类

OpenAI GPT-4 AI 模型无需额外训练可通过日本理

...格的问题时显得有些吃力。该模型在常规问题上的表现（正确率为 80.1%）远远好于实际问题（正确率为 46.6%）。同样，GPT-4 在处理纯文本问题（正确率为 80.5%）时的表现也远好于那些带有图片和表格的问题（正确率为 35.4%）。...……更多

2024-09-02 09:54:00可通,理疗,日本,模型,训练,考试

DeepMind最新成果剑指量子力学，FermiNet或将破

....livescience.com/24509-light-wave-particle-duality-experiment.html在经典模型中，原子核位于中间，固定数量的电子绕着固定的轨道运行，如同太阳系一般严谨有序。但在量子系统中，电子等粒子完全没有这种精确的轨道，它们的位置是由「概...……更多

2024-09-05 09:51:00量子,力学,难题,成果,量子,方法

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主

...多个APP屏幕识别能力。最新迭代的Ferret-UI 2，就是通用UI模型。可见，「Computer use」已经成为科技大厂们，重点发力的下一个战场。谷歌「贾维斯」年底出世，最强Gemini 2加持代号为Jarvis Project项目，本质上是一个大动作模型（LAM...……更多

2024-10-28 09:51:00贾维斯,贾维,时代,电脑,模型,图标

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

用过GPT-4 Turbo以后，我们再也回不去了

...，OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型，和基于它的一系列应用，一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo，新的大模型更聪明，文本处理上限更高，价格也...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文本能力...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

清华量子计算成果登顶刊，来自丘成桐数学中心团队

...领域首次发现！噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果，刚刚登上Science子刊。（相关成果以“关联生成中量子优势的突然消亡”为题发表于综合性子刊Science Adv...……更多

2024-11-28 12:04:00清华,量子,成果,团队,数学,量子

无表情人脸预测政治信仰，AI准确率惊人！斯坦福研究登国际顶刊

...并被用于通过一个将这些描述符映射到政治倾向量表上的模型来预测参与者的政治倾向。结果发现，面部识别算法可以以0.22的相关系数预测政治倾向。这种相关性虽然不高，但具有统计学意义，表明某些稳定的面部特征可能与...……更多

2024-07-25 09:33:00斯坦,斯坦福,人脸,准确率,信仰,表情

全国首个！湖北为脑机接口医疗服务定价：966元起

...控制机械臂进行书写。在离线状态下100个常用汉字的分类正确率达到了91.3%，在语言模型辅助下，正确率可提高至96.2%。【本文结束】如需转载请务必注明出处：快科技责任编辑：拾柒文章内容举报 ……更多

2025-03-31 15:38:00湖北,医疗服务,元起,定价,接口,医疗

清华大学孙茂松：人工智能会取代部分低端智力劳动者，但不可能发

中新经纬5月24日电 5月23日，清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松在北大光华度小满大模型公开课中，阐述了生成式人工智能对科技、文化和教育的影响。他认为，生成式人工智能(GAI)的基本定位是...……更多

2024-05-24 18:10:00清华大学,清华,人工智能,劳动者,低端,定律

最新迭代人工智能模型生物结构预测准确率显著提升将助力药物研

...由谷歌DeepMind和Isomorphic Labs团队研发的最新迭代人工智能模型AlphaFold3，能以较高准确率预测蛋白质与其他生物分子相互作用的结构，其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎...……更多

2024-05-09 11:54:00迭代,准确率,人工智能,药物,人工,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

Claude团队喜提清华物理学霸姚顺宇！两个Yao Shun

清华物理系传奇特奖得主Yao Shunyu，正式投身大模型，加入Anthropic的Claude团队。有意思的是，另一位Yao Shunyu，今年刚刚加入隔壁OpenAI。注意别搞混哦，前者是学物理的姚顺宇，后者是学计算机的姚顺雨。（手动狗头）这次加入Ant...……更多

2024-10-29 09:54:00清华,物理学,模型,团队,物理,两个

清华大学新学期首节AI大模型课爆满系方：课程常态化，培养“

昨日，有网友发帖称，清华大学新学期首节AI大模型课教室爆满，相关话题引发网络热议。网友发布的现场图片显示，课程《大模型与生成式人工智能》教室内座无虚席，过道和台阶上都挤满了听课的学生。在网帖评论区，有网...……更多

2025-02-22 13:28:00清华大学,清华,常态,模型,学期,课程

清华大学柔性电子技术实验室张一慧获美国工程科学学会詹姆斯·莱

本文转自：嘉兴日报首次授予中国大陆学者清华大学柔性电子技术实验室张一慧获美国工程科学学会詹姆斯·莱斯奖章■记者何金妹通讯员徐晓杰本报讯美国工程科学学会詹姆斯·莱斯奖章，每年只颁给一位在工程科学领域...……更多

2024-01-08 06:39:00莱斯,詹姆斯,科学学,詹姆,清华大学,获美国

2023 CCF国际AIOps挑战赛决赛成功举办

...局面。本届CCF国际AIOps挑战赛由中国计算机学会（CCF）、清华大学、中国建设银行股份有限公司、南开大学联合主办；CCF互联网专委会、清华大学计算机科学与技术系、中国建设银行股份有限公司运营数据中心、南开大学软件学...……更多

2023-12-20 13:45:00挑战赛,决赛,成功,国际,模型,南开大学

海淀青年创客让前沿科技走进生活

梦塔科技展示虚拟生物Mochi清华科技园已成为中关村科学城首批四个人工智能特色产业园之一在不久前举办的第十二届“东升杯”国际创业大赛全球总决赛上，海淀区了发布“青年友好·海淀AI原点社区原住民计划”。该社区坐...……更多

2024-12-23 10:49:00海淀,青年,科技,生活,人工智能,人工

传openai全球招外包大军手把手训练chatgpt取代码农

...经过与模型更进一步的对话，研究人员成功地将ChatGPT的正确率刷新到了77.5%，也就是修复了40个错误中的31个，远超SOTA。至少，目前看来，这件事是完全有可能的：开发人员将不再需要编写样板代码。相反，他们可以专注于复杂...……更多

2023-01-30 17:19:00手把,大军,训练,代码,全球,代码

首个多模态连续学习综述，港中文、清华、UIC联合发布

...分享，欢迎投稿或者联系报道。本文作者来自于港中文、清华和UIC。主要作者包括：余甸之，港中文博士生；张欣妮，港中文博士生；陈焱凯，港中文博士；刘瑷玮，清华大学博士生；张逸飞，港中文博士；Philip S. Yu，UIC教授；...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

GPT-4V医学执照考试成绩超过大部分医学生，AI加入临床还

...复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力，特别是题目包含图像的考题 —— 这对医疗人工智能系统来...……更多

2023-11-21 13:59:00医学,多远,执照,临床,大部分,成绩

研究人员发现：鸽子使用“暴力算法”

...确答案的比例从55%提高到95%。在相对较难的题目中，其“正确率”也从55%提高到68%。研究人员使用人工智能进行了相同的测试，发现人工智能也学会了减少错误的次数。在这项研究中使用的人工智能模型和鸽子解决问题的方法都...……更多

2023-10-29 15:25:00研究人员,鸽子,算法,暴力,人员,研究

精准0误差，输入价格打骨折！OpenAI官宣API支持结构化

【新智元导读】程序员福音！OpenAI新推出的模型API全部支持结构化输出，JSON Schema匹配率高达100％，成本还立减一半。还在绞尽脑汁想一堆提示词，为一顿操作后五花八门的输出结果而头疼？OpenAI终于听到了群众的呼声，为广大...……更多

2024-08-08 09:40:00准确率,结构化,误差,输出,输入,结构

著名气候学家、中科院外籍院士陈德亮回国全职加盟清华大学

陈德亮资料图据清华大学地球系统科学系官方微信公众号消息，著名气候学家、瑞典皇家科学院院士、中国科学院外籍院士、瑞典哥德堡大学August Röhss讲席教授陈德亮，已于2024年11月全职回国，加盟清华大学任地球系统科学系...……更多

2024-11-02 15:49:00气候学家,陈德,清华大学,清华,中科院,院士

腾讯和清华大学联合推出全新图生视频模型

3月15日消息，腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click”，目前已经上架GitHub（代码四月公开），同时还发表了一篇研究论文（IT之家附DOI:2403.08268）。这款图生视频模型主要功能包括局部动画...……更多

2024-03-16 02:23:00清华大学,腾讯,清华,模型,全新,联合

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...成的”，薛娇总会带着这种必胜的信念，一往无前。从大模型重要技术突破到行业应用方案制定，从技术先锋到团队领导者，正是这种将浪漫理想转化为技术现实的独特能力，让她在云计算领域树立起巾帼标杆。当被问及成功秘...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

page 4/3334 首页上一页 1 2 345 6 7 8 9 下一页末页

更多关于科技的资讯：

基于提示工程的模型输出不确定性量化分析

摘要：随着生成式人工智能技术在各行业的广泛应用，模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性，对输出不确定性进行量化分析成为重要方向

2025-12-04 06:17:00

给智能体装上“大脑”和“小脑”

杭州博士后用AI让机器懂协作、更安全杭州日报讯让机器从执行命令的“孤岛”，成为懂得协作的群体？让机器人安全走进人类生活

2025-12-04 06:38:00

紫林醋业产品通过欧盟认证

12月3日从紫林醋业获悉，紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification)，获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)

2025-12-04 07:31:00

豆包手机助手回应“侵犯用户隐私”：不存在任何黑客行为

中新经纬12月3日电 12月3日，豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应，称不存在任何黑客行为。具体来看

2025-12-04 07:42:00

支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖

12月1日-3日，由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上，首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式

2025-12-04 07:47:00

海内外太空算力布局同步加速

近期，在“智绘星空胜算在天—太空数据中心建设工作推进会”上，北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统

2025-12-03 09:42:00

太极韵动武汉，一场独属于银发爱好者的健康之约

承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕

2025-12-03 13:40:00

“数字试错”替代“物理试错” 新一代AI质检平台在杭发布

杭州日报讯产品还没走下生产线，就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前，工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”

2025-12-03 13:41:00

“江苏制造”叩响中东商机

本报记者陆春花为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作，推动江苏制造高质量“走出去”、精准“引进来”

2025-12-03 13:41:00

曹操出行与越疆合作，人形机器人入驻行业首个“绿色智能通行岛”

12月1日，曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi（自动驾驶出租车）运营场景，共同探索机器人技术在车辆清洁

2025-12-03 13:41:00

江苏“领航工厂”引领“智造”变革

从“智慧车间”到“工业大脑”，“江苏智造”通过数据驱动全流程变革，赋能产业链协同升级近日，全国首批15家领航级智能工厂名单发布

2025-12-03 13:41:00

国内首款AI助盲眼镜发布，基于通义千问打造

12月3日，杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造，具有出行避障

2025-12-03 13:41:00

杭州市公共自行车公司发来短信绑卡租车功能即将取消想问一下

橙友“橙汁儿”向橙柿直通车反映：这几天收到了短信，是杭州市公共自行车公司发来的——“尊敬的用户，由于业务升级，您之前办理的绑卡租车功能即将在2025年12月底取消

2025-12-03 13:41:00

跳出“好评怪圈”，让好评回归本质

北京上班族李想称，健身私教课结束后，教练为索要好评，直接拿他手机代笔修改达3分钟。好评既影响消费者选择，也关联平台推流与服务者收益

2025-12-03 13:41:00

杭州这个社区成了杭州AI人的“线下聚集地”

找“搭子” 聊技术谈合作每日商报讯一个多星期前，“魔搭社区”（杭州）开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间

2025-12-03 13:41:00

头条订阅服务