正确率,清华,模型,全新,科学,方法头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

“AI考生”闯关高考，谁是最会做题大模型？

...报记者赵广立2024年全国高考的“硝烟”刚刚散去，“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱，围绕“大模型技术哪家强”的讨论不绝于耳，各色名目的大模型评测应运而生。作为国...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

哪里不会扫哪里！全球最强数学大模型在线玩，阿里多模态模型加持

现在，最强数学大模型，人人都可上手玩了！一觉醒来，阿里千问大模型团队发布了Qwen2-Math的Demo，抱抱脸在线可玩。惊喜的是，如果嫌输入数学公式比较麻烦，可以把想问的题截图or扫描，上传即可解题。整得挺方便。试玩界...……更多

2024-08-21 09:42:00模型,模态,阿里,数学,全球,在线

OpenAI o1 模型 PlanBench 规划能力实测：

...州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 ...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

美媒：GPT-4通过图灵测试

...伊丽莎”交流，但当与OpenAI的大语言模型交流时，他们的正确率基本在50%。事实证明，他们的预判相当准确。除了54%的人把GPT-4误认为人之外，刚好有50%的人把GPT-3.5(也就是最新大语言模型的直接前身)误认为人。与22%的人把“伊...……更多

2024-05-21 16:36:00图灵,测试,图灵,圣迭戈,研究,人类

OpenAI GPT-4 AI 模型无需额外训练可通过日本理

...格的问题时显得有些吃力。该模型在常规问题上的表现（正确率为 80.1%）远远好于实际问题（正确率为 46.6%）。同样，GPT-4 在处理纯文本问题（正确率为 80.5%）时的表现也远好于那些带有图片和表格的问题（正确率为 35.4%）。...……更多

2024-09-02 09:54:00可通,理疗,日本,模型,训练,考试

DeepMind最新成果剑指量子力学，FermiNet或将破

....livescience.com/24509-light-wave-particle-duality-experiment.html在经典模型中，原子核位于中间，固定数量的电子绕着固定的轨道运行，如同太阳系一般严谨有序。但在量子系统中，电子等粒子完全没有这种精确的轨道，它们的位置是由「概...……更多

2024-09-05 09:51:00量子,力学,难题,成果,量子,方法

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主

...多个APP屏幕识别能力。最新迭代的Ferret-UI 2，就是通用UI模型。可见，「Computer use」已经成为科技大厂们，重点发力的下一个战场。谷歌「贾维斯」年底出世，最强Gemini 2加持代号为Jarvis Project项目，本质上是一个大动作模型（LAM...……更多

2024-10-28 09:51:00贾维斯,贾维,时代,电脑,模型,图标

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

用过GPT-4 Turbo以后，我们再也回不去了

...，OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型，和基于它的一系列应用，一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo，新的大模型更聪明，文本处理上限更高，价格也...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文本能力...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

清华量子计算成果登顶刊，来自丘成桐数学中心团队

...领域首次发现！噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果，刚刚登上Science子刊。（相关成果以“关联生成中量子优势的突然消亡”为题发表于综合性子刊Science Adv...……更多

2024-11-28 12:04:00清华,量子,成果,团队,数学,量子

无表情人脸预测政治信仰，AI准确率惊人！斯坦福研究登国际顶刊

...并被用于通过一个将这些描述符映射到政治倾向量表上的模型来预测参与者的政治倾向。结果发现，面部识别算法可以以0.22的相关系数预测政治倾向。这种相关性虽然不高，但具有统计学意义，表明某些稳定的面部特征可能与...……更多

2024-07-25 09:33:00斯坦,斯坦福,人脸,准确率,信仰,表情

全国首个！湖北为脑机接口医疗服务定价：966元起

...控制机械臂进行书写。在离线状态下100个常用汉字的分类正确率达到了91.3%，在语言模型辅助下，正确率可提高至96.2%。【本文结束】如需转载请务必注明出处：快科技责任编辑：拾柒文章内容举报 ……更多

2025-03-31 15:38:00湖北,医疗服务,元起,定价,接口,医疗

清华大学孙茂松：人工智能会取代部分低端智力劳动者，但不可能发

中新经纬5月24日电 5月23日，清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松在北大光华度小满大模型公开课中，阐述了生成式人工智能对科技、文化和教育的影响。他认为，生成式人工智能(GAI)的基本定位是...……更多

2024-05-24 18:10:00清华大学,清华,人工智能,劳动者,低端,定律

最新迭代人工智能模型生物结构预测准确率显著提升将助力药物研

...由谷歌DeepMind和Isomorphic Labs团队研发的最新迭代人工智能模型AlphaFold3，能以较高准确率预测蛋白质与其他生物分子相互作用的结构，其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎...……更多

2024-05-09 11:54:00迭代,准确率,人工智能,药物,人工,模型