多远,推理,草莓,模型,模型,思维头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

AI发展变慢了？几位AI头部创业者并不赞同

...月份发布的GPT-4o（多模态语言大模型），9月份发布的o1（推理大模型），质量都可圈可点。与去年相比，他认为，今年AI行业的特色是，之前只有OpenAI一家独大，现在已经变成了群雄并起、你追我赶的状态，各家公司都在提速。...……更多

2024-09-21 13:52:00创业者,头部,创业,发展,模型,大昕

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

智启新元年：PC成为AI落地首选终端

...，真正走入大众生活，已经到时候了。距离AI普惠，还有多远？可以说，当下生成式AI的“涌现”，是多种软硬件技术发展成熟的共同结果。硬件方面，GPU技术高速发展、框架不断更新，已自比CPU更快运行3D图像的“显卡”角色脱...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

华东师范大学的老师，上课已经用上了大模型

...的算力，还要有灵活组合、弹性扩展的能力，既能兼顾AI推理等新型负载，又要进一步强化传统的通用计算平台及应用。第二，软硬兼修的优化适配。随着大模型在教育领域的应用兴起，高校对AI平台提出了更高的要求。一方面...……更多

2024-07-01 09:22:00华东师范大学,华东,师范,模型,老师,大学

构建数字经济新引擎：枫清科技高雪峰解读AI技术的未来趋势

...地过程中也暴露出一系列问题，如大模型“幻觉”现象、推理能力不足、解释性差等。这些问题导致很多企业面临大模型“好玩不好用”的困境。如何真正推动大模型技术在企业场景中的深度应用，成为当前AI产业发展的重要课...……更多

2024-09-13 18:28:00雪峰,趋势,数字,引擎,经济,技术

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功

...单纯的计算资源提供者，他们需要向客户提供大模型训练推理等增值服务，以减少客户在模型开发过程中的成本负担，助力客户进行人工智能转型，从而实现双赢。”超新星分布式微算力中心——AICC建设运营高性价比选择本次...……更多

2024-04-03 17:00:00鸿沟,集群,发布会,成功,产品,科技

大模型降价背后，国产大模型的竞争逻辑变了

...市场拱手让人。另一方面，随着大模型产业的快速发展，推理成本飞速下降，也成为终端降价的基础。据百度官方透露，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了1...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

惊人千亿估值、三大巨头争夺！Sam Altman不愧“史上融

...OpenAI神秘“草莓”和“猎户座”模型“泄漏”。“草莓”推理能力大爆发，可处理复杂数学问题；“猎户座”则是超越GPT-4的下一代大模型，使用“草莓”的高质量数据训练，从而减少模型产生的幻觉或错误。该公司很可能使用...……更多

2024-08-30 09:31:00人千,估值,巨头,融资,三大,估值

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...技等也分别推出全新的大模型产品。李开复表示，大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段，今年会迎来“大模型应用爆发元年”。他同时预测，明年下半年，随着大模型推理成本的大幅度下降，人们...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

化学：强化归类研究明确命题追求

...生在“宏微结合”“变化平衡”等思想观念指引下的证据推理、模型认知、科学探究与符号表征等能力素养状况以及科学态度、社会责任等个性品质与价值观念发展水平。这样的命题追求是指导并统领命题的行动指南。毫无疑问...……更多

2023-10-13 09:11:00归类,命题,化学,研究,试题,考查

LLM群体智能崛起，数学性能暴增11.6%！谷歌DeepMi

...认知，数学最考验元认知，原本是指，人类对自己思维、推理过程的直观认识。那么，大模型也具备「元认知」的能力吗？研究人员对此，提出了一种假设，并设想是否可以通过知识引导，进一步提高LLM的能力。其实，此前的...……更多

2024-09-23 09:50:00新作,群体,性能,数学,机构,智能

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

深入探讨干支历模型促进干支象数医学循证研究

...生猜想，再提出理论猜想，继而经过数理或通过猜想建立推理范式，对其推理体系中具有共性的问题进行实验检验，并可结合数理模型和实际观察进行检验，以矫正理论猜想。在多次检验的基础上形成更加完善并经地起实践检验...……更多

2024-01-12 08:00:00干支,模型,医学,研究,干支,理论

谷歌公司发布人工智能模型“双子座”

...的32项学术基准中，从自然图像、音频和视频理解到数学推理，“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称，在图像识别领域的测试结果显示，“双子座”Ultra性能优于迄今最先进的人工智能模型，具有天然多...……更多

2023-12-08 07:31:00人工智能,双子座,双子,人工,模型,智能