局限性,推理,人类,任务,研究,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...不断提升，例如GPT-4o在大学水平上的多学科多模态理解和推理（MMMU）基准测试中取得了69.1%的准确率。不过，基准测试结果是否真的能反映模型对多样化主题的深入理解，仍然有争议，或者说模型是否只是利用了统计模式，而非...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

《流浪地球2》，这些科技离我们不远

...，缺乏真正的语言理解能力，仅能处理较为单一的问题，局限性非常大。郭涛预测，随着脑科学研究的深入以及人工智能、量子计算等相关技术的发展和成熟，真正能推理和解决问题的强人工智能和超人工智能可能出现，或将产...……更多

2023-01-30 09:00:00地球,流浪,科技,量子,电梯,人工智能

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

2023内容科技应用典型案例：农业银行大模型ChatABC

...解决模型并行、数据并行等训练难题，提升AI大模型训练推理效率。应用：探索大模型知识融合新架构。构建异构知识库，支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架，支持文档类知识的高性能精...……更多

2024-04-08 17:06:00农业银行,典型案例,模型,典型,案例,银行

科学家建立新评价基准，助力评估大模型数据分析能力

...题任务，要求模型在代码执行后对结果进行理解、归纳和推理，提供有价值的观点。尽管 Tapilot-Crossing 已经是规模较大、且较为全面的测试集，其构建成本也低于 100 美元，显示了利用虚拟多智能体容器生成复杂、高质量数据集...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...28日消息，AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference，号称“全球最快”。该服务已经在云端上线。据官网介绍，该推理服务在保证精度的同时，速度比英伟达的服务快20倍；其处理器内存带宽是英伟达...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...拥有一个AI Agent。“如果说2024年是大模型落地应用之年，推理就会越来越重要。此前在训练芯片市场上，英伟达一骑绝尘，占有绝对的市场占有率，那么今天，推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...大模型——跨越文本、图像、视频、音频和代码的无缝推理。”谷歌官网上，这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点：一位更强大的“全科选手”。如果和OpenAI做对比，OpenAI的GPT-3.5一开始是纯文字的大语言模型...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

李开复&张亚勤：未来的首富，将来自AI公司 | WISE20

...所说的，模型越大能力越强，但是模型越大越贵，用起来推理成本也会太高。从我们建零一万物第一天就看得很清楚，怎么把手中的算力做好，把推理成本降下是最重要的。我们相信这是平台级的应用，相信像过去一样移动互联...……更多

2023-11-28 22:29:00王大,李开复,张亚,首富,商业,公司

当Sora能做真实的3D视频，离它能设计战舰也就不远了

...Gemini Advanced在第三方双盲测试中击败了GPT-4，拥有极强的推理能力和长期记忆。2月10日，OpenAI的CEO奥特曼欲将OpenAI、各路投资者、合同芯片制造商和电源供应商联系起来，筹集7万亿美元的资金，打造庞大的芯片制造厂网络，为Ope...……更多

2024-02-21 18:30:00战舰,设计,视频,视频,生成,世界

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

斯坦福团队推出DetectGPT或为检测验证产业链带来新机遇

...视频和图像的检测工作中。然而，这一方法也存在一定的局限性。例如，如果现有的掩模填充模型不能很好地表示有意义的改写空间，则某些域的性能可能会降低，从而降低曲率估计的质量；DetectGPT相比其他检测方法需要更大的...……更多

2023-01-31 09:46:00斯坦,斯坦福,新机,产业链,验证,团队

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

...果比较有限。因此该研究想要探明，在使用比较少的额外推理计算时，就能能让模型性能提升多少？他们设计了一组实验，使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法：（1）迭代自我修订：让模型多次尝试回答一个问...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

“女巴菲特”预期2030年人形机器人进入家庭，通用AI出现，

...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新，以提高性能并降低成本。随着生产用例的出现，AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后，研究人员现在正在优先...……更多

2024-02-05 09:41:00马斯,马斯克,巴菲,巴菲特,人形,机器人

微软被曝未来3年花1000亿美金囤芯片；杨元庆：AI不是取代

...柱。开源大模型Llama3推出，百度智能云支持其全系列训练推理北京时间4月19日凌晨，Meta公布期待已久的多模态开源大模型Llama 3系列，目前包括80亿和700亿两个参数的调优版本。与此同时，Meta还推出了其首款基于Llama 3开源模型的...……更多

2024-04-30 11:00:00杨元庆,微软,美金,芯片,人类,智能

360安全大模型3.0亮相

...方案规划、目标拆解能力；判别中枢具有信息抽取、逻辑推理、是非判断、研判检测能力；道德中枢具有情感分析、道德法律能力；记忆中枢具有信息记忆能力。此外，360以安全大模型为“大脑”，构建出智能体框架，通过任务...……更多

2024-04-01 02:22:00模型,安全,安全,模型,能力,中枢

京东探索研究院院长、京东科技人工智能业务负责人何晓冬：让大模

...据集和奖励模型打分机制，促进模型的快速迭代更新；在推理技术方面，京东采用了端到端低比特高精度量化技术，有效降低了模型体积，同时提升了推理性能，显存节约高达70%；在语音领域，言犀大模型通过迭代优化，实现了...……更多

2024-07-31 11:48:00京东,人工智能,院长,研究院,人工,模型

从通用人工智能到科学智能，“AI爱因斯坦”还远吗？

...需要像AlphaGo Zero那样，从围棋本身出发，具备自我学习、推理和创新能力，这样才可以达到通用人工智能。要实现这一目标，一是需要结合快思考的“黑盒”预测和慢思考的“白盒”逻辑推理，打造“灰盒”可信大模型；二是融...……更多

2024-07-08 09:54:00爱因斯坦,智能,人工智能,人工,科学,人工智能

蚂蚁井贤栋：通过专业智能体的深度连接，AI会像互联网一样带来

...型的“专业教材〞，供大模型训练学习，也能让大模型在推理中随时“翻阅”。这些“专业教材〞，是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。以医疗行业为例，蚂蚁即将发布的“百灵医疗领域大模型”，背...……更多

2024-07-04 18:07:00代际,蚂蚁,深度,升级,互联网,智能

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...检索生成增强的技术方案，但大模型往往存在自我认知的局限性，因此清晰界定其能力边界十分关键。为了使基座模型在生产场景中发挥作用，通常需要将大模型作为一个智能体的核心中枢，将其与具体的外挂知识库工具结合、...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

能与人类谈判、游戏水平媲美真人，Meta 是如何构建新人工智

...两个完全不同的人工智能研究领域并开发了新技术：战略推理（如 AlphaGo 和 Pluribus 等代理中使用的技术）和自然语言处理（如 GPT-3、BlenderBot 3、LaMDA 和 OPT-175B 等模型中使用的技术）。举个例子，CICERO 可以推断出，在游戏后期，...……更多

2023-01-14 13:00:00人工智能,真人,人工,谈判,人类,水平