新时代,推理,逻辑,模型,模型,问题头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的1/360 | 最前线

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

20多家车企接入DeepSeek：为啥没有“蔚小理华米特”

...上叫我给他们讲讲 AI 是怎么回事。由于同时具备强大的推理能力及开源模型两个特质，导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头，尽管都有各自自研的模型，但不...……更多

2025-02-14 12:52:00米特,接入,多家,模型,推理,智能

百川智能发布大模型产品Baichuan 2

...语言数据进行训练，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中Baichuan2-13B-Base相比上一代13B模型，数学能力提升49%，代码能力提升46%，安全能力提升37%，逻辑推理能力提升25%，语义理解能力提升...……更多

2023-09-06 20:04:00百川,模型,智能,产品,能力,逻辑推理

百度文心一言发布会详细纪要

...话体现出文心一言各方面的能力，比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难，但是对于一个生成式预训练大模型来说，出错的概率还是挺高的，这些问题都答对相当不容易，因为百度的...……更多

2023-03-17 12:00:00纪要,文心,发布会,模型,文心,能力

业界首款！中国联通发布元景思维链大模型：性能比肩OpenAI

...大慢思考能力，又具备不限于数学的多学科、多场景通用推理能力，且能做到针对不同任务和难度的自适应慢思考，大幅降低资源消耗。中国联通表示，主流榜单的测评结果显示，元景思维链大模型的表现超过了目前最好的通用...……更多

2025-01-24 12:33:00中国联通,中国,模型,思维,业界,性能

36氪独家 | 「Fabarta」获过亿元人民币 pre

...创投作为老股东在本轮均超额追投。随着GPT4的推出，其推理能力、多模态处理能力，都进一步优于GPT3.5，让越来越多人意识到大语言模型（LLM）的的重要性。但是，OpenAI并没有公布其技术路径，引发了全球猜测。在Fabarta CEO高雪...……更多

2023-04-18 08:07:00大图,融资,模型,人民币,时代,人民

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

算力逻辑修复！各大厂商接入DS催化港股AI基建概念李彦宏称

...极发展成本较低的自有ASIC方案，并把重心从AI训练转往AI推理，预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展。中信证券的研报也指出，DeepSeek通过工程化能力创新，实现了大模型训练和推理算力成...……更多

2025-02-17 16:31:00大厂,李彦,港股,基建,催化,接入

华为harmonyosnext重塑全新“星盾”安全架构

...待HarmonyOSNEXT带来的全新体验，共同见证华为引领的智能新时代。 ……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

百度王海峰披露飞桨生态最新成果开发者数量已达800万

...降低人工智能应用门槛；自动化方面，从训练、适配，到推理部署，提升人工智能研发全流程效率；模块化方面，丰富的产业级模型库，支撑人工智能在广泛场景的便捷应用。据了解，得益于飞桨产业级深度学习开源开放平台...……更多

2023-08-17 09:15:00王海,王海峰,开发者,成果,数量,生态

克服“大模型幻觉” 知识图谱融合大模型应用平台发布

...它更倾向于基于统计规律生成回答，而非进行深入的逻辑推理或形成高级的认知能力。另外，它在生成文本时可能会受限于训练数据中存在的偏见和误导性信息，在某些情况下可能会产生不准确或不合理的回答。对于这种基于技...……更多

2023-09-08 21:31:00模型,图谱,幻觉,应用,知识,平台

讯飞星火3.0发布：综合能力已超chatgpt

...格外突出。”刘庆峰指出，认知大模型正在开启一个增长新时代，大模型正日益与每个人息息相关。刘庆峰指出：“在当前全球政治、经济军事面临巨大挑战和不确定前提下，通用人工智能是这个时代最确定的增长动力来源。”...……更多

2023-10-24 11:10:00讯飞,星火,能力,综合,讯飞,星火

2023IDEA大会：让大模型更好应对复杂问题

...本正经的胡说八道”怎么解？众所周之，大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

...用的多个公开Benchmark上，腾讯混元Turbo S在知识、数学、推理等多个领域展现出对标DeepSeek-V3、GPT-4o、Claude3.5等业界领先模型的效果表现。表格中，其他模型的评测指标来自官方评测结果，官方评测结果中不包含部分来自混元内...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

张云泉：集中力量，促进国产AI大模型发展

...作为数字经济时代的全新生产力，数据、算力和算法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力，且算力成本占据整体开销的大头。可以说，算力成为支撑大模型发展的关键因素，也是科技...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

科大讯飞入局大模型混战，刘庆峰：10月底将赶超ChatGPT

...个维度，具体包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆，产生全新的机会。”“认知大模型成为通用人工智能的曙光，科大讯飞...……更多

2023-05-07 03:00:00模型,讯飞,模型,星火,能力,认知

东大发布深度推理法律垂域大模型

实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯（记者何洁通讯员毕胜）近日，东南大学法学院数字法学团队依托东南大学大数据计算中心，正式发布国内高校首个深度推理法律垂域大模型—...……更多

2025-03-19 08:25:00东大,推理,深度,模型,法律,法律

科研也完了，AI暴虐170位人类专家！Nature子刊：大模

...读、科研的解决方案，其通用能力覆盖了专业考试、有限推理、翻译、解决数学问题，甚至还能写代码。已有的研究考察了大模型在科研领域的表现，但基准数据集大多属于「回顾性质」的，比如MMLU、PubMedQA和MedMCQA，主要以问...……更多

2024-12-09 09:50:00暴虐,准确率,模型,高达,完了,科研

大模型，是时候谈“钱”了

...吞金兽的大模型，如何跑通商业模式，覆盖高昂的训练和推理成本，是一个不得不考虑的现实问题，也是困住人工智能老生常谈的问题。始于计算机视觉领域，近身肉搏于安防场景，上一轮人工智能的火爆，催生了“AI四小龙”...……更多

2023-09-15 00:34:00模型,时候,模型,商汤,企业,商业

对话熵简科技：垂直领域的数据是大模型应用的关键 | 年度AI

...辑 |石亚琼封面来源｜企业官方掌握了人工智能就掌握了新时代的生产力密码。在ChatGPT爆火的当下，大模型火遍全球，中国产业也激发了对人工智能应用的新热情。因此，这个时间点，36氪数字时氪团队正式启动《年度AI对话》...……更多

2023-05-08 14:10:00对话,模型,领域,关键,年度,应用

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

智慧家庭重磅文件，征求意见稿来了！事关千亿市场、8大应用场景

...标准的技术水平和国际影响力将显著提升，形成适合我国新时代发展国情的智慧家庭标准体系。为了实现上述目标，《指南》强调了标准验证服务能力建设的重要性，特别是在智慧家庭产业和标准化结合紧密的区域，将重点开展...……更多

2024-11-23 09:40:00重磅,场景,智慧,意见,文件,家庭

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...型有效训练时长占比达到 98% 以上。TeleChat-52B在OpenCampass推理榜单排名第一在今年5月的 OpenCampass 测试榜单中，TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本，TeleChat2-115B 在9月最新公布的 C-Eval ……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

第二届世界科学智能大赛启动向全球发起选手招募

...需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理，打造‘灰盒’可信大模型。具体而言，通过融合科学规律、观测数据和合成数据，开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席，上智院院...……更多

2024-07-05 14:45:00第二届,招募,选手,大赛,智能,科学