模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...引入思想链（CoT，Chain of Thought）的概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一，A

...和子榜两项第一，AI智能体方向受瞩目近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent（AI智能体）子榜中，SenseChat 3.0 同样...……更多

2023-10-13 14:26:00商汤,评测,方向,智能,模型,商汤

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...转自：中国新闻网6月3日，昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑

CPU,正在被AI时代抛弃？

...对话可以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

戴尔以技术创新推动AI基础架构升级

...蓬勃发展的AI应用背后离不开底层基础设施的支持。以大模型的训练和推理为例,大模型的参数量已经从数十亿增加到几百亿、几万亿甚至更高,更大的模型带来了更大的AI算力需求。有数据显示,AI所消耗的算力平均每3至4个月就会...……更多

2024-04-22 18:00:00戴尔,技术创新,架构,升级,基础,技术

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首次对...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

Meta大模型LLaMA 3即将登场，参数量或达1400亿

在推出开源大模型LLaMA2近一年之后，Meta的新一代大模型LLaMA3即将面世。在4月9日伦敦举行的一次活动中，Meta确认计划在下个月内首次发布LLaMA3。据了解，该模型将有多个具有不同功能的版本。但Meta并没有披露LLaMA3的参数规模。...……更多

2024-04-10 22:40:00模型,参数,模型,伯格,参数,扎克

英伟达地表最强，黄教主被称作AI界“霉霉”

...多款重磅明星产品，目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练，行业内“一芯难求”的局面迟迟得不到缓解。而今年，按照英伟达每两年更新一次GPU架构的节奏，大家都对英伟达新一代计算平台翘首...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

引领消费金融数智化时代招联发布行业首个开源金融大模型“招联

引领消费金融数智化时代招联发布行业首个开源金融大模型“招联智鹿” 在金融数字化转型加速的大背景下，AI人工智能机器人逐渐成为行业关注的焦点。近日，招联消费金融股份有限公司（以下简称“招联”）发布消费金融...……更多

2023-11-06 19:17:00智化,金融,模型,消费,时代,行业

【产业互联网周报】字节回应被曝秘密利用OpenAI；英特尔预

...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型，字节跳动回应OpenAI封禁账户：正与OpenAI联系沟通据外媒报道，字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域，这一做法通常被视为一种...……更多

2023-12-18 22:02:00马斯,英特,英华,马斯克,英特尔,阿里

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型，o1系列模型包括o1、o1-mini以及抢先版o1-preview，o1-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini，其最强大的TPU（张量处理单元）系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本，谷歌承诺其速...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...手的AI论文在外网引发热议。论文中，研究团队提出了Q*模型算法，帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比，雄心勃勃地宣布进入“Gemini时代”，更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！最近Llama-3.1登上开源顶峰，但其最强的405B版本模型900多GB的内存需求，对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC，能...……更多

2024-08-05 09:34:00工具包,模型,工具,模型,算法,工具

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

推理性能提升30倍！英伟达发布史上最强AI芯片，黄仁勋：将成

...用计算机开始，伴随着Windows 95、加速计算乃至深度学习模型AlexNet的出现，再到2016年，黄仁勋亲手将第一台DGX-1超级计算机送给了OpenAI。而在2022年，随着聊天机器人ChatGPT横空出世，生成式AI带来了全新一轮产业革命。黄仁勋手绘...……更多

2024-03-19 08:53:00英伟,推理,芯片,性能,成功,产品

自主研制！我国发布全球首个百亿级遥感解译基础模型

...天信息技术大会上，我国自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版正式发布。据了解，这是迄今全球首个百亿参数级空天一体遥感解译基础模型。3.0版内核工作架构基于热传导，这是联合团队自主研发的一套...……更多

2024-09-22 07:25:00遥感,模型,我国,基础,全球,空天

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推理任务而...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

文｜王怡宁编辑｜邓咏仪尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面，Meta更新了编程模型Code Llama 70B，是Code Llama系列中规模最大，性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face，跑分接近GP...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

让AI无处不在高通全面开启终端侧生成式AI大门

...，AI将重塑消费者对用户体验的感知，骁龙将成为所有AI模型在终端侧运行的首选平台。基于这样的价值考量，在今年骁龙峰会上，高通推出了两款全新平台，二者无不强调了终端侧生成式AI体验的需求，从底层为用户提供贴近生...……更多

2023-11-08 09:29:00高通,终端,生成,大门,高通,终端

苹果公司公布“mm1”多模态大模型

...dalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...开的彻彻底底。这不，Meta一连放出三篇技术文章，从大模型适配方法出发，介绍了：如何使用特定领域数据微调LLM，如何确定微调适配自己的用例，以及如何管理良好训练数据集的经验法则。接下来，直接进入正题。适配大模...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

乔布斯时代之后，会迎来黄仁勋时代吗？

...AI能够做的工作有了更强烈的预期和紧迫感，而且各种大模型如雨后春笋一般地涌现出来，市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候，人们忍不住要惊呼了。这是Hooper后的新一代架构，以数学家Blackwell命名。...……更多

2024-03-20 09:11:00乔布,时代,芯片,模型,英伟,布斯

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

OpenAI-o1替代品来了，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

清华提出CharacterGLM；DeepMind联创发全新

...技术优势：它支持智谱 AI、百川智能等国内领先的大语言模型，通过微调和优化提高模型的准确率和可读性，通过开放 API 接口支持个性化的数据应用搭建。（来源：“CSDN”微信公众号）《马斯克多次失手，OpenAI 异军突起，硅...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

page 5/3334 首页上一页 1 2 3 456 7 8 9 10 下一页末页

更多关于科技的资讯：

基于提示工程的模型输出不确定性量化分析

摘要：随着生成式人工智能技术在各行业的广泛应用，模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性，对输出不确定性进行量化分析成为重要方向

2025-12-04 06:17:00

给智能体装上“大脑”和“小脑”

杭州博士后用AI让机器懂协作、更安全杭州日报讯让机器从执行命令的“孤岛”，成为懂得协作的群体？让机器人安全走进人类生活

2025-12-04 06:38:00

紫林醋业产品通过欧盟认证

12月3日从紫林醋业获悉，紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification)，获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)

2025-12-04 07:31:00

豆包手机助手回应“侵犯用户隐私”：不存在任何黑客行为

中新经纬12月3日电 12月3日，豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应，称不存在任何黑客行为。具体来看

2025-12-04 07:42:00

支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖

12月1日-3日，由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上，首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式

2025-12-04 07:47:00

海内外太空算力布局同步加速

近期，在“智绘星空胜算在天—太空数据中心建设工作推进会”上，北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统

2025-12-03 09:42:00

太极韵动武汉，一场独属于银发爱好者的健康之约

承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕

2025-12-03 13:40:00

“数字试错”替代“物理试错” 新一代AI质检平台在杭发布

杭州日报讯产品还没走下生产线，就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前，工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”

2025-12-03 13:41:00

“江苏制造”叩响中东商机

本报记者陆春花为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作，推动江苏制造高质量“走出去”、精准“引进来”

2025-12-03 13:41:00

曹操出行与越疆合作，人形机器人入驻行业首个“绿色智能通行岛”

12月1日，曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi（自动驾驶出租车）运营场景，共同探索机器人技术在车辆清洁

2025-12-03 13:41:00

江苏“领航工厂”引领“智造”变革

从“智慧车间”到“工业大脑”，“江苏智造”通过数据驱动全流程变革，赋能产业链协同升级近日，全国首批15家领航级智能工厂名单发布

2025-12-03 13:41:00

国内首款AI助盲眼镜发布，基于通义千问打造

12月3日，杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造，具有出行避障

2025-12-03 13:41:00

杭州市公共自行车公司发来短信绑卡租车功能即将取消想问一下

橙友“橙汁儿”向橙柿直通车反映：这几天收到了短信，是杭州市公共自行车公司发来的——“尊敬的用户，由于业务升级，您之前办理的绑卡租车功能即将在2025年12月底取消

2025-12-03 13:41:00

跳出“好评怪圈”，让好评回归本质

北京上班族李想称，健身私教课结束后，教练为索要好评，直接拿他手机代笔修改达3分钟。好评既影响消费者选择，也关联平台推流与服务者收益

2025-12-03 13:41:00

杭州这个社区成了杭州AI人的“线下聚集地”

找“搭子” 聊技术谈合作每日商报讯一个多星期前，“魔搭社区”（杭州）开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间

2025-12-03 13:41:00

头条订阅服务