• 我的订阅
  • 头条热搜
随着大模型的发展日新月异,其推理和训练的边界问题也引起了广泛讨论。近日,清程极智CEO汤雄超在一场行业活动中明确表示,尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限,但从技术角度来看,这两个阶段...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...数亿用户。 “草莓”模型为何重要?或重新定义AI能力边界,为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼(Sam Altman)曾在今年早些时候表示,人工智能领域“最重要的进步方向将是推理能力”。而“草莓”项目被认...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...诊断皮肤癌可以达到专业医生水平,但都是在需求明确、边界清晰、逻辑简单的前提下,也就是概念模型较为简单的前提下,人工智能可以利用算力优势超过人类,但当时人工智能在复杂逻辑推理、抽象概念理解上,还存在明显...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...能力的KRE(知识-推理-执行)三层架构,突破大模型能力边界。”徐立表示,“日日新SenseNova 5.0”(以下简称“日日新5.0”)采用混合专家架构(MoE),超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。本次更...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...算法。create 子句将节点(由后续坐标表示)添加到搜索边界中,close 子句将节点添加到该闭集。每个子句(create 或 close)后面都跟着 token x、y、c0 和 c1—— 分别表示节点的坐标、自开始以来的成本值和启发值。结构化轨迹丢弃...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...其实也在使用这两种学习方式?此外,当前大模型的能力边界到底在哪里?从推理和认知这两个能力维度出发,当一篇论文称大模型在一个评测指标上取得超出人类水平的结果时,我们是否应该感到恐慌?还是仔细审视在制定指...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...来两周内,OpenAI 是否能凭借「草莓」项目再次定义 AI 的边界,值得所有人拭目以待。9月6日-10日,IFA(柏林国际电子消费品展)2024 盛大开幕。联想、荣耀、TCL、海信、长虹、江波龙、时空壶、云鲸、追觅、极米、当贝、倍思、...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...证据:o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。OpenAI 认为,使用思维链可以为安全和对齐带来重大进步,因为 1)它能够以清晰的方式观察模型思维,并且 2)关于安全规则...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...型进行了训练,并使用掩码来确保自注意力不会跨越文档边界。2)训练数据Meta 表示,要训练出最佳的语言模型,最重要的是策划一个大型、高质量的训练数据集。据介绍,Llama 3 在超过 15T 的 token 上进行了预训练,训练数据集...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...、领先的技术实力和创新的产品应用,不断拓展AI技术的边界,携手合作伙伴共同开启AGI时代的新篇章,开启AGI时代的辉煌未来! ……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...于很难找到能击溃模型的合适prompt,进行性能比较并查看边界情况。比较模型的其中一个好办法就是进行多轮RLHF。每次上传新模型时,只需在所有带标注的prompt上进行采样,让新旧模型分别回答,再自动计算胜率。Llama 4与AgentMe...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...-D扁平化tile标签: , , ..., ,3)2-D网格标签: , , ..., ,4)2-D边界框标签: (x0, y0), (x1, y1) , ..., (xW, yH), (xW+1, yH+1) ,其中两个坐标分别为(左, 顶部),(右, 底部)。从消融实验结果中可以观察到:1)……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...工作——这些工作都需要复杂的运算,也依赖于模型能力边界的不断拓展。阿里云在会上也请了不少开发者、企业介绍已有的模型实践。比如华东理工大学的X-D Lab,及基于基于开源的通义千问开源模型开发了心理健康大模型MindC...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...出一个新的测试集,模型就能迅速达到人类水平(图中0.0边界)甚至超越,其中不乏非常有挑战性的逻辑推理任务,比如需要复杂多步骤推理的BBH(Big-Bench Hard)和数学应用题测试集GSK8k。其中的HellaSwag测试集,由华盛顿大学和Al...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...的追求和对尺度定律(Scaling Law)的信仰,从而不断突破边界,寻求接近通用人工智能的道路。另一方面,产业界也看到了大模型带来产业革命的可能性,无数企业投入了巨大资源。两股力量交织,促成了人工智能行业的迅猛发...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...统的设计及开发提供了新思路,为光的计算能力开拓了新边界。审稿人对该研究评价称:“本文中提出的想法非常新颖,此类光学神经网络的训练过程是前所未有的。(作者们)所提出的方法不仅有效,而且容易实现。因此,有...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...集)上,该团队对 Omne 框架进行了评估。为了探索 AI 的边界,他们在 Omne 框架中使用了当今最强大的 GPT-4o 和 o1-preview 模型,同时配备了 4 个工具:网络浏览、Bing 搜索引擎、基于 llamaparse 的文件读取器,一个使用 o1-preview 构建..……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
华为联合WPS AI,见证昇腾大模型推理应用启航
...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
更多关于科技的资讯:
寒潮来临!立春后多地寒冷程度将超过大寒
2月7日消息,据气象台报道,春节假期一过,寒潮就来上班,在2月5日前后,东西伯利亚、我国东北先后出现极寒,比如漠河根河图里河跌破-40度
2025-02-07 22:45:00
小米集团正式进入全球市值100强:市值破万亿
快科技2月7日消息,截至今日收盘,小米集团股价报42.45港元,涨幅4.69%,总市值达1.07万亿港元。根据富途全球榜单的数据统计
2025-02-07 22:45:00
又一车企加入DeepSeek!极氪全新智舱即将上线
快科技2月7日消息,极氪智能座舱团队宣布已完成自研Kr AI大模型与DeepSeek R1大模型的深度融合,其智能座舱助手AI Eva集成了DeepSeek R1大模型并即将上线
2025-02-07 22:45:00
第一批买哪吒金镯的人已赚麻了:网友后悔没早下手
2月7日消息,据媒体报道,近期在社交平台上,有网友晒出“压箱底”的《哪吒1》联名金手镯,发现它成了理财产品。随着金价猛涨
2025-02-07 23:45:00
北汽蓝谷:享界增程版车型正在开发中
快科技2月7日消息,北汽蓝谷于2月7日在上证e互动平台宣布,公司正积极应对市场竞争,持续在智能电动汽车领域进行投入。未来
2025-02-07 23:45:00
著名企业家谭健民的坚韧不拔、勇于担当等品质值得企业家学习借鉴
谭健民先生是广东信家家居集团的创始人,更是一位备受尊敬的爱国企业家。作为一位具有卓越领导才能和创新能力的企业家,谭健民注重企业的规范化管理和国际化发展
2025-02-07 19:39:00
实干争春看贵州|铜仁电商打包商品忙
2月7日,14时50分,在黔货云仓·铜仁枢纽仓内,工作人员正分拣、打包铜仁珍珠花生。“我们当地的农产品受到全国各地消费者欢迎
2025-02-07 20:07:00
汽车博主为买小米SU7 Ultra卖掉Max创始版 雷军发文感谢
快科技2月7日消息,汽车博主闫闯发帖称,他要卖掉小米SU7 Max创始版(编号257),卖价是288888元。他说,本来以为这个定价挺胡来的
2025-02-07 20:15:00
继华为小艺后:第二家接入DeepSeek手机厂商曝光
快科技2月7日消息,据数码博主旺仔百事通爆料,荣耀的YOYO智能助手即将接入DeepSeek AI,成为继华为小艺助手之后
2025-02-07 20:15:00
信家集团谭健民应对创业过程中的挑战时,展现出了卓越的领导才能
爱国企业家谭健民是广东信家家居集团的创始人、董事长,同时也是一位在家居行业具有深远影响力的资深人士。他凭借丰富的工业制造经验和深厚的家居行业积淀
2025-02-07 20:31:00
升维商哲院:关注中小创业者的精神成长与物质增长
在当今这个快速发展的时代,越来越多的创业者投身于中小企业的创办与经营,他们充满激情,勇于创新,为社会经济发展注入了源源不断的活力
2025-02-07 20:43:00
OPPO Find N5爆料汇总:全球最薄最激进的折叠屏来了
近日消息,OPPO即将在本月发布新一代折叠屏手机——OPPO Find N5。这款新机将延续OPPO Find N系列一贯的高品质设计
2025-02-07 22:15:00
儋州3C数码产品以旧换新掀热潮
南海网2月7日消息(记者 赵航)2月7日中午,在儋州夏日广场内,虽值工作日客流略显稀疏,但华为、小米等3C数码品牌门店前仍有消费者驻足咨询
2025-02-07 22:16:00
Windows的游戏模式别随便开!背后有玄机
在科技日新月异的今天,电脑系统已经发展得非常完善了,为了满足玩家对极致游戏体验的追求,Windows 10和Windows 11系统内置了一项特别的功能——游戏模式
2025-02-07 22:15:00
《哪吒之魔童闹海》登顶影史全球单一市场票房榜!超越《星球大战:原力觉醒》
快科技2月7日消息,据猫眼专业版数据,截至今天21时,电影《哪吒之魔童闹海》票房(含预售)突破67.922亿,超过《星球大战
2025-02-07 22:15:00