• 我的订阅
  • 头条热搜
面壁智能发布开源大模型eurux-8x22b
5月3日消息,面壁智能发布开源大模型Eurux-8x22B,包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO,主打推理能力。官方测试中,Eurux-8x22B 在 LeetCode(180道LeetCode编程真题)与 TheoremQA(IT之家注:美国大学水准的STEM……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
引言:MaaS(ModelasaService,模型即服务)是一种将人工智能算法模型及其相关能力封装成服务,以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度,并提升人工智能技术的综合应用效能的模式。 上新了...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...二,据知名科技商业类媒体The Information援引多位测试过该模型的人士透露,站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
对标o1,Kimi放出了最能打的国产模型
...性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时间,o1 将大模型的能力又往前推了一步。这段时间,国内大模型初创公司月之暗...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升,尤其是业界领先的编码能力。而Claude 3.5 Haiku与上一代最强Claude 3 Opus性能相当,成本、速度与上一代Haiku相近。甚至,Claude现在...……更多
...6月4日报道,以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推理任务而...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
...北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)。xAI直接揭秘,前一阵子出现在Lmsys大模型竞技场上的神秘模型“sus-column-r”就是Grok-2。在xAI给出的大模型排行榜中,Grok-2的评分优于GPT-4o-mini和Claud……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...公生产力大会上,金山办公展示了携手商汤科技等国内大模型厂商打造的办公平台WPS365。商汤“日日新”大模型凭借其卓越的代码生成及工具调用能力助力WPS365打造更高效释放场景能力的智能办公平台。最强理科能力!商汤“日...……更多
...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...技术优势:它支持智谱 AI、百川智能等国内领先的大语言模型,通过微调和优化提高模型的准确率和可读性,通过开放 API 接口支持个性化的数据应用搭建。(来源:“CSDN”微信公众号)《马斯克多次失手,OpenAI 异军突起,硅...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在2024商汤技术交流...……更多
更多关于科技的资讯:
AMD ROCm 6.4开发平台发布:仍然不支持RDNA 4
快科技4月13日消息,AMD发布了最新版本的ROCm 6.4开发平台,不过奇怪的是,仍然没有加入对RDNA 4架构产品的支持
2025-04-13 21:20:00
1秒充电不止1公里!小鹏发布5C超充AI电池:电驱效率行业第一
快科技4月15日消息,在今晚的发布会上,小鹏汽车再次展示了其最新的5C超充AI电池。小鹏汽车表示,从电池、充电网络到能耗管理
2025-04-15 20:23:00
小鹏高管谈FSD入华:小鹏更懂中国路况 但钦佩特斯拉基本功
快科技4月14日消息,今日下午,小鹏汽车举办“小鹏AI大模型技术分享会”。会上,小鹏汽车自动驾驶负责人李力耘表示,AI大模型让我们看到自动驾驶比任何时候都更接近于落地
2025-04-14 18:51:00
深陷销量暴跌与关税泥潭!玛莎拉蒂否认“被出售”
快科技4月13日消息,玛莎拉蒂品牌负责人近日回应了关于品牌可能被出售的传闻,明确表示母公司Stellantis仍然坚定支持玛莎拉蒂
2025-04-13 16:50:00
传字节跳动AI眼镜有新动作! 已和供应商“搭上线”
快科技4月13日消息,近日,有媒体报道,有知情人士透露了字节跳动在AI硬件领域的又一重大布局——计划推出自家的AI智能眼镜
2025-04-13 15:50:00
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
4月13日,主题为““构想焕发生机的未来社会””的日本大阪·关西世博会(以下简称“大阪世博会”)开幕。大阪世博会中国馆以“共同构建人与自然生命共同体——绿色发展的未来社会”为主题
2025-04-13 16:36:00
Epic官方:游戏并不让人沉迷 许多玩家领了都不玩
近日有人在知乎上提问:“为什么国家不禁止电子游戏行业发展”,Epic游戏商城官方给出回应,引起网友们的热议。Epic在回答中指出
2025-04-15 18:22:00
比亚迪、华为、小米均要参加:2025上海车展展位图公布
快科技4月15日消息,两年一届的上海国际车展将于本月23日开幕,其中23日、24日为媒体日,4月25日至26日为专业观众日
2025-04-15 16:22:00
《黑神话:悟空》1.0.16版本更新上线Wegame:支持DLSS 4.0、XeSS 2.0
快科技4月15日消息,继Epic后,今天下午,《黑神话:悟空》1.0.16.18901版本更新上线WeGame平台。本次更新补丁大小约1
2025-04-15 17:52:00
L4级自动驾驶!埃安滴滴合作新车亮相
快科技4月13日消息,最近,广汽埃安与滴滴自动驾驶合作开发的首款L4级自动驾驶车型正式亮相。这款合作车型将滴滴自动驾驶全新一代硬件平台与广汽埃安的安全冗余平台相结合
2025-04-13 19:20:00
极限拉扯的关税面前 跨境卖家可能需要更多的“拼多多”
这段时间,哥几个的首页应该已经被各种关税的热搜话题轰炸麻了吧。美国逆天的“对等关税”一签署,可以说是向全世界发起了无差别攻击
2025-04-15 00:52:00
半价理想L8再上强度!零跑C16推限时一口价:11.87万起 降价超3.7万
快科技4月13日消息,零跑汽车日前宣布,即日起至2025年4月26日24点,通过零跑官方渠道下定C16车系且在2025年6月30日(含)前交付的用户
2025-04-13 08:20:00
AMD苏姿丰谈表舅黄仁勋:有很大的敬意 他建立了一家了不起的公司
快科技4月15日消息,今日,AMD董事长兼CEO苏姿丰现身台大演讲,并接受学生提问。被问及与亲戚NVIDIA创始人黄仁勋的互动
2025-04-15 18:22:00
腾势正式进军欧洲:目标两年内覆盖10+国家销售
快科技4月14日消息,近日,腾势汽车在欧洲正式发布,并展示了腾势Z9GT,标志着其正式进入欧洲市场。腾势品牌计划在未来两年内进入数十个欧洲国家销售
2025-04-14 18:51:00
以后新能源车都要贴冰箱上的能效标识了吗
大伙儿买空调、冰箱、洗衣机的时候,肯定见过这张神秘的红绿贴纸。这其实就是家用电器的能效分级标识,像脖子哥这么顾家的男人
2025-04-13 15:20:00