• 我的订阅
  • 头条热搜
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为...……更多
...速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模型,在两张卡上则可部署高达175B参数。不...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
...作流的形式构建和部署。AI 工作流内部可以调用各类 AI 模型、工具、数据源及其他类型的系统。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。与单次调用 AI 模型相比,AI 工作流提供了更强大、可定制和集成化的解决方案。当...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
苹果发布mm1.5-ui模型
...13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altm...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...押注人工智能领域最大的赌注——一种只能运行Transformer模型的芯片,但其运行速度比GPU快几个数量级。也许注意力确实是你所需要的全部...」 Pika研究人员表示,每秒50万token简直太疯狂了。你可以在2秒内写出「圣经」,或者...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...。 此外,第五代至强还能够支持运行200亿参数的大语言模型(LLM)。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起,英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力,对于这类工作负载,内存带...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
上线仅7天!阿里通义千问3强势登顶全球开源模型宝座
快科技5月6日消息,近日,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军。同时,千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、G...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
What???一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)!而且是前十名中的唯一一家国产公司。(该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。而且...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...智元了解,字节商业化技术团队早在去年就把视觉自回归模型作为重要的研究方向,团队规划了VAR为高优项目,投入研究小组和大量资源。 除了VAR,团队还发表了LlamaGen等相关技术论文,新的研究成果也将在近期陆续放出。事...……更多
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
...动化整个 ML 工作流程,节省数千小时工时。Open AI 的推理模型 o1,这么快就被比下去了?本周五,AI 社区见证了又一项突破:一个完全自动化机器学习流程的 AI 工程师,能轻松获得 Kaggle 大师水平,在参与的 50 个 Kaggle 竞赛上获...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...增强的专业智能体” 相关工作,并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。梁磊介绍,专业领域增强大模型服务框架 KAG 通过图谱逻辑符号引导决策和检索,显著提升了垂直领域决策的精准...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...日),美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 4,Llama 4目前有两个的版本,名为Scout和Maverick。Meta表示,Llama 4是一个多模态大模型,它能够处理和整合各种类型的数据,包括文本、视频、图像和音频,并且可...……更多
更多关于财经的资讯:
蚂蚁集团联合AlipayHK捐赠1000万港元 紧急支援香港大埔火灾救援
11月27日,香港大埔宏福苑发生五级火灾,灾情严峻,令人揪心。蚂蚁集团和在港企业AlipayHK首批捐赠1000万港元
2025-12-01 15:29:00
金融保险业迅速行动 多措并举支援大埔火灾受灾民众
11月26日香港大埔宏福苑发生严重火灾后,本地多家银行与保险机构迅速启动重大突发事件应急机制,推出一系列紧急金融服务与理赔支持措施
2025-12-01 15:34:00
金融有爱 服务无碍 赫章农商银行平山支行暖心守护残障群众
当金融服务邂逅特殊需求,多一份贴心援助,便少一分通行障碍;多一句细致引导,便增一份安心信赖。近日,一名开着小电动车的残疾女士在厅堂安保的协助下来到赫章农商银行平山支行
2025-12-01 15:35:00
赫章农商银行水塘堡支行:高效助力客户追回不明扣款,悉心守护资金安全
客户资金安全至关重要,贴心服务暖人心。2025年11月24日,赫章农商银行水塘堡支行工作人员以专业且细致的服务,成功协助客户陆某追回被不明扣除的资金5000余元
2025-12-01 15:36:00
筑牢合规防线,引领稳健前行——贵定农商银行持续深化“高管讲合规”活动
合规是金融行业的生命线,更是银行实现高质量发展的根本保障。为深入贯彻落实国家监管要求,厚植合规文化土壤,筑牢合规经营理念
2025-12-01 15:36:00
国家金融监督管理总局下发紧急通知 指导金融机构全力做好大埔火灾金融保障工作
国家金融监督管理总局近日向各相关金融机构下发紧急通知,就全力做好香港大埔区“11·26”重大火灾的金融保障服务工作作出专项部署
2025-12-01 15:37:00
纵横股份成立凤舞无人机技术公司,含AI业务
近日,河北纵横凤舞无人机技术有限公司成立,注册资本2000万元,经营范围包含:人工智能通用应用系统;智能无人飞行器制造;智能无人飞行器销售;人工智能应用软件开发等。企查查股权穿透
2025-12-01 15:48:00
腾讯旗下财付通小贷公司增资至150亿
近日,财付通小贷关联公司深圳市财付通网络金融小额贷款有限公司发生工商变更,注册资本由约105.3亿人民币增至150亿人民币
2025-12-01 15:48:00
三友科技等成立硅基启灵科技公司,含AI及机器人业务
近日,硅基启灵(杭州)科技有限公司成立,经营范围包含:人工智能基础软件开发;智能机器人的研发;智能机器人销售;人工智能理论与算法软件开发等。企查查股权穿透显示,该公司由三友科技(
2025-12-01 15:48:00
佛塑科技、广东广新创新研究院成立新材料公司
近日,佛山佛塑新材料有限公司成立,注册资本7500万元,经营范围包含:电子专用材料研发;电子专用材料制造;电子专用材料销售;真空镀膜加工等。企查查股权穿透显示,该公司由佛塑科技(
2025-12-01 15:48:00
千方科技持股公司成立新公司,含卫星通信服务业务
近日,千方联陆智能科技(深圳)有限公司成立,法定代表人为花中南,注册资本为1000万元,经营范围包含:物联网技术服务;人工智能基础软件开发
2025-12-01 15:48:00
骏亚科技等成立新公司,含电子元器件制造业务
近日,梅州市旭曜电子科技有限公司成立,法定代表人为赖佳骏,注册资本为3000万元,经营范围包含:电子元器件零售;电子元器件制造
2025-12-01 16:00:00
每日互动、神思电子等成立科技公司,含多项AI业务
近日,山东每日思数科技有限公司成立,注册资本2000万元,经营范围包含:人工智能基础资源与技术平台;人工智能理论与算法软件开发
2025-12-01 16:00:00
中国中煤在新疆成立电力销售公司,注册资本2亿元
近日,中煤(新疆)电力销售有限公司成立,法定代表人为宋继业,注册资本为2亿元,经营范围包含:供电业务;发电业务、输电业务、供(配)电业务;储能技术服务;环境保护监测等。企查查股权
2025-12-01 16:00:00
上交所问询后仍涨停!国晟科技16天11板
此前已经走出15天10板的“牛股”国晟科技(603778)股价再上台阶,晋级16天11板,但该股今日封板力度明显减弱。早盘
2025-12-01 16:11:00