• 我的订阅
  • 头条热搜
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为...……更多
...速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模型,在两张卡上则可部署高达175B参数。不...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
...作流的形式构建和部署。AI 工作流内部可以调用各类 AI 模型、工具、数据源及其他类型的系统。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。与单次调用 AI 模型相比,AI 工作流提供了更强大、可定制和集成化的解决方案。当...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
苹果发布mm1.5-ui模型
...13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altm...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...押注人工智能领域最大的赌注——一种只能运行Transformer模型的芯片,但其运行速度比GPU快几个数量级。也许注意力确实是你所需要的全部...」 Pika研究人员表示,每秒50万token简直太疯狂了。你可以在2秒内写出「圣经」,或者...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...。 此外,第五代至强还能够支持运行200亿参数的大语言模型(LLM)。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起,英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力,对于这类工作负载,内存带...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
上线仅7天!阿里通义千问3强势登顶全球开源模型宝座
快科技5月6日消息,近日,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军。同时,千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、G...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
What???一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)!而且是前十名中的唯一一家国产公司。(该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。而且...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...智元了解,字节商业化技术团队早在去年就把视觉自回归模型作为重要的研究方向,团队规划了VAR为高优项目,投入研究小组和大量资源。 除了VAR,团队还发表了LlamaGen等相关技术论文,新的研究成果也将在近期陆续放出。事...……更多
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
...动化整个 ML 工作流程,节省数千小时工时。Open AI 的推理模型 o1,这么快就被比下去了?本周五,AI 社区见证了又一项突破:一个完全自动化机器学习流程的 AI 工程师,能轻松获得 Kaggle 大师水平,在参与的 50 个 Kaggle 竞赛上获...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...增强的专业智能体” 相关工作,并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。梁磊介绍,专业领域增强大模型服务框架 KAG 通过图谱逻辑符号引导决策和检索,显著提升了垂直领域决策的精准...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...日),美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 4,Llama 4目前有两个的版本,名为Scout和Maverick。Meta表示,Llama 4是一个多模态大模型,它能够处理和整合各种类型的数据,包括文本、视频、图像和音频,并且可...……更多
更多关于财经的资讯:
福龙马新设子公司,含AI及机器人业务
近日,福龙马环境科技(杭州)有限责任公司成立,经营范围包含:人工智能硬件销售;智能机器人销售;互联网数据服务;物联网技术服务等。企查查股权穿透显示,该公司由福龙马(603686)
2025-11-18 14:12:00
智谱AI、洲明科技携手凌云光成立机器人科技公司
近日,深圳市智显机器人科技有限公司成立,注册资本5000万元,经营范围包含:智能机器人的研发;人工智能硬件销售;智能控制系统集成
2025-11-18 14:12:00
东朔空间|盘点 2025 上海核心商圈写字楼:50-50...
面对当下时代企业办公需求的多元化变革,东朔空间作为上海商办运营领域的创新引领者,东朔发布《2025上海核心商圈写字楼高性价比选项全收录》
2025-11-18 14:35:00
万德斯、中国建筑等在南京成立水务公司
近日,中建水务(南京)有限公司成立,法定代表人为任坤赟,注册资本为1.72亿元,经营范围包含:污水处理及其再生利用;水污染治理
2025-11-18 15:12:00
万里扬等成立水处理技术公司
近日,江山万里扬水处理技术有限公司成立,法定代表人为王峰,注册资本为1300万元,经营范围包含:污水处理及其再生利用;智能水务系统开发
2025-11-18 15:12:00
绿城在杭州成立置业发展公司
近日,杭州绿澜置业发展有限公司成立,法定代表人为何林东一,注册资本为3853万元,经营范围包含:房地产开发经营;市场营销策划。企查查股权穿透显示,该公司由绿城房地产集团有限公司全
2025-11-18 15:12:00
杰瑞股份投资成立清洁能源公司
近日,杰瑞(贵州)清洁能源有限公司成立,法定代表人为谢猛,经营范围包含:燃气经营;矿产资源勘查;陆地石油和天然气开采;发电业务、输电业务、供(配)电业务等。企查查股权穿透显示,该
2025-11-18 15:12:00
浪潮集团在广东横琴成立数字科技公司
近日,浪潮云港(广东横琴)数字科技有限公司成立,法定代表人为乌苏晋,注册资本为1000万元,经营范围包含:区块链技术相关软件和服务
2025-11-18 15:12:00
国电电力在青岛成立绿能新能源公司
近日,绿能(青岛)新能源有限公司成立,法定代表人为孙伟,注册资本为4015.91万元,经营范围包含:生物质能技术服务;海水淡化处理
2025-11-18 15:12:00
小鹏公布机器人控制新专利,可实现精度与灵活性的统一
近日,广州小鹏汽车科技有限公司申请公布机器人控制方法、系统及存储介质专利。专利摘要显示,本申请公开了一种机器人控制方法
2025-11-18 15:12:00
纬德信息等在广州成立深度演化量子科技公司
近日,广州深度演化量子科技有限公司成立,法定代表人为翟炜,经营范围包含:大数据服务;互联网数据服务;人工智能公共数据平台
2025-11-18 15:24:00
2025年贵阳乒乓球邀请赛燃情开赛 国富人寿2.75亿保障全程护航
多彩贵州网讯(记者 王静怡)11月15日,2025年乒乓球颗粒大联盟贵阳邀请赛在“爽爽贵阳”挥拍开赛。作为赛事官方唯一指定保险合作机构
2025-11-18 15:40:00
鸿日达等投资成立半导体新公司
近日,鸿科半导体(东台)有限公司成立,注册资本1.5亿元,经营范围包含:电子专用材料制造;电子专用材料研发;电子专用材料销售;电子元器件制造等。企查查股权穿透显示,该公司由鸿日达
2025-11-18 15:48:00
天玑科技成立人工智能科技公司,含AI及机器人业务
近日,天玑智港(上海)人工智能科技有限公司成立,经营范围包含:智能机器人的研发;人工智能行业应用系统集成服务;信息系统集成服务;信息技术咨询服务等。企查查股权穿透显示,该公司由天
2025-11-18 15:48:00
华东医药成立新公司,含AI及物联网业务
近日,江西云分途科技有限公司成立,经营范围包含:人工智能基础资源与技术平台,人工智能公共服务平台技术咨询服务,人工智能应用软件开发,物联网技术研发,物联网技术服务等。企查查股权穿
2025-11-18 15:48:00