• 我的订阅
  • 头条热搜
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为...……更多
...速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模型,在两张卡上则可部署高达175B参数。不...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
...作流的形式构建和部署。AI 工作流内部可以调用各类 AI 模型、工具、数据源及其他类型的系统。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。与单次调用 AI 模型相比,AI 工作流提供了更强大、可定制和集成化的解决方案。当...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
苹果发布mm1.5-ui模型
...13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altm...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...押注人工智能领域最大的赌注——一种只能运行Transformer模型的芯片,但其运行速度比GPU快几个数量级。也许注意力确实是你所需要的全部...」 Pika研究人员表示,每秒50万token简直太疯狂了。你可以在2秒内写出「圣经」,或者...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...。 此外,第五代至强还能够支持运行200亿参数的大语言模型(LLM)。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起,英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力,对于这类工作负载,内存带...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
上线仅7天!阿里通义千问3强势登顶全球开源模型宝座
快科技5月6日消息,近日,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军。同时,千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、G...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
What???一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)!而且是前十名中的唯一一家国产公司。(该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。而且...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...智元了解,字节商业化技术团队早在去年就把视觉自回归模型作为重要的研究方向,团队规划了VAR为高优项目,投入研究小组和大量资源。 除了VAR,团队还发表了LlamaGen等相关技术论文,新的研究成果也将在近期陆续放出。事...……更多
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
...动化整个 ML 工作流程,节省数千小时工时。Open AI 的推理模型 o1,这么快就被比下去了?本周五,AI 社区见证了又一项突破:一个完全自动化机器学习流程的 AI 工程师,能轻松获得 Kaggle 大师水平,在参与的 50 个 Kaggle 竞赛上获...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...增强的专业智能体” 相关工作,并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。梁磊介绍,专业领域增强大模型服务框架 KAG 通过图谱逻辑符号引导决策和检索,显著提升了垂直领域决策的精准...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...日),美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 4,Llama 4目前有两个的版本,名为Scout和Maverick。Meta表示,Llama 4是一个多模态大模型,它能够处理和整合各种类型的数据,包括文本、视频、图像和音频,并且可...……更多
更多关于财经的资讯:
因认证认可违法行为 罗马仕被罚没超124万元
中新网12月12日电(吴家驹)深圳市市场监督管理局网站显示,近日,深圳罗马仕科技有限公司因违反强制认证规定、虚假宣传案
2025-12-12 14:46:00
中信银行深化小微融资协调机制,以金融活水润泽实体经济
自支持小微企业融资协调工作机制建立以来,中信银行践行金融工作的政治性、人民性,通过“五专五强化”工作模式,系统化推动工作机制落地
2025-12-12 14:53:00
张家口市桥东区智能辅助数字人精准赋能经营主体
河北日报讯(郭晓通、王宁)日前,张家口市桥东区聚焦存量公司实缴衔接难题,以数据赋能推出智能辅助数字人服务模式,通过自动化采集
2025-12-12 14:56:00
一张“电费证”,按下“金融快充”键——华夏银行为黔企生产线蓄能“满格电量”
多彩贵州网讯(本网记者 李晓芳)当冬日的寒意笼罩大地,一笔2926.35万元的“金融活水”悄然涌入贵州某磷化工企业的生产线
2025-12-12 15:21:00
红豆集团等成立智慧科技公司,含AI及机器人业务
近日,无锡红豆智慧科技有限公司成立,注册资本3.34亿美元,经营范围包含:人工智能硬件销售;智能机器人的研发;人工智能应用软件开发;人工智能基础资源与技术平台等。企查查股权穿透显
2025-12-12 15:48:00
宝马、金杯汽车等在沈阳新设汽车产投基金,出资额8亿
近日,沈阳汽车产业投资基金合伙企业(有限合伙)成立,出资额8亿元,经营范围包括创业投资、以私募基金从事股权投资、投资管理
2025-12-12 15:48:00
沃顿科技在南京成立新公司,注册资本3亿元
近日,沃顿科技(南京)有限公司成立,注册资本3亿元,经营范围包含:生态环境材料制造;新型膜材料制造;新型膜材料销售等。企查查股权穿透显示,该公司由沃顿科技(000920)全资持股
2025-12-12 15:48:00
天兵科技在河南成立航天装备公司,含多项火箭相关业务
近日,河南天兵航天装备有限公司成立,注册资本1亿元,经营范围包含:火箭发动机研发与制造;航天器及运载火箭制造;火箭发射设备研发和制造
2025-12-12 15:48:00
蓝箭航天申请公布新专利,可提升可复用火箭着陆的可靠性、精准度
近日,蓝箭航天空间科技股份有限公司申请公布“一种可复用火箭着陆段开机高度预测方法、制导系统及处理器”专利。专利摘要显示
2025-12-12 15:48:00
远景能源等在宜昌成立矿业公司
近日,宜昌景投矿业有限公司成立,法定代表人为赵卫军,注册资本为1.5亿元,经营范围包含:非煤矿山矿产资源开采;矿产资源勘查
2025-12-12 15:48:00
苏州银行:后斌辞任风险总监
12月11日,苏州银行股份有限公司发布关于高级管理人员辞任的公告,后斌先生因年龄原因,辞去本行风险总监职务。
2025-12-12 16:01:00
沂源县委书记张涛带队赴双汇集团开展“双招双引”工作
近日,沂源县委书记张涛带队赴双汇集团开展“双招双引”工作,精准链接需求,深化产业协作,以最大诚意架起合作桥梁,为县域经济社会高质量发展集聚优势动能
2025-12-12 16:01:00
彭祥福:岩层与浪潮间的攻坚者
在泉州碧波之畔,中建筑港承建泉惠石化工业区超超临界热电联产项目煤码头建设正酣。建设现场机器轰鸣,却有一个身影常常安静地立于图纸前或海堤边
2025-12-12 16:01:00
渝农商行:张桥云辞任独立董事
12月11日,重庆农村商业银行股份有限公司发布关于独立董事辞任的公告,张桥云先生辞去本行第五届董事会独立董事职务,并不再担任本行董事会提名委员会主任委员及战略发展委员会、风险管理
2025-12-12 16:02:00
中建五局福州高新区路网项目联合属地单位开展“深学笃行强担当・党建引领促发展”主题党日活动
知识抢答环节12月10日,中建五局福州高新区路网项目牵头联合新南公司、安里社区、南屿派出所、海峡金投等十余家驻区单位,共同开展 “深学笃行强担当・党建引领促发展”主题党日活动
2025-12-12 16:02:00