• 我的订阅
  • 头条热搜
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
...模型的精度,同时保持了线性注意力优越的并行计算与高推理速度。论文链接:https://arxiv.org/abs/2405.16605 代码链接:https://github.com/LeapLabTHU/MLLA 视频讲解:https://www.bilibili……更多
...能设备或家庭服务器上,使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容,而且更精准、贴切,甚至根据用户的思维模式预测任务,并自主寻找解决方...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。然而,推理能力的提升真的能解决...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
国内首个!百度文心大模型X1 Turbo斩获信通院最高评级证书
...息,在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果。百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。其中,文心X1 Turbo在逻辑推理...……更多
争夺下一代人机交互标准制定权 多家厂商宣布大模型免费开放使用
...方案等增值服务实现商业闭环。这场竞争的本质,是争夺下一代人机交互标准的制定权。大模型免费后人工智能商业模式如何演变免费模式的推出,让人工智能行业进入了一个新的发展阶段。随着技术的不断进步和成本的降低,...……更多
NVIDIA RTX显卡AI推理提速5倍!
...得更好的加速和应用。其中,TensorRT-LLM是一款用于加速LLM推理的库,可大大提升AI推理性能,还在不断更以支持越来越多的语言模型,而且它还是开源的。就在10月份,NVIDIA也发布了面向Windows平台的TensorRT-LLM,在配备RTX30/40系列GP...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
...推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。尽管业界不少团队在讨论是否应对AI预训练和基础研究继续投入,字节仍在以前所未有的战略决心加码大...……更多
chatgpt:技术突破有望构建新商业模式
...,随之入局。在海外,谷歌发布了基于谷歌LaMDA大模型的下一代对话AI系统Bard。随后微软也宣布,推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器。 国内,百度官宣了类ChatGPT项目“文心一言”(ERNIEBot),预计3月...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...eepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。截至2月5日,国内外已有众多云平台宣布上线DeepSeek- R1大模...……更多
OpenAI怎么了?11人创始团队如今仅剩3人,GPT-5也将缺席10月的开发者大会
...着新产品发布的压力和财务困境。OpenAI发言人近日确认,下一代大模型GPT-5将不会出现在今年10月的开发者大会上。11位联合创始人,已有8人“出走”当地时间8月5日,OpenAI联合创始人约翰·舒尔曼在X上宣布他将离职,加入竞争对...……更多
天时、地利、人和,AIPC的新时代,AMD准备好了
...及首席执行官LisaSu博士还分享了锐龙AI处理器的线路图,下一代代号为“StrixPoint”的AMD锐龙处理器也将于今年发布,AMD已经为PC平台上的生成式AI做好了准备。通过此次峰会,我们可以看到AMD在AI方面的布局与信心,AMD拥有CPU、GPU...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
DeepSeek第二炸:开源首个用于 MoE 模型训练通信库
...码库DeepEP王炸。据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里,简单介绍一下DeepEP的技术性能特点...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转绘、AI音乐等多模态能力,大大提升了我的短视频创作...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...产品的研发。因此,FAIR现在被重新定位为开发更长期的下一代人工智能系统。我们基本上不再专注于语言模型。人工智能的成功,包括语言模型和其他许多系统,在过去五六年里,主要依赖于自监督学习技术。自监督学习的一...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
...达1000AITOPS处理能力和128GB统一内存,实现无缝模型开发和推理先进架构:NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术,可有效提升AI工作负载扩展互联:配置为独立或私有云系统,以在桌面上驱动AI……更多
...层涟漪。3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
...这个思路,我们开始思考:视觉模型是否也能实现类似的推理能力?”与传统大模型训练的 SFT(Supervised Fine-Tuning)方法不同,R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学,而R1方法则通过强化学习,...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
...司利用自主研发的训练框架和量化算法显著提升了训练和推理速度,并优化了模型精度与推理吞吐量;在智能安全保障上,公司采用RLHF方案对齐安全认知,创新的热修复技术确保了大模型的安全性,提供安全、可靠的用户体验...……更多
更多关于财经的资讯:
因认证认可违法行为 罗马仕被罚没超124万元
中新网12月12日电(吴家驹)深圳市市场监督管理局网站显示,近日,深圳罗马仕科技有限公司因违反强制认证规定、虚假宣传案
2025-12-12 14:46:00
中信银行深化小微融资协调机制,以金融活水润泽实体经济
自支持小微企业融资协调工作机制建立以来,中信银行践行金融工作的政治性、人民性,通过“五专五强化”工作模式,系统化推动工作机制落地
2025-12-12 14:53:00
张家口市桥东区智能辅助数字人精准赋能经营主体
河北日报讯(郭晓通、王宁)日前,张家口市桥东区聚焦存量公司实缴衔接难题,以数据赋能推出智能辅助数字人服务模式,通过自动化采集
2025-12-12 14:56:00
一张“电费证”,按下“金融快充”键——华夏银行为黔企生产线蓄能“满格电量”
多彩贵州网讯(本网记者 李晓芳)当冬日的寒意笼罩大地,一笔2926.35万元的“金融活水”悄然涌入贵州某磷化工企业的生产线
2025-12-12 15:21:00
红豆集团等成立智慧科技公司,含AI及机器人业务
近日,无锡红豆智慧科技有限公司成立,注册资本3.34亿美元,经营范围包含:人工智能硬件销售;智能机器人的研发;人工智能应用软件开发;人工智能基础资源与技术平台等。企查查股权穿透显
2025-12-12 15:48:00
宝马、金杯汽车等在沈阳新设汽车产投基金,出资额8亿
近日,沈阳汽车产业投资基金合伙企业(有限合伙)成立,出资额8亿元,经营范围包括创业投资、以私募基金从事股权投资、投资管理
2025-12-12 15:48:00
沃顿科技在南京成立新公司,注册资本3亿元
近日,沃顿科技(南京)有限公司成立,注册资本3亿元,经营范围包含:生态环境材料制造;新型膜材料制造;新型膜材料销售等。企查查股权穿透显示,该公司由沃顿科技(000920)全资持股
2025-12-12 15:48:00
天兵科技在河南成立航天装备公司,含多项火箭相关业务
近日,河南天兵航天装备有限公司成立,注册资本1亿元,经营范围包含:火箭发动机研发与制造;航天器及运载火箭制造;火箭发射设备研发和制造
2025-12-12 15:48:00
蓝箭航天申请公布新专利,可提升可复用火箭着陆的可靠性、精准度
近日,蓝箭航天空间科技股份有限公司申请公布“一种可复用火箭着陆段开机高度预测方法、制导系统及处理器”专利。专利摘要显示
2025-12-12 15:48:00
远景能源等在宜昌成立矿业公司
近日,宜昌景投矿业有限公司成立,法定代表人为赵卫军,注册资本为1.5亿元,经营范围包含:非煤矿山矿产资源开采;矿产资源勘查
2025-12-12 15:48:00
苏州银行:后斌辞任风险总监
12月11日,苏州银行股份有限公司发布关于高级管理人员辞任的公告,后斌先生因年龄原因,辞去本行风险总监职务。
2025-12-12 16:01:00
沂源县委书记张涛带队赴双汇集团开展“双招双引”工作
近日,沂源县委书记张涛带队赴双汇集团开展“双招双引”工作,精准链接需求,深化产业协作,以最大诚意架起合作桥梁,为县域经济社会高质量发展集聚优势动能
2025-12-12 16:01:00
彭祥福:岩层与浪潮间的攻坚者
在泉州碧波之畔,中建筑港承建泉惠石化工业区超超临界热电联产项目煤码头建设正酣。建设现场机器轰鸣,却有一个身影常常安静地立于图纸前或海堤边
2025-12-12 16:01:00
渝农商行:张桥云辞任独立董事
12月11日,重庆农村商业银行股份有限公司发布关于独立董事辞任的公告,张桥云先生辞去本行第五届董事会独立董事职务,并不再担任本行董事会提名委员会主任委员及战略发展委员会、风险管理
2025-12-12 16:02:00
中建五局福州高新区路网项目联合属地单位开展“深学笃行强担当・党建引领促发展”主题党日活动
知识抢答环节12月10日,中建五局福州高新区路网项目牵头联合新南公司、安里社区、南屿派出所、海峡金投等十余家驻区单位,共同开展 “深学笃行强担当・党建引领促发展”主题党日活动
2025-12-12 16:02:00