• 我的订阅
  • 头条热搜
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...pic开发者关系主管表示,「计算机使用」是全新人机交互范式的第一步。同时也是,AI模型应该具备的全新基础能力。许多做浏览器智能体的初创公司,一夜之间过时了。网友们纷纷感叹:Agent和工作流都要变天了……会自己用...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略,不仅是对当前市场的一次重大推动,更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...面的 leaderboard 榜单。同时我们也在评测集上实验分析了推理 scaling law、模型校准、RAG、对齐税等研究问题,后续本评测集都可以作为这些方向的重要参考之一。总之,我们希望 Chinese SimpleQA 能帮助开发者深入了解其模型在中文...……更多
ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
...力。最近一两年,以 GPT 为代表的大语言模型催生了搜索范式的转变,无论是在原有搜索产品上的 AI 能力升级(如谷歌、微软),还是以对话式搜索为代表的 AI 新应用(如 Perplexity),搜索引擎与 AI 的融合已经被按下了「快进...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
... sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上,给出了两种具体的结合方法,分别在水印检测效果和生成速度上达到了现有最...……更多
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
...学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构,提升了推理吞吐量。近日,为了进一步加速该技术框架的应用与推广,月之暗面 Kimi 和清华大...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...的任务对应套件,包含总结、感知(回忆、跟踪)、视觉推理(空间、时间、预测、因果、反事实)和导航(房间到房间、对象检索)任务,共18个子任务。其中,总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多
大模型价格战“卷”向何方?|深度
...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2,就是其通过架构创新,实现了大模...……更多
...据为基础,利用大量算力和存储进行数据“检索”,核心范式是深度学习。近年来,这类人工智能取得显著进展,诞生了以生成式人工智能为代表的热门应用。国际学术前沿追逐的另一个焦点是“小样本概念学习”,这一人工智...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...hLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行反馈的开源检索增强框...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
...有停顿。他认为其中关键一环是在先后投资了旷视、第四范式、思谋科技等七十多家人工智能公司后,他们对于算力的重要性有了更早觉知。某种意义上,这是他们连续4轮加注AI芯片公司寒武纪的根源,也是在2021、2022年,就要...……更多
...推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于今年3月起,研究团队与鹏城实验室深度合作,基于中国算力网“鹏城云脑II”枢纽节点,采用512张昇腾910显卡,历时数月攻关完成了在4亿张国产化...……更多
大模型价格战谁会受益
...价值联系在一起,在他看来,大模型商业模式建立在用于推理的算力显著超过训练的算力,C(用户)端的推理成本显著低于获客成本,那时可能会产生新的商业模式,不会像现在在B(企业)端打价格战。创业公司和大公司、大...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2此次提供的90亿(9B)和270亿(27B)参数的两个版本,其推理性能和效率均优于第一代,并具有显著的安全性改进。事实上,270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争,并且提供了此前只有专有模型才能实...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
...任务的特殊性,训练过程采用了随机遮挡图像块并重建的范式,因此优化目标是最小化重建误差,而非通常的分类损失。作者对比了AdamW和C-AdamW的表现,即训练50轮后的最终重建误差,结果C-AdamW的误差为0.5926,低于AdamW的0.6085。...……更多
...会大范围落地,并且在适合的场景会逐渐形成典型的应用范式。最后,大模型仍然会面临一些长期的科学问题,如可靠、可控和可信问题,同时也会在大范围的落地过程中发现新的科学问题,这些问题需要政府、企业界和学术界...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...型有效训练时长占比达到 98% 以上。TeleChat-52B在OpenCampass推理榜单排名第一在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval ……更多
重庆特斯联冲刺AIoT第一股!3年29亿营收,六成来自AI产业数智化
...隐私安全。而且,本身AIoT自带行业落地属性。在大模型范式确认之前,就已经广泛落地于智慧城市、智慧交通、社区、工业、制造等诸多领域。如今有了大模型的加持,相当于给AIoT外置大脑,让万物互联有了更多的可能性。基...……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
刘庆峰谈科大讯飞与华为合作:任正非高度重视,双方共同看好,非干不可
...“心中有数”,也很清楚与GPT-4在小样本快速训练、复杂推理、多模态综合使用、长文本内容等方面还有差距。“国内大模型都有不小差距,那些说跟它差不多的,我觉得还是要更客观。要有科学精神,才能真正实现从追赶到超...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外围场景深入到核心业务,直接影响金融行业的核心决策质量,在为客户的产品和服务体验上带来巨大突...……更多
IDC王吉平:AI PC产业生态具备以人为本、终端主导和AI原生三大特点
...下也能使用;第三,更低的大模型使用成本,以本地免费推理为主、以云端公共推理为辅,一次性购买AI PC即可享受全生命周期的本地免费推理服务;第四,可信、安全的个人数据和隐私保障,个性化本地知识库、隐私数据的本...……更多
ai终端产业创新论坛在沪举行
...个重要的事情,就是让用户获得到极致的体验提升。开发范式统一、整体的规范统一,可以让用户便捷获得AI应用,我们非常期待”。京东集团副总裁尚鑫说:“技术方面,我们期望通过建立生态系统来确立相关标准。作为购物...……更多
李开复&张亚勤:未来的首富,将来自AI公司 | WISE2023商业之王大会
...。相较于过去PC互联和移动互联时代,这是一个拥有全新范式的时代。我原来在微软做操作系统,当时Windows和Linux创造了一个大的PC时代经济,而在移动互联时代,安卓和iOS又创造了一个十倍大于PC的生态。现在大模型/基础模型...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00
雷军提前透露年度演讲细节,晒照新T恤“正是闯的年纪”被粉丝要链接
9月25日,雷军年度演讲将在今晚7点举行,这次不光是演讲,还是小米17系列等各种新品的发布会。关于今晚的演讲和发布会,25日下午
2025-09-25 17:34:00
齐鲁晚报·齐鲁壹点 记者 张召旭近日,为紧密配合《山东省食品经营许可审查细则》的落地施行,山东省全新改造升级的食品经营许可系统正式上线运行
2025-09-25 17:34:00
中国AI“黑科技”集结数贸会,AI硬件备受瞩目
9月25日,第四届全球数字贸易博览会在杭州开幕,作为国内唯一以数字贸易为主题的国家级展会,本届数贸会汇聚全球顶尖的数字科技与AI创新成果
2025-09-25 17:40:00
近日,山东移动聊城分公司组织技术团队专程赴莘县翰林学校,开展互联网专线及校园网络全面巡检与优化工作,通过端到端的全流程保障
2025-09-25 18:06:00
高德刘振飞:空间智能,就是让AI理解和预测真实世界的复杂性
高德地图董事长 刘振飞9月25日云栖大会期间,高德地图董事长刘振飞于2025高德技术峰会上致辞,系统阐述了高德全面转向“空间智能”的战略思考与实践
2025-09-25 18:06:00
京东发布AI全景图,未来三年持续投入构建万亿人工智能生态
9月25日,主题为“Enjoy AI”的JDDiscovery-2025京东全球科技探索者大会在北京举行。京东在会上发布了AI全景图
2025-09-25 18:10:00