• 我的订阅
  • 头条热搜
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程,研究人员花了几十年的时间才开发出来。这...……更多
解密大脑中的隐形导航系统,人类自我如何构建虚拟世界
...的图像数据。为了解释这一切,研究团队构建了一种计算模型,模拟内嗅皮层建构心理地图的过程。这个模型最初是用于模拟动物在真实环境中导航时的大脑活动。但研究者为它添加了一个全新的模块 - 通过与感官输入的双向交互,...……更多
中电信量子:赋能气象观测,量子计算应用探索取得新进展
...介绍,在气象预测领域,经典神经网络在处理海量数据和模型训练方面存在一定性能瓶颈,量子神经网络可以为气象预测领域的发展带来全新的可能性,其应用加速了模型的训练过程,在时间序列预测和模式识别等方面展现出巨...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
全力奔赴“终结艾滋病”的未来
...证。”尚红说。此外,国内学者构建全新双荧光报告病毒模型DFV-B,可直接标记潜伏感染的原代CD4﹢T细胞,创新了储存库检测手段。还有学者应用DFV-B,获得了一种新的HIV-1潜伏促进剂(LPA),通过靶向AKT/ mTOR信号通路有效抑制...……更多
AI芯片战事升级!英伟达筑高围墙,市值猛追苹果
...的GPU,有助于英伟达进一步奠定自己在AI计算硬件方面的霸主级地位。一方面,这款芯片在一定程度上满足了人工智能飞速发展时代对于算力和降低能耗的需求。“大模型业务在近两年的飞速发展,无论是ChatGPT还是Sora,都体现...……更多
进博故事·展品会说话丨 波音“新家族”上演进博“返场秀”
...发的777X系列双通道飞机家族成员,曾在第二届进博会以模型形式进行展出,次年便完成首次试飞。迄今为止,777-9已经进行了超过1000架次试飞,总飞行时间超过3000小时。从“零”到“一”,五年来,诸多在研新品在进博会的见...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
大模型应用主战场真正热闹起来。上海汽轮机厂的设计师,再不会被一些重复低效环节辜负了才华。工厂一年要设计近150台套机组,30余位设计师的大量精力,曾耗在反复构建配件模型及修改草图上。但近期,工厂迎来一套基于...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
《麻省理工科技评论》中国智能计算创新人物峰会圆满落幕
...计算创新人物”(来源:DeepTech)智算 + AI 与算力“AI 大模型与先进计算范式”颁奖仪式结束后,活动进入到下半场圆桌对话环节,在以“智算 + AI 与算力:AI 大模型与先进计算范式”为主题的圆桌讨论中,络绎科学技术负责人...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...量问题而导致难产的节骨眼,Meta毫不客气发了它的视频模型“Movie Gen”,并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是,Meta还“杀人诛心”,虽然这模型目前和Sora一样还没对外开放,但它把新模型的95页技...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...0%的Triton内核Pytorch最近发表了一篇技术博客,他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例,100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型,专为代码生成任务设计。仓库地址:……更多
他用AI让交通“更懂你”
...:广州日报王凯 佳都科技首席人工智能科学家兼通用大模型研究中心主任他用AI让交通“更懂你”王凯 扫码看视频筑梦现代化 共绘新图景十岁的男孩,一触网就开始钻研抽象的计算机语言;到了中学时期,他在阅读比尔·盖茨...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
智谱大模型团队自研打造。自从快手可灵 AI 火爆海内外,国内视频生成也如同 2023 年的文本大模型一样,越来越卷了。刚刚,又一视频生成大模型产品宣布正式上线:智谱 AI 正式发布「清影」。只要你有好的创意(几个字到几...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
AI古诗词动画《千秋诗颂》第二辑开播
...辑在AI技术上有了突破性的提升,开拓了总台自主研发大模型在动画领域的应用场景。依托央视听媒体大模型,联合上海人工智能实验室书生·通用大模型强大的多模态融合、优秀的开放世界理解和内容生成能力。在成片画风方...……更多
AI真·炼丹:整整14天,无需人类参与
...。若是把这个AI平台单拎出来,它更是囊括了20多种预测模型和生成生物学模型,还包含遗传学、蛋白质组学、甲基化数据、文本文献和科研基金等海量数据,用以支持专业的靶点识别、分析和排序、适应症探索等生物学研究。...……更多
OpenAI又地震:总裁要休假到年底,联合创始人跳槽,ChatGPT负责人离职
...知,同时,今年还或将面临50亿美元的收支缺口……曾经一鸣惊人的OpenAI后面的路可能并没有那么好走。 ……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...夜易主!智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流模型,较小规模的FLUX.1[sc...……更多
乡镇零食店生存实录:日营收8000块,干了8个月亏进去70万
...己也萌生了开一家零食折扣店的想法。面对零食很忙、赵一鸣等头部折扣零食品牌高额的加盟费和营业额抽佣,以及这些品牌门店走“大牌引流,白牌盈利”模式的可复制性。孙伟认为放弃加盟路线,重新整合供应链,才能让门...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
...向元宇宙沉浸多感交互的5G-A网络基于物体特征点的三维模型快速匹配系统高逼真数字人快速构建与多模态交互系统虚拟空间创作平台3D沉浸式实时通信系统3D实景地图平台基于文本描述的3D场景生成系统元宇宙数字身份标识技术...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...者是汪海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威,北京大学智能学院教授;Bernt Schiele,德国马普计算所教授;Federico Tombari 谷歌人工智能科学家等。新一代通用灵活...……更多
teleai星辰语音大模型:多方言能力再次突破
...?你听得懂各地方言吗?时隔不到半年,TeleAI星辰语音大模型的多方言能力再次突破,不仅攻克了湛江话、宜宾话、洛阳话、烟台话等,将方言种类从30种提升至40种的同时,还引入对英文的识别,构建起AI时代的沟通桥梁。当前...……更多
飞越高山 逐梦星辰
...区城三小学的学生们都会在空地上散开,各自操纵着飞机模型升空、盘旋、落地……这是一所硬件设施有些“拿不出手”的山区小学,但学生、家长“挤破头想来”。坚持了30余年的航模特色科学教育是城三小学“响亮的招牌”...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...湃新闻编辑 秦盛(01:35)黄仁勋 IC 资料图AI(人工智能)大模型奠基之作Transformer论文的七位作者与英伟达CEO黄仁勋一起讨论生成式AI的过去、现在与未来。当地时间3月21日,提出了Transformer架构、改写AI领域发展历程的论文《注意...……更多
革命性的天气预报:科学家破解了“降雨形成瓶颈”的秘密
新的发现有可能增强用于天气和气候预测的计算机模型。几十年来,科学家们一直在试图解开一个复杂而神秘的事件序列,这些事件使得云中的微小液滴变得足够大,足以掉落到地面上。对这个被称为“降雨形成瓶颈”的过程...……更多
更多关于科技的资讯:
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00
雷军提前透露年度演讲细节,晒照新T恤“正是闯的年纪”被粉丝要链接
9月25日,雷军年度演讲将在今晚7点举行,这次不光是演讲,还是小米17系列等各种新品的发布会。关于今晚的演讲和发布会,25日下午
2025-09-25 17:34:00
齐鲁晚报·齐鲁壹点 记者 张召旭近日,为紧密配合《山东省食品经营许可审查细则》的落地施行,山东省全新改造升级的食品经营许可系统正式上线运行
2025-09-25 17:34:00