• 我的订阅
  • 头条热搜
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
【新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的,分析了BERT灭绝的始末以及不同架构模型的优缺点,以史为...……更多
AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真
...进行编码的样式参数。研究人员在六维N-body相空间上训练模型,将粒子速度预测为模型位移输出的时间导数,显著提高了训练效率和模型准确性。最终,模拟器在测试数据(训练期间未见过的各种宇宙学和红移)上实现了良好的...……更多
库克现身上海首次谈及AI话题,苹果真急了
人工智能(AI)巨头OpenAI的自研芯片和下一代大模型GPT-5又有了新进展。当地时间3月19日,据The Business Insider援引匿名知情人士的消息,OpenAI公司正计划筹备在今年年中推出GPT-5预计时间是夏季。这一新一代模型的性能大幅提升,有...……更多
阿里云的AI路线图
...“未来,云计算的算力都会被这些智能时代的电动机——模型消耗掉。”不过,在王坚看来,2023年人工智能和云计算有了一次集中体现和爆发后,第三次浪潮不会在一两年内完成,而是需要十年、几十年的时间。 阿里云将在其...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
挤爆了,简直要被大模型公司们给挤爆了。来感受一下这个feel:毫不夸张地说,国内外叫得上来的大模型公司基本上都来了——Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智谱AI、百川、MiniMax……到底是什么样的事情能让...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
GTC 2024硬件一览:史上最强AI芯片GB200发布!
...B200更快,过去,在90天内训练一个1.8万亿参数的MoE架构GPT模型,需要8000个Hopper架构GPU。现在,你只要2000个BlackwellGPU就可以完成。图片源于网络官方称,在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力...……更多
大模型浪潮不能使鬼推磨,但可以让周鸿祎、傅盛握手言和
...,猎豹移动董事长傅盛在开年AI公开课上发布企业私有大模型猎户星空,并与360创始人周鸿祎对谈。这是周、傅两人决裂16年后首度公开同台、握手言和。周鸿祎称:“挖陈年往事没有用,大模型做不好才叫没有前途。”周鸿祎...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...U可提供200G带宽,大大提高工作效率,能够充分满足AI推理、模型微调和高性能计算过程中的强大算力需求。强大性能:采用 AMD EPYC 9004处理器提供了高达 64个核心和 128个线程,适合处理需要大量并行处理能力的任务,如数据分析、科学...……更多
从云栖大会,看阿里的科技本色
...火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开...……更多
拳打苹果 脚踢Intel!高通终于在PC上硬起来了
...更是翻了差不多一倍,可以离线运行10B以内参数规模的大模型。高通官方整理了一张省流表,我给大家放一下。虽然搞大模型的朋友跟我们吐槽说这款处理器“每秒20个Token”的处理性能不太够用,对话可能会有延迟。 不过,高...……更多
elegoo爱乐酷打印机评测
...泛运用的粗颗粒磨砂纹理,这种纹理能够非常牢固的抓住模型底面,模型脱落的概率几乎没有,但是也有一些弊端,就是模型底面会有粗颗粒纹理,对模型底面光泽度有要求,就要另行购买其他纹理或者光面纹理的弹簧钢片了,...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,...……更多
国产低价显卡坞评测:能让轻薄本用上本地大模型
...情况,需要AMD的驱动进一步完善。轻薄本也能玩转本地大模型 接下来老规矩,现在怎么说也算是AI大模型的应用期,这有张显卡不拿去跑大模型,就跟矿潮的时候买了张显卡却没试过挖矿一样,那肯定就是不行的。不过,目前...……更多
2023年手机行业亮眼技术总结 手机玩3A游戏成为现实
...然也没错过这次风口,最新发布的的OriginOS4搭载了蓝心大模型矩阵,生成式AI大面积应用到了手机当中。全新的蓝心大模型,拥有三个核心功能,分别是面向端测打造的文本大模型,面向自然对话方面开发的对话功能,以及提升...……更多
PC开启AI时代:行业要变天
...关键的变量,就是如今无论哪个领域都要蹭一蹭的AI。大模型、AIGC的火爆,让AI从“前沿抽象”的概念,落地到更多实际应用中。对于PC而言,尽管不如CPU和GPU换代等配置升级带来的变化显著,AI应用生态的丰富还是让PC焕发了新...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
...;二是扩展法则的应用,构建更大规模的算力集群,支撑模型参数从万亿跃升至十万亿;三是换道技术的涌现,各种流派百花齐放,推动计算科学飞速发展。“面向AI+时代,当前算力网络正处于融合统一的攻坚期、泛在智能的跃...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...等互联网科技巨头不断涌入,纷纷对标GPT-4升级 AI 通用大模型。而在To B企业端领域,中小大模型领域当前面临头部企业加速融资、市场“内卷”竞争等复杂局面。如今,一家成立仅四个多月的生成式 AI(AIGC,人工智能创造内容...……更多
高通骁龙8 Gen3登场:支持8K与240Hz,AI狂飙98%,A17 Pro压力很大
...表示目前骁龙8 Gen3已经支持包括Meta Llama 2等诸多生成式AI模型,种类超过了20种,最高可以处理超过100亿个大模型参数,如果说过去DSP只是作为CPU、GPU等计算单元的辅助,那么现在Hexagon NPU已经成为了独立的计算单元,相信高通骁...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...估,小到简单的数学运算,大到复杂的逻辑推理和大语言模型问答等多个方面,更加全面地展现CPU在不同AI应用中的表现。由于CPU属于计算机的核心部件,所以在AI处理中起着至关重要的作用。GPU测试部分,与CPU的测试基本相同...……更多
深入芯片底层定义,findx8系列实现能效巨大突破
...设计底层认知,FindX8将集成安卓首个精准算力单元集功耗模型基于长期对芯片底层的认知,OPPO在FindX8系列上集成了安卓首个精准算力单元集功耗模型,首次将实时功耗计算精度达到90%以上,是目前移动芯片领域唯二可以实现这...……更多
amd旗舰aigpu加速器mi300x对比英伟达h100
...0的1.3倍FP16TFLOPS精度是H100的1.3倍在1v1比较中,训练Llama270B模型速度比H100快20%在1v1比较中,训练FlashAttention2模型速度比H100快20%在8v8Server比较中,训练Llama270B模型速度比H100快40%在8v8Server比较中……更多
苹果史上最短发布会:3纳米M3芯片亮相,可用于研发AI软件
...入增强型神经网络引擎,用于加速强大的机器学习(ML)模型。与M1系列芯片相比,新的神经网络引擎带来最高达 60% 的速度提升。其中,M3 Max 芯片中的晶体管数量增加到920亿个,40核图形处理器比M1 Max速度最快达 50% ,还支持最...……更多
美国芯片内战
...的骁龙芯片,让更多设备商离不开它。类似的,AIGC 和大模型的需求爆发意味着,计算厂商和 AI 初创公司未来几年都需要大量采购英伟达 GPU。英伟达有了可靠的现金流,可以支持自研 CPU,在汽车和电脑市场更进一步。一旦离开...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开源的Hermes 3(基于Llama 3.1)而引起广泛关注的Nous Research,再次宣布了一项重大突破——DisTrO(分布式互联网训练)。通过使用与架构...……更多
全新华为MateBook X Pro推拂晓粉配色
...分频6个扬声器,为用户带来更出众的体验。华为盘古大模型加持,“智慧”再升级如今,AI的应用已经深刻渗入我们日常生活之中,而全新的AIPC更是打破了传统的网络大模型+高性能显卡的束缚。全新华为MateBookXPro有华为全场景A...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...,一大波测评刷屏全网。更惊喜的是,苹果AI背后的基础模型47页技术报告,也一并上线了。一大早,人们期待已久的「苹果AI」首个预览版,正式向开发者们推送了!iOS 18.1、iPadOS 18.1、macOS Sequoia 15.1三大系统中,全都植入了苹...……更多
智启新元年:PC成为AI落地首选终端
...常高端,但和我们的日常生活有何关联?普通人不懂AI大模型,能否轻松上手这些应用?算力爆炸,又是如何给人们带来创新体验?“要真正实现AI的普惠,还需要克服AI个性化服务、效率、成本及安全性等多重挑战。但是时候去...……更多
三星骁龙xelite正式发布:搭载高通cpu
...te专为AI打造,支持在终端侧运行超过130亿参数的生成式AI模型,AI处理速度是竞品的4.5倍。高通还确认,OEM厂商预计将于2024年中推出搭载骁龙XElite的PC。外媒预测,三星搭载骁龙XElite处理器的PC也会在2024年亮相。 ……更多
更多关于科技的资讯:
鲁网9月28日讯金融是经济的血脉,更是百姓生活的依托。在中国经济迈向高质量发展的今天,中国建设银行青岛市分行以国有大行的责任与担当
2025-09-28 10:37:00
五年连获七家世界知名轴承制造企业认证一根轴承钢转动全球——“铁疙瘩”怎样变成“金娃娃”(九)前不久,河钢集团石钢公司收到日本某国际知名轴承企业高碳铬轴承钢的认证邮件
2025-09-28 08:04:00
锚定新赛道 壮大新动能超31亿元新一代工业软件基地项目开工南报网讯(记者刘安琪)项目兴则产业兴,项目强则经济强。9月26日上午
2025-09-28 07:43:00
山东移动成功入选2025年度山东省中小企业服务支撑机构
近日,山东省轻工联社发布《关于公布2025年度山东省中小企业服务支撑机构名单的通知》,山东移动成功入选。作为推动中小企业数字化转型的主力军
2025-09-27 08:11:00
南报网讯(记者卫凌云通讯员建萱)9月26日,2025南京河西中央科创区生态建设推进会举行,“大厂+大学+大所”创新平台揭牌
2025-09-27 09:53:00
山东移动淄博公司织就高速信息网络,筑牢“数字淄博”智慧生命线
在数字化浪潮席卷而来的今天,信息传输网络如同城市的“神经网络”,是智慧城市运转的核心支撑。作为这一无形“生命线”的守护者
2025-09-27 12:34:00
迭代焕新“吾悦经营五步法”,新城控股再启商业新篇
9月24日-25日,新城控股“2025第八届商业年会暨吾悦商管第一届悦链计划合伙人大会”在上海西岸美高梅酒店举行,新城控股集团董事长王晓松及公司高管
2025-09-27 12:37:00
25日上午,以“上山下山·食在晋安”为主题的晋安区“一县一桌菜”云上发布会举行,12道“云端”盛宴引爆味蕾。
2025-09-27 13:53:00
产业链协同驱动 新奥加速冲刺氢硼聚变
河北新闻网讯(张新)2025年,是我国“十四五”规划收官之年,也是“双碳”目标提出五周年。在此背景下,央视《东方时空》栏目近日推出“可控核聚变专题”
2025-09-27 14:45:00
9月25日,国网山西省电力公司发布消息,该公司成功完成配电网无人机电力北斗定位服务的全面应用,标志着该公司依托电力北斗高精度定位服务
2025-09-27 19:56:00
谢志强:从金融菁英到人才“伯乐”,以产学研融合破局就业困境
谢志强,现任中科汇理信息技术研究院党支部书记、秘书长、中科产学研合作一体化人才培育开发平台项目主任。历任中国银行总行风险管理部业务经理
2025-09-27 20:20:00
聚焦数贸会 | 工匠行:机器狗能听会说还会自主巡逻
在第四届全球数字博览会上,贵州工匠行科技有限公司展出的SomaSeek具身智能平台,让机器人彻底告别了遥控器,也能听会说
2025-09-27 22:17:00
企业新市场何处寻?潍坊这场产业国际精准对接会送来“及时雨”
齐鲁晚报·齐鲁壹点 胡晓雪 李国栋9月26日,2025潍坊纺织服装产业国际精准对接活动在奎文区成功举办,本次活动以“我帮企业组主场·我为企业找订单”为主题
2025-09-27 22:22:00
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00