• 我的订阅
  • 头条热搜
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比如驴,正是有了这样的世界模型,它们才能找到更省力的负重登山方法。近日,LeCun 团队发布了他们在世界...……更多
四川首个!长虹“云帆”大模型成功备案
...示,截止2024年3月,已经有四川长虹“云帆”等117家“大模型”成功备案,这也是四川首个成功备案“大模型”。资料显示,四川长虹于去年11月20日率先将生成式人工智能应用在电视终端,通过长虹自主研发的AI技术,融合训练...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
不出意外,AI大模型浪潮卷到了智能手机领域,智能手机厂商争先恐后地自研AI大模型或者联手AI大模型厂商,挖掘智能手机与AI大模型的融合发展的巨大潜力。10月26日,荣耀CEO赵明官宣新机荣耀Magic6的部分信息。他表示,新机...……更多
零一万物发布千亿参数模型Yi-Large 李开复呼吁拒绝烧钱打法
...之际,零一万物CEO李开复5月13日携带千亿参数Yi-Large闭源模型正式亮相。李开复表示:“今天在两个第三方评测平台上了Yi-Large模型的英文和中文,都达到了世界顶尖水平。在国内我们参考了的SuperCLUE的评估,在国产大模型中文...……更多
...是最早把AI引入到智能手机的,下一步我们将基于盘古大模型把‘小艺’打造为超级助手,融合5G-A、AI的能力,给用户提供体验更好的终端。”字节跳动计划在马来西亚投资21亿美元建区域人工智能中心:马来西亚贸易与工业部...……更多
...象,只能是客观化的表达。□提示词和参数的使用,是大模型技术背景下人工智能内容生成中独创性的具体化操作行为。提示词和参数的使用,是人类意志因素的体现,也是人工智能生成内容受著作权法保护的正当性基础,更是...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
中新经纬10月18日电 (孙庆阳) “基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型。”10月17日,中国工程院院士、原中国互联网协会理...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础设施服务,为中国大模型产业繁荣发展提供技术支撑。去年9月,腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
AI手机看荣耀:荣耀MagicOS 9.0发布 开启手机自动驾驶新时代
...化全场景AI操作系统——MagicOS 9.0,推出全新自研魔法大模型家族,并宣布YOYO助理正式升级为YOYO智能体。发布会上,荣耀全新智能体商店正式上线,YOYO智能体将携手百模生态,共创智能新世界。此外,荣耀还携手中国信通院,...……更多
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...张卡的训练集群,研发MegaScale生产系统,用于训练大语言模型;科大讯飞2023年建成了首个支持大模型训练的超万卡集群算力平台“飞星一号”。7月1日,腾讯宣布其自研星脉高性能计算网络全面升级,升级后的星脉网络2.0搭载全...……更多
70倍极致压缩!大模型的检查点再多也不怕
...ICCV、ECCV等顶会上有多项代表性工作发表,在高效大语言模型、视觉模型等领域都有丰富的成果产出,和知名高校和科研机构合作广泛。大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」,吸引了大批学者和企业投入资...……更多
连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2
...上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级点:▼MFU提升10% 最高可达55%在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。稠密模型集群训...……更多
山东财经大学公共管理大模型训练雁阵计划启动
...大学公共管理学院数字化教育教学能力提升暨公共管理大模型训练雁阵计划启动仪式举行。山东财经大学公共管理学院院长贾海彦在致辞中表示,学院一直高度重视现代信息技术在公共管理学科领域的应用,在人工智能技术快速...……更多
商汤久违爆发
...公司股票暂停买卖。股价燃爆背后,商汤推出了日日新大模型5.0,性能超越GPT-4Turbo。当日晚间,商汤在港交所回应了日日新大模型5.0相关事项,并称公司股票于4月25日起恢复买卖。股价大涨交易行情显示,4月24日,商汤高开3.28%...……更多
...行官张鹏。他表示,人工智能应用目前主要集中在语言类模型,随着大模型的不断进化,未来必然会出现更多的新模态场景,智谱AI将与终端侧产业伙伴紧密合作,开拓商用AI终端新应用、新场景、新形态。2022年底,ChatGPT的发布...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...结果也证实了 QIREN 的确表现出超越信号表示任务上 SOTA 模型的优异性能,在参数量更少的情况下,拟合误差最多减少 35%。图 1 中展示了本文的核心思想和主要结论。相关论文已经被机器学习领域最权威的会议之一 ICML 2024 接收...……更多
张云泉:集中力量,促进国产AI大模型发展
...第18期,总第915期),原题为《集中力量,促进国产AI大模型发展——专访十四届全国政协委员、中科院计算所研究员张云泉》。文丨《瞭望东方周刊》记者万宏蕾编辑顾佳贇算力建设能否及时跟上,成为AI大模型向各领域进一步...……更多
李开复发布零一万物首款340亿参数大模型Yi
...23年11月7日星期二1、李开复发布零一万物首款340亿参数大模型Yi11月6日,知名投资人、创新工场董事长兼CEO李开复带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,同时宣布启动下一个千亿参数模型的训练。目...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...竞争关系。近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型...……更多
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
...搜狐科技作者|汉雨棣10月31日云栖大会上,作为通义大模型基础模型的通义千问2.0千亿参数模型正式发布。与此同时,用户开始可以下载通义千问App进行体验。据了解,在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在...……更多
苹果被大模型打得措手不及
...士多德提问,并且可以得到回答”。乔布斯几乎预见了大模型技术的崛起,并坚信人工智能将为苹果公司带来远大前景。Siri是由乔布斯主导,苹果公司对人工智能最早的探索,但在库克时代,苹果在人工智能领域的发展步伐却...……更多
自然语言处理:大模型理论与实践
今天分享的是:自然语言处理:大模型理论与实践报告共计:450页《自然语言处理:大模型理论与实践》系统介绍了大模型技术在自然语言处理中的理论与实践。核心观点1. 语言模型基础- 介绍独热表示、分布式表示等文本表示...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshu...……更多
AI发展变慢了?几位AI头部创业者并不赞同
...AI发展速度非常快。从数量角度看,现在每个月都有新的模型、新的产品、新的应用涌现出来。从质量角度看,OpenAI(美国头部AI公司)今年2月份发布的Sora(视频大模型),5月份发布的GPT-4o(多模态语言大模型),9月份发布的o...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
更多关于科技的资讯:
从榨菜月饼到榨菜咖啡,乌江榨菜以创新打破品类边界
近年来,伴随区域化、特色化产品的迅速增长,各大品牌在深耕主业的同时也开始积极探索新赛道、新领域。乌江榨菜作为涪陵榨菜集团旗下的核心品牌
2025-09-29 08:03:00
华北首家!多美卡品牌专卖店登陆北京玩具反斗城
[北京] – 继中国首家多美卡品牌专卖店入驻玩具反斗城上海南丰城店并成功引爆小车收藏热潮后,玩具反斗城(Toys“R”Us)与多美(TAKARA TOMY)的战略合作再结硕果
2025-09-29 07:33:00
南报网讯(记者张甜甜)10月2日至3日,由南京报业传媒集团旗下南报优选供应链公司主办的首届紫金山国潮漫文化嘉年华,将在南京国际展览中心举办
2025-09-29 07:42:00
9月26日,购在中国(山西站)暨中石化易捷第八届易享节在我市启动,诸多三晋名特优产品将陆续入驻中石化易捷,走向全国。今后
2025-09-28 08:20:00
刚刚闭幕的长春航空展上,“净月号”成瞩目焦点
9月23日,长春航空展圆满闭幕,“净月号”凭借其震撼的实体造型与深厚的文化内涵,成为展会瞩目的焦点。这艘承载中式太空梦想的“星舰”
2025-09-28 10:07:00
为更好的服务广大客户,富德生命人寿安平支公司积极组织员工开展《产品健康增值服务》培训。培训中,讲师细致讲解公司产品健康增值服务
2025-09-28 10:12:00
河北新闻网讯(王丽英)9月24日至25日,宁晋县晶龙集团举行人力资源专业培训,内训师靳桂峰、王素峰和张晓宁分别围绕工伤保险及识人辨人
2025-09-28 10:18:00
美团Keeta上线阿联酋!40天连开3国,国际化全速推进
当地时间9月27日上午11点,美团旗下国际外卖品牌Keeta正式在阿联酋迪拜启动运营,这是Keeta继8月上线卡塔尔、9月上线科威特后
2025-09-28 10:22:00
小米17系列9月27日开售,卢伟冰称ProMax需求远超预期,已安排快速提拉生产
9月27日上午10点,小米17系列开售,价格4499元起!并全系首发第五代骁龙 8 至尊版。据悉,小米17尺寸6.3,7000mAh 电池
2025-09-28 10:22:00
齐鲁晚报·齐鲁壹点 王会广 通讯员 李杰在数字经济蓬勃发展的当下,大数据、云计算、物联网、移动互联网、人工智能以及区块链等新兴技术的广泛应用
2025-09-28 10:56:00
实时互动x高效制播:佳能携手《密室大逃脱大神版 互动直播》真人秀实现制作新范式
在直播与正片并行制作逐渐成为综艺内容生产新常态的当下,真人秀现场对影像系统的要求不断提升:既要满足直播的即时输出,又要兼顾正片制作的高质量成片
2025-09-28 11:51:00
齐鲁晚报·齐鲁壹点菏泽光影在线摄影摄像实战培训班11月初开启
从“拍摄小白”到“拍摄大神”,你只差这一套实战课!齐鲁晚报(光影在线实战培训)告别“自动挡”,用镜头讲故事。这是一个视觉统治注意力的时代
2025-09-28 12:03:00
烟台银行威海荣成支行“金融+”开辟服务新路径
近日,烟台银行荣成支行通过创新推出的“智慧物业”合作解决方案,成功为当地多家物业公司纾困解难,有效破解了长期困扰行业发展的收费难
2025-09-28 12:05:00
莫林酒店洛阳首店落子!完善文旅服务补中高端住宿
作为中国第一古刹,洛阳白马寺的文旅热度在 2025 年暑期再攀新高 —— 日均接待游客超 8000 人次,35 元亲民票价搭配免费斋饭政策
2025-09-28 12:22:00
国庆车票开抢第三天,在全网“开票即候补”的声音中,假期出行的火热程度可见一斑。而且今年又是一次中秋假期叠加国庆假期,连续八天假
2025-09-28 12:22:00