• 我的订阅
  • 头条热搜
rockaiyan架构大模型通过备案
...,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。Yan模型简介Yan架构大模型是国内首个非Transformer架构、非Atte...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...former是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构,凭借强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,成为自然语言处理领域的主流模型架构。如今,一家创业公司试图动摇Tran...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...缺的一部分。思必驰天琴语音助手 8.0凭借其卓越的技术架构,深度整合DeepSeek实现能力升级,更以“四大智能”技术底座赋能座舱的交互逻辑,使其在车载语音交互领域成为多模态感知、类人推理与群体协同的车载AI中枢,成为用户更...……更多
被质疑、抄袭、魔改,非主流大模型的诞生之路
...虎嗅注:RWKV创始人彭博是今天故事的主人公,在Transformer架构大行其道的当下,他一个人花了三年时间构建了RWKV架构,一种不同于Transformer架构的RNN架构。本文为虎嗅 《AI星火》系列 第 07篇稿件,《AI星火》系列聚焦AI细分行业...……更多
阳光保险谷伟:公司目标建设领先的混合式大模型平台和应用体系
...智能科技平台。在新定位之下,形成新突破、新能力、新架构和新机制。具体而言,前端形成三大智能化新突破;销售智能化上,重点建设寿险销售智能化和车险销售智能化,同时构建多渠道销售智能化;在服务智能化上,重构...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天,阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
自然语言处理:大模型理论与实践
...sformer模型及预训练语言模型的基本知识。2. 大模型理论- 架构:讲解基于Transformer的编码、解码、编解码大语言模型架构,非Transformer架构如FAT、AFT、RWKV模型,以及大模型架构配置的归一化、激活函数、位置编码、注意力与偏置...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。早在2017年,谷歌发布《Attention Is All You Need》论文...……更多
科学家为脉冲神经网络引入新架构,为超大模型奠定基础
...经形态计算的性能潜力远远未被发掘。例如,在神经网络架构方面,目前绝大多数神经形态计算的应用,都围绕脉冲卷积神经网络(Convolutional Neural Network,CNN)展开,当前的神经形态芯片也只能支持脉冲 CNN。 相比之下,传统...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...abilityAI于今年3月推出的商用Stable Audio 2的变体模型,整体架构保持一致,但在训练数据的采用和部分架构上采取了调整,关键架构由自动编码器、基于T5的文本嵌入以及扩散模型(DiT)构成。论文地址:https://arxiv.org/html/2407.14358v...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...办。在下午举办的OS原生智能分论坛中,华为昇思MindSpore总架构师金雪锋担任出品人,华为AI大模型应用开发平台架构师王磊担任主持人,与来自华为、中软国际有限公司、深圳市若芯科技有限公司等企业界技术领袖和来自清华大学...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
比亚迪发布整车智能化架构“璇玑”及璇玑AI大模型 【比亚迪发布整车智能化架构“璇玑”及璇玑AI大模型】财联社1月16日电,比亚迪今日发布智能化领域最新技术,其中整车智能化架构被命名为“璇玑”,由“中央大脑”、车...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...而合,而且360更早就提出了“慢思考”的理念,并在技术架构和产品中都付诸了应用。同时,360还在其AI产品中强调多模合作,让来自不同厂商的大模型“抱团取暖”,为国内模型追赶OpenAI,找到了一条可行的道路。 从o1看大模...……更多
...摒弃传统电子深度计算范式,首创分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片“太极”(Taichi)。该芯片具备每平方毫米每秒879万亿次乘加运算的面积效率与每焦耳160万亿次运算的能量效率,首次...……更多
商汤组织架构重组:以生成式AI为核心业务,各生态企业由独...
商汤完成战略组织架构重组。12月4日早间,人工智能软件公司商汤集团股份有限公司(商汤,0020.HK)在港交所发布公告称,其已经完成一项战略组织架构重组,以更好地应对AI 2.0时代所带来的机遇与挑战,重组后公司建立了新...……更多
字节豆包团队推出稀疏模型架构UltraMem:推理成本可降83%
...tion团队近日宣布了一项重要创新成果——UltraMem稀疏模型架构。这一架构通过将计算和参数解耦,在保证模型效果的同时,有效解决了推理过程中的访存问题,为人工智能领域带来了新的突破。据了解,UltraMem架构巧妙地将计算...……更多
大模型下沉,汽车需要存算一体芯片|超级观点
...电量,这是地球无法承受的。”然而,在传统的冯诺依曼架构下,存储和运算是分离的,芯片大概有80%-90%的功耗浪费在数据的存储和计算之间的搬运,而非计算上。 此外,当大模型逐渐向智能汽车、电脑、手机等边缘端下沉,...……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
视频生成群雄逐鹿,哪些重要问题待解?
...学人工智能研究院助理教授晏轶超,新壹科技AI算法主任架构师李璋,井英科技联合创始人、CTO王健,旷视研究院高级研究员李华东5位青年学者和技术专家带来报告,将围绕视频大模型架构比较、三维数字人视频生成、面向数字...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。目前人们有一个普遍的看法:在这种曲线拟合范式中,架构并不重要,关键的因素是数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心...……更多
...的360通过其首创的CoE(Collaboration of Experts,专家协同)技术架构及混合大模型对“慢思考”进行落地实践,该技术架构已落地在360 AI搜索、360 AI浏览器等多款产品中。AI助手通过CoE架构还接入了很多小参数专家模型,在回答简单问...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...覆性技术路线创新,北京将设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。在数据方面,鼓励各类主体开放共享高质量训练数据,根据数...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...AGI元年(2024)。自2017年谷歌提出Transformer机器学习模型架构后,该架构迅速席卷了整个人工智能领域,成为自然语言处理等相关研究的主要方法。2018至2020年是算法创新年,先后出现了基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的,分析了BERT灭绝的始末以及不同架构模型的优缺点,以史为鉴...……更多
...的自动驾驶系统开发进入了全新模式,新开发模式和技术架构将加速汽车智能化的进化进程。中国工程院外籍院士、清华大学智能产业研究院(AIR)院长张亚勤表示,AI大模型带来了从判别式AI到生成式AI的新技术范式变革,清华...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练的依赖,而且能够为智能系统的高效光训练提供支撑。图丨图中为课题负责人方璐教...……更多
更多关于科技的资讯:
3月11日,中国协作机器人第一股越疆科技(2432.HK)发布了全球首款“灵巧操作+直膝行走”具身智能人形机器人。越疆科技称
2025-03-11 19:01:00
华为新专利可实现电动车自动掉头,漂移掉头或变得易如反掌
天眼查知识产权信息显示,近日,华为数字能源技术有限公司申请的“一种电动车辆自动掉头的控制方法、控制器以及电动车辆”专利公布
2025-03-11 19:06:00
陵城农商银行“一站式”办理,减少个体户融资流程
德州市陵城区滋镇惠农农资店里,店主刘鹏正忙着给村里的种植户配货。他的店铺主要销售化肥、种子、农药等农业生产资料,每到春耕和秋收时节
2025-03-11 20:13:00
云生AI 提质增效  2025AI赋能招聘与人效提升分享会成都站圆满落幕
3月6日,“云生AI提质增效”2025AI赋能招聘与人效提升分享会正式开启全国巡回分享的大幕,首站在四川成都成功举办。数百位企业代表来宾亲临现场学习交流
2025-03-11 20:17:00
世俱杯奖杯首度亮相中国,海信携手FIFA点亮山城
科技之光与足球荣耀在山城重庆璀璨相遇。3月10日,2025世俱杯奖杯震撼亮相海信重庆解放碑快闪店。作为2025海信XFIFA世俱杯奖杯中国行的重要环节
2025-03-11 20:17:00
王腾把小米15 Ultra拆了 指出美中不足的一点
快科技3月11日消息,今晚REDMI品牌总经理王腾晒视频称,自己把友商的小米15 Ultra拆了,看看有啥优秀的影像能力和算法能继承到REDMI
2025-03-11 22:19:00
小米回应SU7 Ultra充电达不到标称的快充速度:使用第三方充电桩有影响
快科技3月11日消息,小米汽车今日晚间发布了答网友问(第122集)。有网友询问,为什么我的小米SU7 Ultra充电达不到标称的快充速度
2025-03-11 22:19:00
最前线|亿咖通科技2024年第四季度当季盈利
亿咖通科技(来源:企业官方)亿咖通科技(纳斯达克股票代码:ECX)于3月11日发布了2024年第四季度及全年业绩报告,宣布实现全面盈利
2025-03-11 22:25:00
“穷游”当道,文旅市场如何接招?聊城大学传媒技术学院专题调研给出答案曾经被视为小众旅行方式的“穷游”,如今已成为席卷文旅市场的文化现象
2025-03-11 22:34:00
禾赛科技盘中股价暴涨超41% 消息称禾赛激光雷达拿下奔驰大单
快科技3月11日消息,今日晚间,美股禾赛科技开盘后股价一路暴涨,截止当前发稿,股价已上涨超41.79%。消息面上,禾赛科技在今日公布的2024年Q4财报中透露
2025-03-11 22:49:00
又一时速350公里高铁有新进展:厦门至广州仅需2.5小时
快科技3月11日消息,中国铁路宣布,漳汕高铁(漳州至汕头)漳江湾跨海特大桥日前迎来了重要的工程节点——海上首个桩基顺利开钻
2025-03-11 22:49:00
神仙姐姐有望代言智界!余承东辟谣网传与刘亦菲恋情:我都没见过她
快科技3月11日消息,不知道从何时起,网上传出了余承东与刘亦菲相恋的消息,这确实让不少网友惊掉下巴。据国内媒体报道称,针对近日网传与刘亦菲恋情
2025-03-11 20:19:00
支付宝严厉打击“0元享、免费租”套路:用户可以主动退
快科技3月11日消息,支付宝开放平台发布公告,通报了对于违规使用“芝麻先享”、“商家扣款”等API接口的治理情况,严厉打击“0元享
2025-03-11 20:19:00
《王者荣耀》全新限时玩法上线:魏蜀吴等八大势力
快科技3月11日消息,《王者荣耀》宣布五五限时玩法【势力对决】现已上线体验服。当五排队伍选择的英雄均属于同一势力时,激活对应的势力技能
2025-03-11 20:19:00
以“精工匠信“重塑品质高度:海信中央空调定义舒适生活新标准
在中央空调行业,产品性能与安装服务始终是用户体验的双重基石。海信中央空调基于对消费痛点的深刻洞察,以“精工匠信”为核心理念
2025-03-11 20:22:00