• 我的订阅
  • 头条热搜
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天,阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多
RNN回归!Bengio新作大道至简与Transformer一较高下
...WKV、Mamba、xLSTM等RNN衍生模型接连出现,欲挑战Transformer之霸主地位。就在近日,又有重量级人物下场——深度学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。 论文地址:http...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
OpenAI o1 的发布,再次给 AI 领域带来了一场地震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在...……更多
8位数年薪!“最懂阿里大模型的人”带整个团队跳槽加入!字节跳动放大招?
...抢人早已是公司开辟新业务时惯用的手段。字节创始人张一鸣曾多次在公开场合提到“人才密度”的概念,在他看来,只要保证人才密度超过业务复杂度,那么在有效的激励措施下业务的成功是水到渠成的。张一鸣本人就是这套...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...道路在当前的视觉生成领域,Diffusion 模型是毫无疑问的霸主。这种方法生成的图像质量较高,视频也越来越好。但另一方面,以 Transformer 为代表的自回归模型在文本领域的成功就在眼前,这不禁让人去想象自回归模型在视觉领...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
【新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得...……更多
来源:极目新闻11月4日,出门问问自研大模型「序列猴子」正式向全社会开放。即日起,广大用户可登陆基于「序列猴子」的AI写作助手奇妙文,或AI开放平台体验。今年4月,出门问问「序列猴子」开启邀测。「序列猴子」以语...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
生命科学领域,已经率先进入到基础模型时代!今年,化学诺贝尔奖授予了AlphaFold,AI+Science受到空前的关注。人们惊叹于,仅仅是一个蛋白质结构预测模型,就能释放出如此巨大的行业潜力。就在当下,在第三届中国生物计算...……更多
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
...领域正在经历重大转型,从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。目前虽然有不少基础模型已经提出,但如何有效地在高度多样化的时序数据上训练基础模型仍是一个开放问题。近期,来自...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...Riley Goodside小哥,依然在用「Strawberry里有几个r」折磨大模型们,GPT-4o在无限次PUA后,已经被原地逼疯!相比之下,Claude坚决拒绝PUA,是个大聪明。而谷歌最近的论文也揭示了本质原因:LLM没有足够空间,来存储计数向量。Strawber...……更多
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
【新智元导读】TimeMixer++是一个创新的时间序列分析模型,通过多尺度和多分辨率的方法在多个任务上超越了现有模型,展示了时间序列分析的新视角,在预测和分类等任务带来了更高的准确性和灵活性。在数据驱动的时代,时...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋...……更多
...的蛋白质序列数据集,并利用其训练了Venus(启明星)系列模型。肉、蛋、奶,这些食物中含有丰富的蛋白质,可以提供人类身体所需营养。但天然的蛋白质难以发挥这些功能,科研人员需要对天然蛋白质的功能进行设计和改造,...……更多
麻省理工学院联合metaai开发streamingllm框架
...研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。▲图源GitHubStreamingLLM的研究重点,是想解决实现流式语言模型(...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshu...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
值得收藏!2023 年,你应该知道的所有机器学习算法~
...今年,我想在去年发表文章的基础上提供各类别中更多的模型。希望提供一个工具和技术的宝库,你可以将其作为书签,这样就可以解决各种数据科学的问题了。说到这里,让我们深入了解以下六种最重要的机器学习算法类型。...……更多
智慧芽发布AI助手“芽仔-生物医药”,大模型革新信息检索模式
...放其API服务。“芽仔-生物医药”基于智慧芽生物医药大模型,旨在通过AI问答的新范式,革新用户在医药竞争格局分析、临床试验与循证医学、序列及化合物专利、政策与准入等关键场景的信息检索工作,显著提升研发效率。智...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...“AIGC第一股”出门问问(02438.HK)携AIGC艺术展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为...……更多
...道,日前,研究人员公布了他们使用一种名为蛋白质语言模型的生成式人工智能工具,设计CRISPR基因编辑蛋白质的细节,并证明其中一些系统能够像预期那样工作。今年2月,另一个团队曾宣布,他们已经开发出一种基于微生物...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
【新智元导读】RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。与Transformer相比,RNN模型的一大优势是应对长序列的能力。比如Mamba,内部状态大小始终保持不变...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...而数倍乃至数十倍地减少时间和经济成本。此外,由于该模型具有通用性,对各领域都适用,决定了它将大大加速我国生物制造业、合成生物学、生物医药等领域的发展,帮助我国企业与国际头部公司进行良性互动与竞争。相关...……更多
国产算力新突破!科大讯飞攻克MoE高效训练难题,发布星火X1.5
...签构成的错因体系,获得国家数学课程标准修订组组长曹一鸣教授领衔的专家组权威鉴定。通过星火智能批阅机和星火教师助手,实现了从作业精细批改到课堂因材施教的“小时级闭环”,引领教学范式变革。在医疗领域,星火...……更多
更多关于科技的资讯:
7×24小时自主巡检,杭州萧山机场添智能驱鸟装备
在航空运输业快速发展的今天,机场安全运行始终是行业关注的重点。鸟类撞击飞机的事件虽不常见,但一旦发生,可能对飞机引擎、机身结构造成损害
2025-11-18 10:47:00
“产业炬光灯”聚焦元之道生物科技
“产业炬光灯”聚焦厦门元之道生物科技有限公司。扫码看视频厦门网讯(厦门日报记者 李晓平)小小微生物,蕴藏着改变健康的大能量
2025-11-18 09:03:00
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00
阿里全力进军AI to C市场 千问APP上线公测
11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。当天,千问APP公测版上线,基于全球性能第一的开源模型Qwen3
2025-11-17 11:08:00
中新经纬11月17日电 据韩联社报道,三星集团将在未来五年对本土科学研究与试验发展等领域共投资450万亿韩元(约合人民币2
2025-11-17 11:48:00
近日,南都湾财社记者注意到,因为小天才电话手表社交圈的流行,已经产生了相应的产业链——加好友、冲点赞、买“靓号”、卖“高粉”账号
2025-11-17 12:04:00
“25岁,我勇敢从大厂裸辞”“37岁年薪百万,却主动告别互联网大厂”“离开大厂两年,我活成了想要的样子”……近来,“大厂离职”话题在社交平台持续升温
2025-11-17 12:05:00
潍坊联通圆满完成2025潍坊企业家大会通信保障任务
鲁网11月17日讯在第6个潍坊市 “企业家日”到来之际,2025潍坊企业家大会于11月1日隆重召开,主会场设在富华国际会议中心
2025-11-17 14:33:00
蓝盾出击!一场与病毒的闪电战——记潍坊联通快速响应团队的72小时攻坚
鲁网11月17日讯2025年10月21日下午,一阵急促的电话铃声在某单位响起,揭开了与病毒赛跑的序幕。“系统异常!多台办公电脑感染未知病毒
2025-11-17 14:34:00
安谋科技Arm China发布“周易”X3 NPU IP,破局AI算力勾勒智能未来全景图
2025年11月13日,国内领先的芯片IP设计与服务提供商安谋科技Arm China,正式揭开了新一代NPU IP“周易”X3的神秘面纱
2025-11-17 14:35:00
凯盛浩丰集团创新人力资源管理斩获北森2025AI应用先锋奖
鲁网11月17日讯近日,凯盛浩丰集团凭借人力资源领域的AI创新实践,斩获“北森2025AI应用先锋奖”。通过将AI技术融入招聘
2025-11-17 14:35:00
2026亚洲100必打卡榜目的地!福州入选
日前,携程正式发布口碑榜2026年度榜单,福州入选“2026亚洲100目的地榜”“2026中国100目的地榜”两个榜单
2025-11-17 15:20:00
当“工业硬核”遇见“健康温度”:如新在一汽开放日奏响家企健康新乐章
鲁网11月17日讯11月15日的青岛,寒意初显,但一汽解放青岛汽车有限公司的即墨厂区内却暖流涌动。一场名为“扬帆家年华·领航新乐章”的2025员工家属开放日暨员工音乐节正在这里温情上演
2025-11-17 15:45:00