• 我的订阅
  • 头条热搜
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天,阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多
RNN回归!Bengio新作大道至简与Transformer一较高下
...WKV、Mamba、xLSTM等RNN衍生模型接连出现,欲挑战Transformer之霸主地位。就在近日,又有重量级人物下场——深度学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。 论文地址:http...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
OpenAI o1 的发布,再次给 AI 领域带来了一场地震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
【新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得...……更多
出门问问发布大模型“序列猴子”,李志飞:做人类的CoPilot是大模型最好的工作
...搜狐科技编辑|潘琭玙4月20日,出门问问宣布内测探索大模型“序列猴子”。出门问问创始人兼CEO李志飞介绍,该名字灵感来源于数学家埃米尔·波雷尔在20世纪初提出的“无限猴子”定理。根据该定理,如果一群猴子随机地敲...……更多
出门问问内测大模型“序列猴子”,CEO李志飞:我们不融资也能支撑研发
...两年极少公开露面的李志飞,这次也要加入到国内 AI 大模型浪潮中。钛媒体App获悉,4月20日出门问问举行的2023 AIGC(生成式人工智能)战略发布会上,前Google(谷歌)科学家、出门问问创始人兼CEO李志飞宣布推出出门问问版GPT...……更多
来源:极目新闻11月4日,出门问问自研大模型「序列猴子」正式向全社会开放。即日起,广大用户可登陆基于「序列猴子」的AI写作助手奇妙文,或AI开放平台体验。今年4月,出门问问「序列猴子」开启邀测。「序列猴子」以语...……更多
张一鸣熬夜看论文 AI博士年薪500万 大模型搅动创业圈
...化”。他当时就已预判,这是一个将改变人类的产品。张一鸣、马化腾、张勇、王兴,这些巨头的一号位或者决策中心人物,也似乎一夜间回到了2010年代移动互联网创业潮时的亢奋、好奇状态。按照猎户星空董事长傅盛的说法...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新...……更多
出门问问内测探索大模型“序列猴子”,为个人与企业打造专属CoPilot
...临”的2023 AIGC战略发布会。会上出门问问宣布内测探索大模型「序列猴子」,并提出CoPilot将会无处不在,同时在大模型能力的基础上还同步开启了面向创作者的CoPilot产品矩阵,面向C端的升级版语音助手魔法小问,以及面向B端...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
...领域正在经历重大转型,从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。目前虽然有不少基础模型已经提出,但如何有效地在高度多样化的时序数据上训练基础模型仍是一个开放问题。近期,来自...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...Riley Goodside小哥,依然在用「Strawberry里有几个r」折磨大模型们,GPT-4o在无限次PUA后,已经被原地逼疯!相比之下,Claude坚决拒绝PUA,是个大聪明。而谷歌最近的论文也揭示了本质原因:LLM没有足够空间,来存储计数向量。Strawber...……更多
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
【新智元导读】TimeMixer++是一个创新的时间序列分析模型,通过多尺度和多分辨率的方法在多个任务上超越了现有模型,展示了时间序列分析的新视角,在预测和分类等任务带来了更高的准确性和灵活性。在数据驱动的时代,时...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋...……更多
麻省理工学院联合metaai开发streamingllm框架
...研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。▲图源GitHubStreamingLLM的研究重点,是想解决实现流式语言模型(...……更多
AI能生成超越自然界的新型蛋白质,可用于制造特定机械性能材料
...学院院长大卫・卡普兰(DavidKaplan)。利用新型机器学习模型蛋白质是由氨基酸串联而成的长链,这些链会折叠成三维的形状。氨基酸的顺序决定了蛋白质的结构特征,而结构特征又影响了蛋白质的力学性能。虽然科学家们已经...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshu...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
值得收藏!2023 年,你应该知道的所有机器学习算法~
...今年,我想在去年发表文章的基础上提供各类别中更多的模型。希望提供一个工具和技术的宝库,你可以将其作为书签,这样就可以解决各种数据科学的问题了。说到这里,让我们深入了解以下六种最重要的机器学习算法类型。...……更多
继 AI 绘画、AI 聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质
...质片段,再人工设计、拼补上去。现在科研人员通过 AI 模型一次性提交几十个蛋白质设计需求,几个小时后便马上收到一份设计结果和分析报告。生命科学的下一个时代,似乎来了。ChatGPT 引发的新一轮 AI 浪潮,正在席卷生命...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...“AIGC第一股”出门问问(02438.HK)携AIGC艺术展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
...道,日前,研究人员公布了他们使用一种名为蛋白质语言模型的生成式人工智能工具,设计CRISPR基因编辑蛋白质的细节,并证明其中一些系统能够像预期那样工作。今年2月,另一个团队曾宣布,他们已经开发出一种基于微生物...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...而数倍乃至数十倍地减少时间和经济成本。此外,由于该模型具有通用性,对各领域都适用,决定了它将大大加速我国生物制造业、合成生物学、生物医药等领域的发展,帮助我国企业与国际头部公司进行良性互动与竞争。相关...……更多
...、IBM沃森AI实验室和塔夫茨大学研究人员采用了一种生成模型,其与DALL-E 2等AI系统中使用的机器学习模型架构相同,但研究人员调整了模型架构,以预测实现特定结构的蛋白质的氨基酸序列。这一模型学习控制蛋白质形成方式的...……更多
infini-attention:谷歌大内存机制
...歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提出的...……更多
更多关于科技的资讯:
本文转自:人民日报海外版可以“加购”的盾构机、可以下单的载人飞艇——一批大国重器在电商平台“上链接”本报记者 李 婕《 人民日报海外版 》( 2024年11月06日 第 11 版)从海底高铁隧道盾构机到0
2024-11-06 03:58:00
创业者与园区的双向奔赴(留创园走过30年)
本文转自:人民日报海外版走近上海漕河泾留创园的海归团队——创业者与园区的双向奔赴(留创园走过30年)本报记者 孙亚慧《 人民日报海外版 》( 2024年11月06日 第 10 版)漕河泾开发区
2024-11-06 04:00:00
本文转自:人民日报海外版《 人民日报海外版 》( 2024年11月06日 第 10 版)本报电 近日,第44届GITEX GLOBAL展会(GITEX GLOBAL 2024)在阿联酋迪拜举行
2024-11-06 04:01:00
上万人围观!娃哈哈15万股将在阿里平台拍卖:起拍价268万元
快科技11月5日消息,阿里资产平台显示,浙江娃哈哈实业股份有限公司的15万股股份将于11月11日进行二次拍卖,起拍价格为268
2024-11-05 19:09:00
蓝帽认证21金维他维生素C片60粒:到手9.9元(大差价)
天猫21金维他官方旗舰店,21金维他维生素C片60粒,日常标价为300.9元,下单领251元优惠券,叠加满减优惠,到手价为9
2024-11-05 19:39:00
七款国产旗舰新机价格汇总:普遍涨价 最低3599元
最近,新发布的国产旗舰手机普遍涨价,引起网友热议。最近发布上市的国产旗舰至少有7款,价格确实都在上涨,其中最便宜的是真我GT7 Pro
2024-11-05 19:39:00
雷军称将推出小米驾校 王化:目前并没有制订培训费用
快科技11月5日消息,“小米驾校”相关话题引发热议。近日,雷军在小米发布会上称将推出小米驾校供大家学习,他表示:我们很多人拿到驾照以后
2024-11-05 22:09:00
贵州小伙在美国卖三蹦子赚了人生第一个100万:已达成25岁目标
快科技11月5日消息,据报道,贵州小伙骆豪今天发布了“赚到了人生第一个100万,这一年25岁,目标达成”的朋友圈。报道称
2024-11-05 22:09:00
扛着涨价压力 GT7 Pro售价3599起背后!徐起:realme要做好的质价比产品
11月4日,realme在线上发布了新机真我GT7 Pro,作为首批大招骁龙8至尊版的机型之一,3599元起的售价一出立刻引爆市场
2024-11-05 22:39:00
苹果M4硬刚Intel和AMD 凭什么
前几天,苹果又玩起了不开发布会,直接上新品的操作。对于不少打酱油的吃瓜群众来说,可能是苹果没啥创新力的体现,无非就是处理器性能更强点而已
2024-11-05 22:39:00
这两天,是购物人的节日。除了火爆的“双十一”,今天一年一度的中国国际进口博览会也在上海拉开大幕。来自浙江的4.3万名专业“买手”
2024-11-05 23:00:00
宝马大中华区总裁:期待更多刺激消费措施推动市场增长
快科技11月5日消息,在第七届中国国际进口博览会上,宝马大中华区总裁兼首席执行官高翔表示,宝马汽车看好中国汽车业长期健康的发展
2024-11-05 19:39:00
上汽荣威iMAX8 DMH新陆尊成全球续航最长MPV:实测超1500km
快科技11月5日消息,全球续航最长的MPV易主了,最新夺冠的正是上汽荣威iMAX8 DMH新陆尊。在第三方实测中,荣威即将发布的全新插电混动MPV车型iMAX8 DMH新陆尊满油满电可达1536km
2024-11-05 19:39:00
天然晾晒 桔子树无碘海盐 6袋到手9.9元
桔子树无碘海盐320g*6袋目前售价19.9元,今日可领10元优惠券,到手价9.9元。先抽取今日红包,再买价更低:天猫无门槛红包至高24888元
2024-11-05 19:39:00
AI自动超频!技嘉X870E AORUS MASTER超级雕主板图赏
快科技11月4日消息,技嘉最近发布了X870E AORUS MASTER主板,适合超频者和发烧友。现在这款主板已经来到我们评测室
2024-11-05 19:39:00