• 我的订阅
  • 头条热搜
...之间的桥梁。作为软件根技术,它已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。在近日召开的昇思人工智能框架峰会上,华为发布昇思MindSpore 2.3。作为国内主流开源框架,可以让开发者更灵活地实现大模...……更多
...人事报美国人工智能公司OpenAI近日推出的生成式人工智能模型Sora,震动全球科技界,其背后的研究团队也浮出水面。根据OpenAI官网介绍,Sora团队包括两名研发负责人威廉·皮伯斯和蒂姆·布鲁克斯,系统负责人康纳·霍姆斯,以...……更多
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构
... 3 倍、DRAM 带宽增长 1.6 倍、互连带宽则仅有 1.4 倍。而大模型是大数据 + 大计算的产物,其参数量可达千亿乃至万亿规模,需要成千上万台 GPU 才能有效完成训练。这些实际情况提升了人们对高性能计算(HPC)的需求。为了获得...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
NeurIPS 2024评审结果公布!AI大佬晒出成绩单,又是被吐槽最严重的一届
...非常微妙,即使在过度参数化的情况下也是如此。而对大模型而言,权重衰减则扮演者完全不同的角色。与最初一版arXiv论文相比,研究人员对其进行了很多更新。Andriushchenko表示,自己非常喜欢这项新实验,并且匹配了AdamW有效...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前,基于规则的系统长期以来是语言模型的主导范式。顾名思义,基于规则的系统就是依赖人类编码的规则来执行决策。这种方式构建的 AI 虽然简单,但在某些特定...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...著的能力跟进,可见其技术发展与创新的潜力。除了Gemini模型外,Gemma这一系列轻量级的SOTA开放模型似乎与我们距离更近。它基于Gemini模型相同的研究和技术构建,旨在让每个人都拥有构建AI的工具。谷歌持续扩展Gemma家族,包...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...Zhang (https://zhangyuanhan-ai.github.io/),主要研究领域为将基础模型适配于开放世界。本文的指导老师为 Ziwei Liu 教授 ((https://liuziwei7.github.io/) 和 Chunyuan Li 博士 (https://chunyuan……更多
...根据差异进行识别?AI检测工具如何应对越来越聪明的大模型?带着这些问题,记者采访了有关专家。AI创作套路化明显“虽然大模型在不断发展迭代,但到目前为止,AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显...……更多
...业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...Alignment。3. 黄灿:厦门大学数学系副教授随着大规模语言模型的快速发展,如 GPT、Claude 等,LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而,即便如此,LLM 仍然存在生成不当或偏离预期的结果。这种现象在推...……更多
...最新发表一篇化学论文称,研究人员研发出一种机器学习模型,该模型能部分重现职业化学家在工作中积累的集体知识,这类知识通常被称为“化学直觉”。该研究认为,这或使今后的药物研发更高效。据论文介绍,传统上,药...……更多
贾扬清共一论文获ICML时间检验奖:著名框架Caffe前身
...觉任务。事实证明,这个想法在今天仍然与最好的多模态模型非常相关!两位老搭档也在评论区叙上了旧: ICML今年是其举办的第41届,投稿量9000+,接受率27.5%。除了时间检验奖,最佳论文奖也已出炉,Stable Diffusion 3论文等上榜...……更多
浪潮海岳大模型平台研发团队:记录一群浪潮青年人的梦想追寻之路
作为一个充满活力与创新精神的青年团队,浪潮海岳大模型平台研发团队与“智能化”相伴而生,始终以勇立智能化创新发展潮头为目标,牢牢把握智能化大势。团队以前瞻性的眼光布局人工智能领域,以科学严谨的态度勇担...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...由谷歌DeepMind和Isomorphic Labs团队研发的最新迭代人工智能模型AlphaFold3,能以较高准确率预测蛋白质与其他生物分子相互作用的结构,其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
WWDC24没有王炸,AI正在动摇苹果根基
...果智能”就算不上有多优秀了。和OpenAI、谷歌等巨头的大模型相比,“苹果智能”就像学龄前儿童。苹果显然也明白这一点,所以苹果宣布与OpenAI合作,在iPhone、iPad、Mac上直接搭载了ChatGPT。通过GPT-4o,Siri将实现通话录音生成摘...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...DeepMind、Dario Amodei还没创办Anthropic,而OpenAI还没all in语言模型,仍是一家研究范围更广泛的AI公司。他们提出,通过人类反馈,让AI模型更好地学习「如何翻出一个漂亮的后空翻」。 训练时,AI agent在环境中不断观察并行动,并...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接外部数据源,检索增强生成(RAG)技术也逐渐获得业内的关注。但并不是接入外部数据即可万事大吉,有很多用户查询非...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车...……更多
infini-attention:谷歌大内存机制
...歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提出的...……更多
硕博招生!AI排名跻身前15,全球首所人工智能大学MBZUAI实力大增
...els,继去年 10 月份和 G42 共同开发了最先进的阿拉伯语大模型之后,又独立开发了领先的 K2 开源模型,成为全世界唯一一个能够自行训练开发 65B 规模大模型的大学,引领了新一代基础模型的研究。同时,计算生物学方向的生命...……更多
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
...“开源对于防止权力集中很重要。到目前为止,每个大型模型都在某种程度上是‘可越狱的’。”马萨诸塞大学洛厄尔分校计算机科学教授JieWang则对记者表示,“未来各主要参与者都会将其大模型的某些部分开源,但绝对不是...……更多
OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺
...大规模损失,以及人类的边缘化或灭绝。在他们看来,AI 模型的安全问题,已经上升到足够威胁人类未来生存的水平。同样,AI 模型的安全问题,也已经是可以影响每一个人、每一个人都有必要关心的话题。5 月 22 日,注定是人...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...力于推动人工智能领域的技术创新和发展。数据是大语言模型(LLMs)成功的基石,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。...……更多
更多关于科技的资讯:
理想智驾负责人郎咸朋:李想对我发过一次火 智驾做不到头部就不用干了
快科技12月26日消息,理想汽车今日晚间举办“2024理想AI Talk”。主持人问道,听说李想对智驾团队曾发了很大的火
2024-12-26 20:37:00
帧率提升200%!AMD RX 7900 XT挑战5款FSR 3.0大作
一、前言:蓝宝石RX 7900 XT极地挑战5款FSR 3游戏今年最火的游戏当属《黑神话:悟空》无疑,它也可能是目前为止最为消耗显卡资源的3A大作
2024-12-26 20:37:00
赵孝国:立足品质,餐饮行业需要一次“重塑”
12月26日,2024山东餐饮零售业品牌影响力巡礼活动成功举办。来自餐饮界的大咖、精英对话交流,为从业者提供发展新思路
2024-12-26 20:38:00
餐饮行业如何平稳穿越行业周期?行业大咖们这样说!
12月26日,“2024山东餐饮零售业品牌影响力巡礼”表彰大会在济南舜耕山庄隆重举办。此次大会汇聚了众多餐饮零售行业的精英大咖
2024-12-26 20:41:00
贵阳第二家学习“胖东来”模式 永辉超市新世界花园店12月27日开业
多彩贵州网讯(本网记者 文彬 陈仕发) 历时31天闭店调改,永辉超市贵阳新世界花园店将于12月27日9:00重新开业。作为贵阳第二家学习 胖东来模式调改开业的门店
2024-12-26 20:47:00
小米平板7即将在印度发布 主打生产力 国行早已开售
【CNMO科技消息】近日,小米正式宣布,其最新平板——小米平板7即将登陆印度市场。根据亚马逊的预热页面显示,这款平板的印度发布会将于2025年1月10日举行
2024-12-26 20:54:00
真我14 Pro+曝光 1.5K等深四微曲屏+潜望长焦稳了
【CNMO科技消息】前不久发布的真我Neo7新品,可以说是凭借着7000mAh的泰坦电池、天玑9300+、IP69+IP68满级防水以及首销2099元起的价格杀疯了
2024-12-26 20:55:00
苹果 iOS 19兼容性曝光:最低门槛提升至A12芯片
【CNMO科技消息】根据外媒透露,苹果公司下一代操作系统更新的设备兼容性情报已提前外泄。所有当前能够运行iOS18的iPhone型号预计也将继续获得iOS19的支持
2024-12-26 20:55:00
华为Mate X6销量超越Mate70 Pro?果然强得飞起
【CNMO科技消息】现在距离华为Mate品牌盛典过去也有将近一个月时间了,包括此前上市的Mate70系列和MateX6依旧是一机难求的状态
2024-12-26 20:55:00
曝OPPO或首发新款天玑次旗舰芯片 两大子品牌Q2发力
【CNMO科技消息】今年10月24日,OPPO发布了OPPOFindX8及OPPOFindX8Pro,全球首批搭载联发科天玑9400芯片
2024-12-26 20:55:00
采访商佑安:做品牌是远程攻击,不要总想着肉搏
第一次见观速咨询商佑安老师是在11月底,是在9月底,在新加坡举办的“以品牌为中心的第二次增长”为主题的营销会上,来的嘉宾很多传统企业和新加坡快餐连锁行业的CEO
2024-12-26 20:55:00
一加Ace 5系列详细参数汇总:全面升级 或2399元起
【CNMO科技消息】一加Ace5系列将于明日(12月26日)14:30发布。12月25日,博主@数码闲聊站汇总了一加Ace5系列的详细参数
2024-12-26 20:56:00
荣耀公布MagicOS 9.0五大升级亮点
【CNMO科技消息】据CNMO了解,荣耀MagicOS9.0第二波升级已经到来,官方总结了五大升级亮点,包括YOYO智能体
2024-12-26 20:57:00
华为手环10曝光,或与华为Pura 80同台亮相
据报道称,华为手环10已经通过了印尼SDPPI认证和TUVSUD认证,同时认证显示该款设备支持IP68级别防尘防水性能
2024-12-26 20:58:00
OPPO A5 Pro支持360°抗摔:通过多项军标环境测试
2024年12月24日,OPPO推出A5Pro手机,该产品以卓越的360°抗摔性能引发了行业内外的广泛关注,其实现了全方位的防护
2024-12-26 20:58:00