• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...,Semi 赛道侧重于考验核心主干技术,即更多地关注模型架构的选择以及特征提取泛化能力,对多模态大模型技术技术积累以及创新性要求比较高。 针对赛道少标签数据、高技术要求的特征,Soul 团队基于此前积累的自研大模型...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
大模型“遍地”都是,谁能真正解放生产力?
...各自发挥了不同的价值。通用大模型解决基础性问题统一架构、统一模态、统一任务,而专用大模型解决专业领域知识问题,通过结合行业数据的预训练实现业务场景应用。而迫切寻求数字化转型的客户们需要的是,更精准、更...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...训练变得极为困难甚至无法实现。而大模型中 Transformer 架构的引入,则使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...于设计更高效的基于 Margin 的损失函数或者更复杂的网络架构,以此来帮助卷积神经网络更好地捕捉细腻度的人脸特征。近年来,无监督学习和图神经网络的成功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸...……更多
今日明星“端到端”,能否撑起智能驾驶的未来?|OpenTalk 回顾
...。直到2023年上海人工智能实验室发表的端到端自动驾驶架构UniAD获得CVPR 2023最佳论文、马斯克直播展示FSD,以及聚焦研发端到端自动驾驶系统的初创公司Wayve在2024年获10亿美元融资,各界才真的开始形成一个共识:端到端已经是...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...出得更早,方法更前瞻,落地应用也更快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以...……更多
新一轮ai算力调度平台的重要性
...中,客户对于算力的需求、对应用的要求,以及对于底层架构都在发生变化。”青云科技总裁林源在接受记者采访时表示,新一轮的变化就是新一轮的机会。AI算力开启“数智化”时代,带来新机遇当前,自动驾驶、人脸识别、...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...它们可能有助于更有效地执行下游任务。图 2. ProMaC 整体架构 实现方法如图 2 所示,该研究提出了一个循环优化的 ProMaC 框架,它包括两部分:利用幻觉来从任务通用提示中推理出样本特有提示的 multi-scale chain of thought prompting ...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...成数据使任意语言模型具备语音交互能力。Mini-Omni 模型架构Mini-Omni 整体模型框架如下图所示,模型输入端可以是语音或文本,输出端同时包含文本和语音。为复用语言模型「预测下一个 token」的学习范式,输出侧语音采用离散...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...韵、意境等方面,都能有精准的把控。完全自主研发,MoE架构,万亿参数在这次因为LiveBench又出来炸场一波之前,Step-2留给外界的最深刻印象,一定有一个是“国内首个由初创公司推出的万亿参数大模型”。这有点像阶跃风格的...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
自研芯片三国杀,头部智驾新战场,蔚小理谁强?
...模型,理想为了解决端到端大模型可解释性差的问题,将架构升级为「端到端+VLM」,而小鹏则和特斯拉一样坚信纯视觉才是智能驾驶的终局,发布了下一代AI鹰眼纯视觉方案。但是要最大限度的发挥算法的能力,必须要有和软件...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...工智能基础模型迫在眉睫。智谱AI于2020年底研发GLM预训练架构,三年多来始终坚持全自研路线,新一代基座大模型GLM-4是智谱 AI专注于大模型创新的最新成果。智谱 AI愿与人工智能行业所有的参与者、产业链上下游合作伙伴、开...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...处理。 计算模拟训练可以快速探索、验证和测试各种PNN架构,有助于在进行实际的物理建构之前提高PNN的准确性和功能性。这种方法不仅速度更快,成本效益更高,无需为每次设计迭代建立和优化昂贵而耗时的物理系统,还具...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
...语言交互能力撼动了整个世界。之后十几个月,Transformer架构和大语言模型LLM成为划时代的技术,激发了整个AGI领域的创业和创新。OpenAI和Google相继推出了GPT-4o、ProjectAstra等「AI全家桶」、字节跳动发布「豆包」大模型家族、腾...……更多
光芯片再次突破!清华大学研制出“太极-II”光训练芯片:首创全前向智能光计算训练架构【附光芯片行业现状分析】
...琼海院士课题组另辟蹊径,首创了全前向智能光计算训练架构,研制了“太极-II”光训练芯片,实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题,于北京时间8月7日晚在线发表于...……更多
利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪
...,要关注哪些产品?根据英伟达官网披露,在每一代的GPU架构下,公司会将旗下的GPU按品牌分类进入GeForce、NVIDIA RTX/Quadro、数据中心三个品类。其中,GeForce系列主要应用于游戏行业,属于消费级GPU;NVIDIA RTX/Quadro主要应用于工业...……更多
比AI更热的行业,跑出了头部选手
...技术也正在迎来技术变革。那么首先要变革的,就是底层架构。在车辆的电子电气架构方面,特斯拉是早期变革者,在2012年 Model S有较为明显的功能域划分,包括动力域、底盘域、车身域, ADAS模块,到2017 年特斯拉又在Model3 突...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...中文能力已追平GPT-4。多模态能力层面,混元文生图基础架构全面升级至Sora同款DiT架构,成为国内首个中文开源文生图Dit架构的大模型。为服务大模型产业发展,腾讯云推出大模型训练“黄金三件套”。新一代HCC高性能计算集群...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...a这样的大型Transformer提炼成了Mamba模型, 并且成功在Mamba架构上应用了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能卓越:Gemma 2 27B模...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
更多关于科技的资讯:
一加ace5系列发布会来了,一起来看看吧
周末@一加手机也没有闲着,日前,官博陆续发布了多张关于一加Ace5系列的预热海报,透露了该系列新机包括视觉体验、防尘防水
2024-12-27 20:16:00
华为mate80价格持续走低,同样拥有5000万像素
据报道,镜头配置上,华为Mate80Pro更是下足了功夫。全新的豪威OV50K传感器,以5000万像素的惊人解析力,捕捉世界的每一个细腻瞬间
2024-12-27 20:18:00
小米14和小米15差不多,区别大吗?
尽管小米15已经发布了一段时间,市场上关于新机的讨论依然没有停歇。不过令人感到意外的是,上一代的小米14居然仍然稳稳占据热销榜的前排
2024-12-27 20:21:00
2499元买到的华为手机,骁龙8gen3处理器
近期有个粉丝网友私信我说,自己是华为的老粉丝,近些年买过不少华为手机,但是手中的华为手机已经内存不足了,以前为了省钱,仅买到的8GB+128GB版本
2024-12-27 20:22:00
苹果iphone16销量不如预期,国产旗舰手机抢占市场
在国产旗舰手机纷纷涨价的情况下,苹果却在年底罕有地大降价促销,最高优惠1200元,如此大的降价力度比去年的iPhone15还要大
2024-12-27 20:22:00
同价极致性价比的手机,红米k80,你值得拥有
许多消费者有这样的一个认知误区,认为售价越高的手机,配置表现就越好,性能表现就越强,其实,这种观点是非常片面的,尤其是2000-4000价位段的产品
2024-12-27 20:23:00
魅族21pro高端旗舰降价4999元,性价比这么高?
在这个手机市场上,价格可真是一个谜团。有些手机搭载了几乎相同的处理器,但价格却天差地别。这是为什么呢?其实,手机的价格可不仅仅是由处理器决定的
2024-12-27 20:24:00
荣耀200pro性价比瞬间飙升,影像能力非常出色
如果你觉得手机护眼功能只是一个“噱头”,那可能还没试过荣耀的手机。说到护眼,荣耀可谓是手机界的“护眼专家”,它的护眼技术已经成为不少用户购买手机时的重要考虑因素
2024-12-27 20:26:00
东北科技大市场:坚持做科创企业的“贴心人”
本文转自:人民网-辽宁频道近日,一场政策解读会在东北科技大市场举行,省内60余家企业围绕如何申报相关政策以及企业目前发展面临的问题
2024-12-27 20:28:00
本文转自:人民网-辽宁频道东北科技大市场通过线上AI智能匹配服务与线下技术经理人团队专业服务的深度融合,进一步促进科技成果对接流程的自动化与智能化进程
2024-12-27 20:28:00
省内首家!枣庄传媒集团MCN来了
12月27日,枣庄传媒集团MCN(新媒体传播矩阵)成立发布会暨签约仪式在枣庄传媒大厦举行,标志着枣庄市在媒体融合创新发展方面迈出了坚实步伐
2024-12-27 20:31:00
中国制冷空调行业信息大会暨\
原标题:客观公正看待“铝代铜”技术的发展——第十一届中国制冷空调行业信息大会暨"铝代铜"技术发展论坛在厦门召开制冷空调行业是铜材料的主要消耗领域之一
2024-12-27 20:32:00
腾讯“飞行汽车梦”复燃:破产2个月等来收购、手握108家订单
破产两个月后,曾经的“空中特斯拉”等来了“生”的转机。一度估值240亿的飞行汽车宠儿,10月由于被德国政府拒绝贷款担保
2024-12-27 20:38:00
打工牛马逆袭爽片 邓超《胜券在握》今日网播上线
快科技12月27日消息,打工人逆袭爽片《胜券在握》今日在腾讯视频开播。《胜券在握》是导演刘循子墨继《扬名立万》之后,执导的第二部长片
2024-12-27 20:38:00
李想谈OpenAI:如果让我当CEO 我做的不会比Altman更好
快科技12月27日消息,今日晚间,理想汽车举办“2024理想AI Talk”直播。直播中,李想谈到了第一次使用ChatGPT时的感受
2024-12-27 20:38:00