• 我的订阅
  • 头条热搜
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...名为Attention is all you need 的论文,其中所提出的Transformer架构,为当下大热的ChatGPT、Gemini等大模型打下基础,人工智能领域从此变天。论文的八位作者,也被称为“Transformer八子”。不过,八位作者后来也陆续离开谷歌。除Lukasz K.……更多
滴普科技董事长兼CEO赵杰辉:从数据驱动到智能驱动,大模型释放数据平台全新生产力|WISE2023商业之王大会
...度释放生产力。他认为,未来,整个企业领域的数据智能架构将基于数据的基础设施建设,加上基于大模型的AI Agent,形成一个新的数字经济体架构。演讲正文如下:大家好,非常荣幸有机会在36氪WISE平台上跟大家分享我们的行...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...I的过去、现在与未来。当地时间3月21日,提出了Transformer架构、改写AI领域发展历程的论文《注意力就是你所需要的一切(Attention Is All You Need)》的作者们现身英伟达GTC大会,在名为Transforming AI(变革AI)的圆桌会议上与黄仁勋...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...用,当前主流大模型中,诞生了以BERT为代表的Encoder-only架构、以T5为代表的Encoder-decoder架构、以GPT为代表的Decoder-only架构的大规模预训练语言模型。1.3 GPT系列模型技术发展历程回顾从技术角度来看,结合中国人民大学《大语言...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。但是别被Scaling Law局限,参数小不意味着能力弱,模型架构的重要性应该重新进入我们的视线。MobileLLM不仅在同等大小的模型中达到了SOTA性能,而且提出,架构的深度比宽度更重要。一个「深而窄」的「瘦长」小模型同样可以...……更多
...行业异构多云场景下的应用上云支撑问题,实现从传统IT架构向基于云平台的高可靠、高并发、高弹性的分布式架构转型,帮助客户快速构建稳定、可靠、高效的行业云平台。目前,该产品已通过中国信通院多云管理平台解决方...……更多
字节跳动推出对话式ai实时交互解决方案
...端大模型的实时语音通话。▲对话式AI实时交互服务方案架构字节跳动介绍称,对话式AI实时交互解决方案支持开箱即用快速搭建,只需调用标准的OpenAPI接口即可配置所需的语音识别(ASR)、大语音模型(LLM)、语音合成(TTS)...……更多
...牛旅游网研发中心总经理顾启宁介绍,在“端到端”设计架构下,途致大模型采取小参数“集群”模式,即将机票、酒店、景点等业务模块链接不同的应用接口,以更轻量化的参数运转应对用户碎片化出行需求,同时也能“合体...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...手的背后,又运用了什么样的技术呢?独创“专家协同”架构实际上,这种根据需求调度大模型的用法,也刚好是360推出的一项新技术——CoE(Collaboration-of-Experts),即专家协同架构。我们知道,很多国产模型在单项指标上都打...……更多
“云+AI”风起云涌:火山引擎拥抱多云战略,加速企业业务创新增长
...助力企业智能化演进。此外,据火山引擎大模型服务算法架构师孙帆介绍,2023年6月,火山引擎发布火山方舟一站式大模型服务平台,集成了多款大模型应用,能够向用户提供字节云雀大模型、第三方闭源模型及开源模型的“1+N+...……更多
浪潮海岳数据中台inDataX 7.0全新发布,打造企业数据管理智能化新引擎
...理上基于高性能MPP分析引擎,在数据采集上采用流批一体架构,支持对存量数据的批量采集及增量数据的实时采集,借助流计算能力还可实现随采随算,从采集阶段即保证了数据时效性。在数据模型上,支持事实明细、聚合汇总...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
大模型的未来,快手在自己身上找答案
...上来说已经远优于同类数字人产品效果。这是因为在工程架构方面,「AI 关小芳」实现了端云结合的技术架构设计,通过搭建分布式流媒体计算调度框架、自研大模型能力算子化适配和专有网络协议加速,支持用户双工和 AI 智...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...结果进行规划。目前的这个解决方案有什么收益和成本?架构图:实际开发中需要注意的点?如何搭建整体和RAG相关框架:总之,选择什么样的实现方式需要综合考虑。举个例子,初期可以使用Langchain框架或现有平台快速搭建原...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不同粗细和颜...……更多
对话腾讯汤道生:大模型和云一样,难以被垄断|36氪专访
...服务能力获得市场竞争力,而不是单纯的低价。新的技术架构,也能为客户降本,比如大数据的湖仓一体架构,就比传统做法性价比更高。最近推出的新一代云服务器,基于性价比更高的Bergamo芯片,也能给到客户更低的单位计...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...”赵东岩强调,DeepSeek等大模型的幻觉来自于本身的技术架构和基于统计的机器学习范式,是大模型的内生性缺陷。因此,可以说大模型的创造力与幻觉是相伴相生的。他认为,要从根本上减少大模型幻觉,可以从让大模型学习...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
...模型,规模会变得越来越小,计算效率会越来越高,模型架构会变得更加开放和标准,这是我观察到的未来趋势。”如果说前两年的AI是在“卷”技术,那今年无疑都转向了“卷”应用。在贾扬清看来,今天是做应用最好的年代...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...igurable Dataflow Unit)为代表的动态可重构数据流(Dataflow)架构的芯片,能够通过并行处理和高效数据移动来优化性能和效率,近年越来越被认为是一个重要的发展方向。数倍于 GPU 推理性能来自 SambaNova 最新一代 RDU SN40L近日的芯...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...覆性技术路线创新,北京将设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。在数据方面,鼓励各类主体开放共享高质量训练数据,根据数...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
豆包大模型综合能力提升20.3%,火山引擎成立零售大模型联盟
...体系产品,都生长于同一朵云上。数据中心、软硬件基础架构的统一,避免了“算力孤岛”和“数据孤岛”问题,结合火山引擎自研服务器、自研 DPU 卡、调度算法等技术能力,火山引擎 AI 全栈云在性能、稳定性和成本上具备了...……更多
小模型正在成为AI界的新宠
...)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。早在2017年,谷歌发布《Attention Is All You Need》论文...……更多
百度智能云晒大模型落地成绩单:5个第一!
...成、代码审查、优化代码等能力。此次发布了企业级代码架构解释、企业级代码审查能力和企业级代码辅助能力。其中,企业级代码架构解释能让大模型快速解读代码库,梳理整个业务逻辑以及工程架构。程序员接手项目后就不...……更多
对话清华刘知远:Scaling Law已被OpenAI验证,知识密度将是未来的核心
...它。但如何高质量地做这件事?需要什么样的数据、模型架构、学习过程?他认为,还没有形成共识。“数据驱动的方向大致确定,但技术路线还远远没有被收敛,还是在高速演进。”“未来大模型面临着如何把更多的知识放到...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
更多关于科技的资讯:
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00
阿里全力进军AI to C市场 千问APP上线公测
11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。当天,千问APP公测版上线,基于全球性能第一的开源模型Qwen3
2025-11-17 11:08:00
中新经纬11月17日电 据韩联社报道,三星集团将在未来五年对本土科学研究与试验发展等领域共投资450万亿韩元(约合人民币2
2025-11-17 11:48:00
近日,南都湾财社记者注意到,因为小天才电话手表社交圈的流行,已经产生了相应的产业链——加好友、冲点赞、买“靓号”、卖“高粉”账号
2025-11-17 12:04:00
“25岁,我勇敢从大厂裸辞”“37岁年薪百万,却主动告别互联网大厂”“离开大厂两年,我活成了想要的样子”……近来,“大厂离职”话题在社交平台持续升温
2025-11-17 12:05:00
潍坊联通圆满完成2025潍坊企业家大会通信保障任务
鲁网11月17日讯在第6个潍坊市 “企业家日”到来之际,2025潍坊企业家大会于11月1日隆重召开,主会场设在富华国际会议中心
2025-11-17 14:33:00
蓝盾出击!一场与病毒的闪电战——记潍坊联通快速响应团队的72小时攻坚
鲁网11月17日讯2025年10月21日下午,一阵急促的电话铃声在某单位响起,揭开了与病毒赛跑的序幕。“系统异常!多台办公电脑感染未知病毒
2025-11-17 14:34:00
安谋科技Arm China发布“周易”X3 NPU IP,破局AI算力勾勒智能未来全景图
2025年11月13日,国内领先的芯片IP设计与服务提供商安谋科技Arm China,正式揭开了新一代NPU IP“周易”X3的神秘面纱
2025-11-17 14:35:00
凯盛浩丰集团创新人力资源管理斩获北森2025AI应用先锋奖
鲁网11月17日讯近日,凯盛浩丰集团凭借人力资源领域的AI创新实践,斩获“北森2025AI应用先锋奖”。通过将AI技术融入招聘
2025-11-17 14:35:00
2026亚洲100必打卡榜目的地!福州入选
日前,携程正式发布口碑榜2026年度榜单,福州入选“2026亚洲100目的地榜”“2026中国100目的地榜”两个榜单
2025-11-17 15:20:00
当“工业硬核”遇见“健康温度”:如新在一汽开放日奏响家企健康新乐章
鲁网11月17日讯11月15日的青岛,寒意初显,但一汽解放青岛汽车有限公司的即墨厂区内却暖流涌动。一场名为“扬帆家年华·领航新乐章”的2025员工家属开放日暨员工音乐节正在这里温情上演
2025-11-17 15:45:00
2025年中共中央、国务院印发的《教育强国建设规划纲要(2024-2035年)》指出要全面推进智能化,促进人工智能助力教育变革
2025-11-17 16:28:00
吉林“智造”再启航:长光卫星三颗新星成功出征!
2025年11月17日,在吉林省航天信息产业园,长光卫星技术股份有限公司隆重举行了“瑶海科创号”、“电力工程号B星”及“吉星”高分07B01星三颗卫星的出征仪式
2025-11-17 16:36:00