• 我的订阅
  • 头条热搜
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...名为Attention is all you need 的论文,其中所提出的Transformer架构,为当下大热的ChatGPT、Gemini等大模型打下基础,人工智能领域从此变天。论文的八位作者,也被称为“Transformer八子”。不过,八位作者后来也陆续离开谷歌。除Lukasz K.……更多
滴普科技董事长兼CEO赵杰辉:从数据驱动到智能驱动,大模型释放数据平台全新生产力|WISE2023商业之王大会
...度释放生产力。他认为,未来,整个企业领域的数据智能架构将基于数据的基础设施建设,加上基于大模型的AI Agent,形成一个新的数字经济体架构。演讲正文如下:大家好,非常荣幸有机会在36氪WISE平台上跟大家分享我们的行...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...I的过去、现在与未来。当地时间3月21日,提出了Transformer架构、改写AI领域发展历程的论文《注意力就是你所需要的一切(Attention Is All You Need)》的作者们现身英伟达GTC大会,在名为Transforming AI(变革AI)的圆桌会议上与黄仁勋...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...用,当前主流大模型中,诞生了以BERT为代表的Encoder-only架构、以T5为代表的Encoder-decoder架构、以GPT为代表的Decoder-only架构的大规模预训练语言模型。1.3 GPT系列模型技术发展历程回顾从技术角度来看,结合中国人民大学《大语言...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。但是别被Scaling Law局限,参数小不意味着能力弱,模型架构的重要性应该重新进入我们的视线。MobileLLM不仅在同等大小的模型中达到了SOTA性能,而且提出,架构的深度比宽度更重要。一个「深而窄」的「瘦长」小模型同样可以...……更多
...行业异构多云场景下的应用上云支撑问题,实现从传统IT架构向基于云平台的高可靠、高并发、高弹性的分布式架构转型,帮助客户快速构建稳定、可靠、高效的行业云平台。目前,该产品已通过中国信通院多云管理平台解决方...……更多
字节跳动推出对话式ai实时交互解决方案
...端大模型的实时语音通话。▲对话式AI实时交互服务方案架构字节跳动介绍称,对话式AI实时交互解决方案支持开箱即用快速搭建,只需调用标准的OpenAPI接口即可配置所需的语音识别(ASR)、大语音模型(LLM)、语音合成(TTS)...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...手的背后,又运用了什么样的技术呢?独创“专家协同”架构实际上,这种根据需求调度大模型的用法,也刚好是360推出的一项新技术——CoE(Collaboration-of-Experts),即专家协同架构。我们知道,很多国产模型在单项指标上都打...……更多
“云+AI”风起云涌:火山引擎拥抱多云战略,加速企业业务创新增长
...助力企业智能化演进。此外,据火山引擎大模型服务算法架构师孙帆介绍,2023年6月,火山引擎发布火山方舟一站式大模型服务平台,集成了多款大模型应用,能够向用户提供字节云雀大模型、第三方闭源模型及开源模型的“1+N+...……更多
浪潮海岳数据中台inDataX 7.0全新发布,打造企业数据管理智能化新引擎
...理上基于高性能MPP分析引擎,在数据采集上采用流批一体架构,支持对存量数据的批量采集及增量数据的实时采集,借助流计算能力还可实现随采随算,从采集阶段即保证了数据时效性。在数据模型上,支持事实明细、聚合汇总...……更多
大模型的未来,快手在自己身上找答案
...上来说已经远优于同类数字人产品效果。这是因为在工程架构方面,「AI 关小芳」实现了端云结合的技术架构设计,通过搭建分布式流媒体计算调度框架、自研大模型能力算子化适配和专有网络协议加速,支持用户双工和 AI 智...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...结果进行规划。目前的这个解决方案有什么收益和成本?架构图:实际开发中需要注意的点?如何搭建整体和RAG相关框架:总之,选择什么样的实现方式需要综合考虑。举个例子,初期可以使用Langchain框架或现有平台快速搭建原...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不同粗细和颜...……更多
对话腾讯汤道生:大模型和云一样,难以被垄断|36氪专访
...服务能力获得市场竞争力,而不是单纯的低价。新的技术架构,也能为客户降本,比如大数据的湖仓一体架构,就比传统做法性价比更高。最近推出的新一代云服务器,基于性价比更高的Bergamo芯片,也能给到客户更低的单位计...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
...模型,规模会变得越来越小,计算效率会越来越高,模型架构会变得更加开放和标准,这是我观察到的未来趋势。”如果说前两年的AI是在“卷”技术,那今年无疑都转向了“卷”应用。在贾扬清看来,今天是做应用最好的年代...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...igurable Dataflow Unit)为代表的动态可重构数据流(Dataflow)架构的芯片,能够通过并行处理和高效数据移动来优化性能和效率,近年越来越被认为是一个重要的发展方向。数倍于 GPU 推理性能来自 SambaNova 最新一代 RDU SN40L近日的芯...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...覆性技术路线创新,北京将设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。在数据方面,鼓励各类主体开放共享高质量训练数据,根据数...……更多
豆包大模型综合能力提升20.3%,火山引擎成立零售大模型联盟
...体系产品,都生长于同一朵云上。数据中心、软硬件基础架构的统一,避免了“算力孤岛”和“数据孤岛”问题,结合火山引擎自研服务器、自研 DPU 卡、调度算法等技术能力,火山引擎 AI 全栈云在性能、稳定性和成本上具备了...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
小模型正在成为AI界的新宠
...)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。早在2017年,谷歌发布《Attention Is All You Need》论文...……更多
百度智能云晒大模型落地成绩单:5个第一!
...成、代码审查、优化代码等能力。此次发布了企业级代码架构解释、企业级代码审查能力和企业级代码辅助能力。其中,企业级代码架构解释能让大模型快速解读代码库,梳理整个业务逻辑以及工程架构。程序员接手项目后就不...……更多
对话清华刘知远:Scaling Law已被OpenAI验证,知识密度将是未来的核心
...它。但如何高质量地做这件事?需要什么样的数据、模型架构、学习过程?他认为,还没有形成共识。“数据驱动的方向大致确定,但技术路线还远远没有被收敛,还是在高速演进。”“未来大模型面临着如何把更多的知识放到...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
猿辅导竟然是一家AI公司?大模型全家桶曝光
...那一刻带来的智能涌现。“就像没有人能在2017年Transformer架构论文发布时就笃定地认为这是未来,除了OpenAI。”杨元祖透露。直到GPT-4发布后,猿辅导敏锐意识到两代生成式大模型能力之间质的差异,转而开启自研之路。这不是...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...尺度物体,大到建筑,小到工具花草。 Hunyuan3D-1.0采用DiT架构,与混元DiT生图联合,支持原生中文,支持风格定制。其技术架构引入多视图扩散,借助二维数据优势提升3D泛化性,改进点包括:1、持续扩展数据规模、类目、质量...……更多
更多关于科技的资讯:
每日商报讯 一群小朋友在教练的带领下,灵活地穿梭在篮球场上。运球、传球、投篮……一气呵成的动作让人目不暇接。富阳银湖体育中心最近成了不少市民游玩的新地方
2025-03-12 07:43:00
全球首例 杭州企业让灯光像自然光一样流淌
杭科光电的智能灯 余杭区融媒体中心供图近日,在余杭区闲林街道的一间实验室里,工程师们反复调整着一根柔性灯丝。当电流通过时
2025-03-12 08:14:00
反超美国!上海“人造太阳”创下高温超导D形磁体最高磁场纪录
快科技3月12日消息,据报道,近日,上海核聚变能源商业公司“能量奇点”宣布,其自主研制的大孔径强场磁体“经天磁体”成功完成首轮通流实验
2025-03-12 08:19:00
全球首款安卓16旗舰!谷歌Pixel 10系列渲染图出炉
快科技3月12日消息,知名爆料人士Onleaks曝光了谷歌Pixel 10系列渲染图,该系列共有三款机型,分别是Pixel 10
2025-03-12 08:19:00
华为手机用户放心 微信绝大部分功能都会上线鸿蒙版
快科技3月12日消息,日前,微信员工“客村小蒋”微博发文,谈到了鸿蒙微信,称理解关于鸿蒙微信某些功能缺失或bug的评论
2025-03-12 08:19:00
厦门网讯(厦门日报记者 陈泥)“只要金价的1/10”“挑战1克金打造40克金手镯”……作为黄金饰品的平替,“金包银”日益受到消费者的青睐
2025-03-12 08:29:00
“富家千金”力捧的Miu Miu,一年卖近百亿
作者: 周嘉宝“穿CHANEL不等于有钱人,穿Miu Miu的才是真千金。”这句火爆全网的流行语,背后藏着中国年轻群体的社交“圈层密码”
2025-03-12 08:41:00
AI不会简单地卷走工作岗位,而是在重塑整个就业生态我们必须朝着“既要人工智能+,也要技能+”方向转型AI浪潮来袭,在兴奋于AI带来技术赋能的同时
2025-03-12 08:44:00
《哪吒2》冲刺150亿票房新纪录:距全球影史票房Top5仅一步之遥
快科技3月12日消息,今日,据灯塔专业版显示,电影《哪吒之魔童闹海》(《哪吒2》)全球票房(含预售及海外)目前已超过149
2025-03-12 08:49:00
近日,《政府工作报告》首次提及培育具身智能产业、大力发展智能机器人。此外,总部位于上海的智元机器人将于3月10日正式发布首个通用具身基座模型—智元启元大模型
2025-03-12 09:16:00
人气旺! WTT重庆冠军赛“引客来”
3月11日,重庆市巴南区华熙LIVE·鱼洞,国际顶级乒乓球赛事WTT重庆冠军赛燃情开赛。大量人流如潮水般涌入,使得周边餐饮
2025-03-12 09:18:00
OpenAI发布全新Agent:内置三大工具
快科技3月12日消息,据报道,OpenAI发布了专为构建AI Agents设计的新工具和API。OpenAI此次发布的核心产品包括Responses API和Agents SDK
2025-03-12 09:19:00
反内卷!多家公司禁用PPT
快科技3月12日消息,在“996”曾成为常态的互联网和制造行业,越来越多公司加入到“反内卷”行动中来。据媒体报道,名创优品集团叶国富要求内部沟通严禁使用PPT
2025-03-12 09:19:00
本文转自:人民网-北京频道人民网北京3月12日电 (记者李博)位于北京中轴线北延长线上的亚奥商圈将加快数字化转型升级,打造智慧商圈
2025-03-12 09:22:00
山东乐陵:数智赋能企业产销两旺
本文转自:人民网-山东频道2025年3月11日,山东省曼德汽车零部件(乐陵)公司的智能车间过道上,连入5G专网的AGV小车
2025-03-12 09:22:00