• 我的订阅
  • 头条热搜
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...名为Attention is all you need 的论文,其中所提出的Transformer架构,为当下大热的ChatGPT、Gemini等大模型打下基础,人工智能领域从此变天。论文的八位作者,也被称为“Transformer八子”。不过,八位作者后来也陆续离开谷歌。除Lukasz K.……更多
滴普科技董事长兼CEO赵杰辉:从数据驱动到智能驱动,大模型释放数据平台全新生产力|WISE2023商业之王大会
...度释放生产力。他认为,未来,整个企业领域的数据智能架构将基于数据的基础设施建设,加上基于大模型的AI Agent,形成一个新的数字经济体架构。演讲正文如下:大家好,非常荣幸有机会在36氪WISE平台上跟大家分享我们的行...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...I的过去、现在与未来。当地时间3月21日,提出了Transformer架构、改写AI领域发展历程的论文《注意力就是你所需要的一切(Attention Is All You Need)》的作者们现身英伟达GTC大会,在名为Transforming AI(变革AI)的圆桌会议上与黄仁勋...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...用,当前主流大模型中,诞生了以BERT为代表的Encoder-only架构、以T5为代表的Encoder-decoder架构、以GPT为代表的Decoder-only架构的大规模预训练语言模型。1.3 GPT系列模型技术发展历程回顾从技术角度来看,结合中国人民大学《大语言...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。但是别被Scaling Law局限,参数小不意味着能力弱,模型架构的重要性应该重新进入我们的视线。MobileLLM不仅在同等大小的模型中达到了SOTA性能,而且提出,架构的深度比宽度更重要。一个「深而窄」的「瘦长」小模型同样可以...……更多
...行业异构多云场景下的应用上云支撑问题,实现从传统IT架构向基于云平台的高可靠、高并发、高弹性的分布式架构转型,帮助客户快速构建稳定、可靠、高效的行业云平台。目前,该产品已通过中国信通院多云管理平台解决方...……更多
字节跳动推出对话式ai实时交互解决方案
...端大模型的实时语音通话。▲对话式AI实时交互服务方案架构字节跳动介绍称,对话式AI实时交互解决方案支持开箱即用快速搭建,只需调用标准的OpenAPI接口即可配置所需的语音识别(ASR)、大语音模型(LLM)、语音合成(TTS)...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...手的背后,又运用了什么样的技术呢?独创“专家协同”架构实际上,这种根据需求调度大模型的用法,也刚好是360推出的一项新技术——CoE(Collaboration-of-Experts),即专家协同架构。我们知道,很多国产模型在单项指标上都打...……更多
详解京东产业版GPT:千亿级大模型拟今年发布,已明确有垂直客户需求
...现人类意图来自于机器学习、神经网络以及谷歌Transformer架构模型的多种技术模型积累,他称ChatGPT 升级了 AI 创新范式。在何晓冬看来,现在的ChatGPT模型提升显著,如更大的语料库、更高的计算资源、更加通用的预训练、更高的...……更多
“云+AI”风起云涌:火山引擎拥抱多云战略,加速企业业务创新增长
...助力企业智能化演进。此外,据火山引擎大模型服务算法架构师孙帆介绍,2023年6月,火山引擎发布火山方舟一站式大模型服务平台,集成了多款大模型应用,能够向用户提供字节云雀大模型、第三方闭源模型及开源模型的“1+N+...……更多
浪潮海岳数据中台inDataX 7.0全新发布,打造企业数据管理智能化新引擎
...理上基于高性能MPP分析引擎,在数据采集上采用流批一体架构,支持对存量数据的批量采集及增量数据的实时采集,借助流计算能力还可实现随采随算,从采集阶段即保证了数据时效性。在数据模型上,支持事实明细、聚合汇总...……更多
大模型的未来,快手在自己身上找答案
...上来说已经远优于同类数字人产品效果。这是因为在工程架构方面,「AI 关小芳」实现了端云结合的技术架构设计,通过搭建分布式流媒体计算调度框架、自研大模型能力算子化适配和专有网络协议加速,支持用户双工和 AI 智...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...结果进行规划。目前的这个解决方案有什么收益和成本?架构图:实际开发中需要注意的点?如何搭建整体和RAG相关框架:总之,选择什么样的实现方式需要综合考虑。举个例子,初期可以使用Langchain框架或现有平台快速搭建原...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不同粗细和颜...……更多
对话腾讯汤道生:大模型和云一样,难以被垄断|36氪专访
...服务能力获得市场竞争力,而不是单纯的低价。新的技术架构,也能为客户降本,比如大数据的湖仓一体架构,就比传统做法性价比更高。最近推出的新一代云服务器,基于性价比更高的Bergamo芯片,也能给到客户更低的单位计...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
对话火山引擎总裁谭待:从同质化的云服务中突围 | 数字思考者50人
...日渐成熟,多云也正成为云计算新的趋势,企业客户在IT架构上选择多云策略,避免供应商锁定或确保业务连续性。“大概几年前来自第三方的调研数据显示,平均每家企业会使用三朵云。去年,我们也针对4000多家在云上消耗超...……更多
对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
...模型,规模会变得越来越小,计算效率会越来越高,模型架构会变得更加开放和标准,这是我观察到的未来趋势。”如果说前两年的AI是在“卷”技术,那今年无疑都转向了“卷”应用。在贾扬清看来,今天是做应用最好的年代...……更多
对话百图生科首席AI科学家宋乐博士:“xTrimo”生命科学AI大模型,不应止于加速药物研发
...细胞表征预训练模型,并结合AutoML加速寻找最优应用模型架构,适配多个生物计算任务。在此基础上,“xTrimo”体系能够表征单体蛋白质、蛋白质相互作用、免疫细胞、免疫系统等多层次生物问题,理解生物数据之间关联性。截...……更多
重复造轮子的百模大战:两极热 中间空
...AI大模型的产业链比较成熟,形成了数量众多的AI Infra(架构)公司,但这一块市场在国内还相对空白。而在 国内 ,巨头们 都有一套自己 的 训练架构。比如 , 华为的模型采用的是三层架构,其底层属于通识性大模型,具备超...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...igurable Dataflow Unit)为代表的动态可重构数据流(Dataflow)架构的芯片,能够通过并行处理和高效数据移动来优化性能和效率,近年越来越被认为是一个重要的发展方向。数倍于 GPU 推理性能来自 SambaNova 最新一代 RDU SN40L近日的芯...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...覆性技术路线创新,北京将设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。在数据方面,鼓励各类主体开放共享高质量训练数据,根据数...……更多
豆包大模型综合能力提升20.3%,火山引擎成立零售大模型联盟
...体系产品,都生长于同一朵云上。数据中心、软硬件基础架构的统一,避免了“算力孤岛”和“数据孤岛”问题,结合火山引擎自研服务器、自研 DPU 卡、调度算法等技术能力,火山引擎 AI 全栈云在性能、稳定性和成本上具备了...……更多
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...表示,虽然技术类似,但如果采用不同的神经网络算法,架构方式和复杂程度都会有很大差别,往往会导致不同的训练效果,这也很考验厂商的工程化能力。另外三个则是百度基于自身积累而提出的用于改善模型效果的技术,包...……更多
小模型正在成为AI界的新宠
...)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。早在2017年,谷歌发布《Attention Is All You Need》论文...……更多
更多关于科技的资讯:
DXOMARK研讨会:以本地化测试与洞察,与中国用户打造手机影像未来
以本地化测试与洞察,与中国用户共同打造手机影像未来——DXOMARK 成功举办2024中国区线下研讨会2024年12月2日自2024年11月底至12月初
2024-12-04 09:47:00
11月安卓手机性能排行榜:ROG 9 Pro登顶
近日,知名手机性能评测软件安兔兔发布了11月安卓手机性能排行榜。随着联发科和高通相继推出其最新旗舰处理器,国内各大Android厂商也迅速响应
2024-12-04 09:47:00
华擎B580显卡评测样品曝光:2.5 槽厚、2.8GHz、375W 功耗
IT之家 12 月 3 日消息,消息源 FunkyIT 于 11 月 30 日发布视频,分享了华擎(ASRock)锐炫(Arc)B580 Steel Legend 12 GB “Battlemage”显卡
2024-12-04 09:47:00
火狐 Firefox 测试新特性:希望用户将其设置为默认浏览器
IT之家 12 月 3 日消息,科技媒体 bleepingcomputer 昨日(12 月 2 日)发布博文,报道称 Mozilla 公司正尝试新的方法
2024-12-04 09:47:00
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
智东西12月3日消息,当前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型
2024-12-04 09:48:00
新型催化剂将水解制氢效率提高200倍
德国马克斯·普朗克研究所科学家研制出一种独特的拓扑手性晶体,并将其用作水解制氢过程中的催化剂。通过操控该晶体内电子自旋
2024-12-04 09:48:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源
2024-12-04 09:48:00
破茧成蝶,理想晶延高端装备护航中国光伏从“跟跑”到“领跑”
经过几十年发展,我国光伏产业从无到有,已形成技术研发活跃、产业链完整齐备、端到端自主可控且具有国际竞争优势的战略性新兴产业
2024-12-04 09:48:00
李飞飞空间智能上新!一张图就可以生成3D世界,能像玩游戏一样互动
智东西12月3日消息,今日凌晨,由“AI教母”李飞飞联合创立并担任CEO的AI初创公司World Labs对外公布了他们的首个成果
2024-12-04 09:49:00
MIT首次证明运动能促进神经元生长,网友:催我运动的理由+1
催我运动的理由又多了一个!MIT研究团队首次证明:运动可以促进神经元生长,从而让大脑更灵活更聪明。而且促进的方式不止一种
2024-12-04 09:49:00
关于LLM-as-a-judge范式,终于有综述讲明白了
摘要:评估和评价长期以来一直是人工智能 (AI) 和自然语言处理 (NLP) 中的关键挑战。然而,传统方法,无论是基于匹配还是基于词嵌入
2024-12-04 09:49:00
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍
2024-12-04 09:49:00
ChatGPT 迎来“可怕的两岁”:从革命到日常,AI如何塑造未来?
“ChatGPT 成长之路,AI 未来之启。”ChatGPT 诞生的两年间,犹如一颗璀璨的新星,在科技的天空中迅速崛起
2024-12-04 09:49:00
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
Anthropic发展迅速,需要算力;亚马逊重兵布局自研算力芯片,需要紧密绑定的使用者美国西部时间12月2日晚,AI(人工智能)创业公司Anthropic的联合创始人兼首席计算官
2024-12-04 09:49:00
百度如何领跑中国AI赛道,跻身全球AI原生巨头行列?
近期,沙利文机构发布的《2024年全球AI生态全景概览》揭晓了答案,百度与OpenAI、谷歌一同被冠以“AI原生巨头”的殊荣
2024-12-04 09:49:00