• 我的订阅
  • 头条热搜
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知...……更多
“推进数字财政建设 提升政府治理能力”研讨会在贵州财大举行
...载从而实现了数字知行合一,以此构建了包括数据网体系架构模型、数据链式应用模型、可执行数字合约模型以及商业数据链智能模型等在内的第三代互联网技术生态体系,为数字时代政府治理效能的提升提供了工程化可落地技...……更多
GPT又有新应用?AI HR来了
...效率,大幅度的降低成本,他们(人类HR)可以进行组织架构,培训,企业文化等工作。”梦飞也承认,IRIS这类企业级类GPT应用仍存在进步与发展的空间,比如更加精简、精确。“理论上,当员工问‘我的工资是多少’?IRIS应...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新标准的创新旗舰体验发布...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...接映射到音频作为一级模态的技术方法,涉及 Token 化和架构等方面的研究,总体来说是一个数据和系统优化问题。在这方面,智谱也已经有了一定的技术积累。智谱清言情感语音通话功能背后的 GLM-4-Voice,同样是一个端到端的...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...方程或微积分求解。 智谱AI于2020年底开始研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B,2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B。2023年推出基于千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...术研究所、中国科学院大学的研究者提出了一种新型模型架构 ——LLaMA-Omni,它可以实现与 LLM 的低延迟、高质量交互。 论文:https://arxiv.org/pdf/2409.06666 代码:https://github.com/ictnlp/LLaMA-Omni 模型……更多
XAI大模型Grok-1已正式开源 但并不是在马斯克说的上周
...语言模型Grok-1已正式开源,发布了基本模型的权重和网络架构,有兴趣的用户可通过github.com/xai-org/grok上的指引使用。从xAI在官网公布的消息来看,Grok-1是拥有3140亿参数的混合专家模型。在目前已开源的大语言模型中,Grok-1的参...……更多
百度All in的大模型何时能赚钱?
...变化的过程中,也从过去“芯片—操作系统—应用”三层架构,重建成为了“芯片-框架-模型-应用”四层架构,在每一层之间的严格要求下,完成端到端的额优化,为深度学习与大模型的发展打下了坚实的基础,成为大模型能力...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...素级追踪能力,而不仅仅是语义理解。它采用了Transformer架构,编码了视频中点的跟踪信息,迭代更新点的位置。此外,CoTracker还采用了窗口机制,将时间轴划分为滑动窗口,以对更长的视频进行像素级跟踪。这一独特的方法使...……更多
AI大模型,进入攻防阶段
...如今的AI模型训练已经不再是简单地比拼数据规模和算法架构,纠错及抗干扰能力也成为一个重要指标。随着AI大模型的应用越发广泛且用户群体日益壮大,如何保证AI在回答问题时不出错已经成为关键,考虑到如今草木皆兵,神...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...以及剑桥大学的研究者联合提出了一种全新的非对称 LoRA 架构 —— HydraLoRA。与传统 LoRA 需要对所有任务使用相同的参数结构不同,HydraLoRA 引入了共享的 A 矩阵和多个独立的 B 矩阵,分别处理不同的任务,从而避免任务间的干扰...……更多
最前线|IBM携「Watsonx」加入LLM开源大军
...该平台包括新一代AI平台「watsonx.ai」、基于开放式Lakehouse架构搭建的数据仓库「watsonx data」,以及AI治理工具包「watsonx.governance」三个产品集,旨在为AI模型构建者提供开放的综合性服务。其中,watsonx.ai 和watsonx data将……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...RISC-V大芯片创企希姆计算就联合国鑫发布了基于开源指令架构RISC-V打造的大模型系列一体机。其中包括2U4卡、4U8卡机,支持部署6B、7B、13B参数规模的大模型,这也是专门针对私有化部署提供的系统级解决方案。 在私有的处理器...……更多
AI与人争资源怎么破解
...忧。英伟达首席执行官黄仁勋6月2日宣布,新一代AI芯片架构在性能提升30倍的同时,能耗只有上一代产品的1/25。美国波士顿大学工程教授科斯昆认为,在AI巨头完成大模型的测试后,AI能耗问题可能就没有那么突出了。届时将确...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...特征。此外,Gemma Scope使用了最新的、最先进的JumpReLU SAE架构进行了训练。原始的稀疏自编码器架构,在检测特征存在与估计强度这两个目标之间,往往难以平衡。而JumpReLU架构,就能更容易地实现二者的平衡,并且显著减少误...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...标量(scalar)、向量(vector)和张量(tensor)等AI加速器架构,支持INT4、INT8、INT16和FP16精度,能够利用大型语言模型(LLMs)和大型动作模型(LAMs),以支持全球最大的生成AI生态系统。更多AI方面的细节,可以参考IT之家此前文...……更多
打造全新智算架构,神州鲲泰亮相深圳人工智能生态大会
...区。神州鲲泰全新智算产品亮相活动,并带来“全新智算架构”,以应对多云异构时代的智能算力挑战,神州鲲泰带来的智算产品和创新架构将为人工智能智算中心的打造提供强大助力。 尽精微,神州鲲泰“全新智算架构”...……更多
2024中国AI大模型产业发展报告发布 展望五大产业趋势
...大模型产业发展受到算力层面的一些制约。 主流大模型架构仍存在诸多局限。首先,Transformer架构消耗的算力资源普遍较大;其次,基于Transformer架构的大模型对存储设备的要求也更高。高质量的训练数据集仍需扩展。国内的AI...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...享中指出,在机器学习领域,长期以来存在着两种主要的架构理念之争:Model-Centric(以模型为中心)与 Data-Centric(以数据为中心),这两种路径的核心目的都是为了提升模型的性能与效果。当我们把这个目标再提升一个维度,...……更多
最早研究GPT的中国创业者,现在怎么样了?
...觉得自己是哪类人才?周明:我可能更像一个 architect,架构师。我有清晰的想法,能把不同人、资源架构起来,知道可以往哪走。但是让我写特别牛的算法,我写不出来。澜舟的应用做得非常强了,模型、算法还算国内一流水...……更多
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
...·软件工厂发布现场开发一款软件,需要需求分析,系统架构设计,微服务开发、系统测试和运维保障系统等大量环节。尤其对于中小型企业和初创公司来说,这些问题尤为显著。但传统的开发模式,尽管各有优点,但仍面临诸...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...的Scaling Law数据、图文音视频多模态的基础模型以及Sora的架构。▲ Sora 架构 然而,骆继祥指出,尽管AI视频技术取得了长足的进步,当前仍处于完全生成与模拟之间的阶段,“无中生有为生成,适应规则为模拟”。文字与物体...……更多
欧爱申请多枚gpt-6、gpt-7商标
...能聊天机器人模型。ChatGPT4.0基于自注意力机制的Transformer架构。这是一种基于深度学习的模型,通过大量的数据训练,它能够抓取文本中的复杂模式,并生成新的、连贯的文本。其运行原理是根据前文预测下一个词,以此迭代生...……更多
“未来可持续投资”产融对话:人工智能发展趋势
...火》为主题的演讲,从通用板块技术情况,科大讯飞的大模型在技术方面的进展情况,以及中美在大模型方面的竞争情况三方面进行介绍。 “我们确实在技术发展上稍晚于美国的大模型,但整体来看,大模型的竞争主要在中美...……更多
...初其推出的GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。截至目前,智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪...……更多
星环科技与英特尔携手举办“AI PC激发知识的力量”研讨会,共探智能PC新未来
...,未来,由于隐私和成本两大考量,云、边端融合的计算架构成为必然,端侧 AI 部署通过将用户敏感信息留在本地,将有效减少隐私泄露、数据安全、时延等问题。 英特尔中国客户端产品营销部总经理傅彬指出,英特尔致...……更多
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
...抽象。我们之前讲到Model as a service,它既代表了基础设施架构上的升级,也代表了围绕着模型一系列的范式转移。今天开发的模式更多是以模型为中心,所有人围绕着模型重新设计自己的开发系统,甚至今天设计自己的业务系统...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
Find X7 Ultra翻开手机AI新篇章
...平台”。 据了解,安第斯大模型以“端云协同”为基础架构设计思路,推出从十亿至千亿以上多种不同参数规模的模型规格,能够基于“端云分工、端云互补、端云协作”等方式,灵活支撑多元化的应用场景。显而易见,OPPO推...……更多
更多关于科技的资讯:
华为Mate 70一小时预订量已破百万:门店出现排队长龙
快科技11月18日消息,今天12:08,华为Mate 70系列正式开启预订。根据华为商城界面显示,华为Mate 70系列一小时预订量已破百万
2024-11-18 14:22:00
极速454km/h!亿万豪车布加迪W16 Mistral创下敞篷车极速世界纪录
快科技11月18日消息,布加迪W16 Mistral以454公里/小时的速度刷新了敞篷车极速世界纪录,成为全球最快的敞篷车
2024-11-18 14:22:00
本文转自:人民网-河北频道走进河北大名永创通达机械设备有限公司车间,智能机械臂灵活挥舞着,精准地抓取、放置物品,生产线上一片忙碌景象
2024-11-18 14:24:00
新疆以旧换新补贴活动上线 来京东购电脑至高立减2000元
近日,新疆以旧换新补贴活动上线,政府对家电、电脑八大品类发放补贴,电脑品类包括笔记本、台式机、游戏本等符合一级、二级能效的产品
2024-11-18 14:25:00
本文转自:人民网-北京频道人民网北京11月18日电 (记者李博)北京市经济和信息化局、市科委、中关村管委会、市卫健委、市医保局
2024-11-18 14:34:00
联想发布全新液冷品牌“联想问天海神”
本文转自:人民网在11月15日召开的第六届中国超级算力大会上,联想集团发布“联想问天海神”液冷品牌。该品牌聚焦国内市场
2024-11-18 14:35:00
甄选美食·品味全球丨FHC金苹果奖见证“山楂树下”品牌力量
**FHC上海环球食品展于上海新国际博览中心盛大开幕**2024年11月12日,第27届FHC上海环球食品展于上海新国际博览中心盛大开幕
2024-11-18 14:39:00
作者:郑琦在数字化浪潮的席卷下,“双11”已不仅仅是一个简单的购物节,它成为了中国电商经济与物流体系高效协同的年度大考
2024-11-18 14:39:00
江苏省苏北首家绿电绿证市级平台成立
11月6日上午,宿迁绿电绿证市级平台揭牌仪式在国网宿迁供电公司营业厅举行,苏北首家绿电绿证市级平台正式成立。宿迁绿电绿证市级平台包含绿电绿证服务中心和绿电绿证服务站
2024-11-18 14:45:00
顶流预定!华为余承东开通微信视频号
快科技11月18日消息,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东今日正式入驻微信视频号平台。余承东视频号的首秀尤为引人注目
2024-11-18 14:53:00
全新《柯南》动画上线:侦探与怪盗抢王者水晶
快科技11月18日消息,《王者荣耀》与经典侦探动画《名侦探柯南》的跨界联动——“消失的峡谷水晶”已经登场,这一合作项目无疑点燃了广大粉丝的热情
2024-11-18 14:53:00
没信号也不怕 小米SU7自动泊车等智驾在地库都能用
快科技11月18日消息,有车主好奇,小米SU7的智能驾驶功能在没有信号的地下车库是否还能正常使用,尤其是自动泊车功能。对此
2024-11-18 14:53:00
特斯拉辟谣FSD入华授权上汽:仍在评估当中
快科技11月18日消息,特斯拉中国近日否认了有关与上汽就FSD(全自动驾驶)技术授权进行讨论的传闻,明确表示这些消息不实
2024-11-18 14:53:00
本文转自:人民网人民网讯 据阿联酋通讯社11月18日报道,第七届信号处理与信息安全国际会议日前在迪拜大学举办,会议旨在提升学生
2024-11-18 14:54:00
上新“学术搜索” 夸克成为年轻人PC端首选AI应用
近日,夸克发布“学术搜索”AI产品,依托AI技术和亿级学术文献,将大大提高学术工作中信息获取、创作和处理的效率。PConline最新数据显示
2024-11-18 14:54:00