• 我的订阅
  • 头条热搜
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...00亿、1750亿模型也将在更复杂的场景中以更丰富的知识和推理能力为用户带来更专业的智能体验。周围认为,优秀的自研大模型需要具备“大而全、算法强、真安全、自进化、广开源”5大特质,具体表现为数据规模和模型参数...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...、视觉数据的准确标注、分布式训练集群的工程化,以及推理成本的管控。▲来自 inf2.xl 实例上部署的 Stable Diffusion 模型这些经验为参与者提供了关于有效管理视频数据、提高模型训练效果和性能、构建高效训练集群以及管理推...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多
微软研究院推出orca2llm
...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手, \"AI科学家\"有望加速问世。这三个报告,一方面预测了AI Agent的未来发展趋势,另一方面也同时提及了多模态大...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起云涌...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...SIQA、HellaSwag、WinoGrande等多个数据集,来评估Yi的“常识推理能力”“阅读理解能力”“数学与代码能力”等多维度能力。Yi能力。结果显示,Yi-6B在常识推理能力和阅读理解能力上达到了国内外开源模型的平均水平,但在数学与...……更多
周鸿祎:发展大模型要有AI信仰
...是人类第一次让电脑能够把人类所有的知识理解、存储、推理,对人类的语言有了完整的了解。语言为什么这么重要呢?因为我们人类和动物最大的差别,是我们用语言在描述这个世界,所以一旦机器理解了人类的语言,跟人类...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...用于自身业务优化并对外开放合作。 大模型分为训练和推理两个过程,前者将大模型训练成型,后者即为应用。由于训练大模型需极大算力,开发成本高昂,业界多有关于不需“重复造轮”的讨论。例如,入场做大模型后,百...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15...……更多
百度All in的大模型何时能赚钱?
...。有业界专家推测,百度在训练文心大模型4.0时所付出的推理成本,大约会比3.5版本高出10倍左右。 据统计,自2022年底,过去十年之中,百度已经累计投入了超1400亿元的研发资金,而在今年的大模型更新迭代中更是呈现出疯狂...……更多
库克现身上海首次谈及AI话题,苹果真急了
...的多模态模型,其具有上下文学习、图片识别和一定连续推理的能力。该模型具有三个参数规模,其中最大的拥有300亿参数。作为对比,OpenAI的GPT-4拥有1.7万亿参数规模。而几周前发布的新款Mac电脑,苹果也首次将宣传重心转移...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
...大模型需要大量的数据,底层有很多语料训练才能涌现出推理能力。金融业是对于数据安全和数据隐私保护最为重视的一个行业之一,所以开展大模型的探索,可能会存在一定的困难。目前各银行对于大模型的应用都还在探索阶...……更多
谷歌公开“社会学习”ai框架
...歌近日公开了一项名为“社会学习(SocialLearning)”的AI框架,该框架允许AI语言模型能够通过自然语言互相学习,由于不需要直接交换敏感关键信息,因此训练出的AI模型更具隐私保护性。据介绍,在这款“社会学习框架”中,...……更多
...的行业安全可信大模型,具备生成创作、多轮对话、逻辑推理等多项核心能力,通过海量通用数据与行业特有数据融合,更好的适应行业客户的业务需求,推动大模型在政企行业场景的精准落地。面向行业的安全可信行业专属大...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...某些任务,例如描述图像,但难以处理更概念性和复杂的推理。其通过60页的相关技术报告证明,Gemini是一个真正原生的多模态大模型,因为从最初的预训练数据开始,Gemini就在针对不同模态的模型进行训练,因此其功能在每个...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...水平。”OpenCompass 2.0全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实的技术支撑。评测榜单涉及的大语言模型和多模态大模型超过150个,已有包括Meta、阿里巴巴、...……更多
...百川很好地完成了千卡大模型训练任务,有效降低了模型推理成本,提升了模型部署效率。 另一方面,仍有大量企业借助现有的大模型实现生产和服务方式的变革,但大模型使用的高门槛把大部分人挡在了技术浪潮之外。不论...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...参数划分为多个组别而实现的计算的稀疏化,即每次执行推理任务时,根据对输入类型的判断,MoE模型会通过门控网络选择性地激活神经网络中最契合指令的专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...击破,而是要研究方言的底层逻辑和特点,构建统一识别框架。同时大模型的预训练可以自我学习,探索借助大模型技术提高识别准确性。倪博溢提出一种设想,由于音标是固定的,能否利用国际音标序列标注各种方言,构建语...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
恒生电子:金融大模型技术升级,国内AI芯片危机互现
...此次升级的LightGPT,面向金融机构实现LightGPT-7B的开源,推理和训练全面适配华为昇腾系列。恒生电子推出金融大模型,背后经历了怎样的转向?落地应用金融行业,金融大模型具备哪些共通性和特殊性?当前大模型所需的AI算力...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...拥有一个AI Agent。“如果说2024年是大模型落地应用之年,推理就会越来越重要。此前在训练芯片市场上,英伟达一骑绝尘,占有绝对的市场占有率,那么今天,推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多
联想王传东:AI PC重塑产业生态 新应用崛起
...来的公共大模型,提供的都是不涉及个人隐私数据的基础推理服务,无法得知用户偏好,在隐私和安全方面也存在弊端。王传东表示:“出于数据安全和隐私保护的考虑,以及更高效率、更低成本响应用户需求的考虑,人们既希...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
更多关于科技的资讯:
酷冷至尊推出M.2 SSD散热器Kaze:双均热板超薄设计
快科技10月13日消息,酷冷至尊(CoolerMaster)震撼发布全新M.2 SSD散热器——“Kaze”,专为追求极致被动散热效能的用户量身打造
2024-10-13 18:45:00
Intel Xe3第三代显卡开始行动!酷睿Ultra 300首发
很多人怀疑Intel Xe显卡还做不做,是不是会放弃,但至少到第三代是不会丢掉的,相关的部署工作已经悄然展开了。Intel日前发布的代号Lunar Lake的酷睿Ultra 20
2024-10-13 19:45:00
撒哈拉沙漠暴雨引发洪水 当地人:已有三五十年未见
快科技10月13日消息,据媒体报道,撒哈拉沙漠的部分区域遭遇了一场数十年难遇的降雨盛况,降雨量之大实属罕见,以至于在某些地段
2024-10-13 20:15:00
史上第一款!华擎Z890太极OCF主板默认支持DDR5 10GHz+
快科技10月13日消息,Intel Arrow Lake酷睿200S系列将内存频率支持从DDR5-4800提高到DDR5-6400
2024-10-13 20:45:00
“公交医生”自制防冻液加注器
每到秋季,公交行业就开始进入冬运准备“模式”,给公交车加注防冻液是其中必不可少的一项工作。以往,驾驶员或维修工用瓶子一点点往水箱里加
2024-10-13 20:59:00
“老人味”可能是大病前兆!这4种气味 一定小心
生活中,我们走进中老年人的房间或靠近中老年人交谈时,有时可能闻到一股奇怪的味道。蜡烛、乳酪、旧书、油……人们对这种特殊体味的描述多种多样
2024-10-13 21:15:00
东台农商银行举办员工业务技能比赛
江南时报讯 为进一步激发员工学习业务、钻研技能的热情,持之以恒提升金融服务效能和规范化服务水平,近日,东台农商银行举办了2024年员工业务技能比赛决赛
2024-10-13 21:20:00
决战四季度 夺取全年胜丨让传统制造更“聪明” 浙江加速推进工业企业数字化改造
中国蓝新闻 作为制造业和数字经济大省,今年以来浙江设定“年底前实现规上工业企业数字化改造全覆盖”的目标,通过企业数字化转型
2024-10-13 22:33:00
钱江观潮丨追梦人
中国蓝新闻 地面,领航者二号从容行走,举重若轻;天空,朱雀三号吟啸腾飞,剑指苍穹。新质生产力奔涌的背后,一群“追梦人”在浙江大地上奋力奔跑
2024-10-13 22:33:00
首次“筷子”夹大火箭!SpaceX星舰一级回收成功:全程完美
北京时间10月13日20点25分,SpaceX星舰在美国得州的星港发射场点火成功。这是星舰的第五次试飞,超级重型一级助推器B12回收成功
2024-10-13 22:45:00
美国男子沉溺“人造羊”:非法克隆巨型羊 有特殊目的
因为对羊做了“不可思议”的事,美国蒙大拿州男子前段时间被抓判刑。如果仅仅是从科学角度来看待这个案件,那么律师将男子的所有努力
2024-10-13 22:45:00
本田passport现身rebellerally越野拉力赛
10月12日消息,汽车媒体carscoops今天(10月12日)发布博文,报道称2026款本田Passport现身RebelleRally女子越野拉力赛
2024-10-13 19:58:00
小鹏P7+电驱细节图首次公开!最大能力放开达270kw
快科技10月13日消息,小鹏汽车动态体验产品总监近日公开了小鹏P7+的电驱爆炸图,并透露了一些关键信息。他指出,在工信部公告的两款车型(180kw
2024-10-13 16:45:00
为电动汽车增添乐趣!本田有望推出电车专用模拟变速箱
快科技10月13日消息,据媒体报道,本田正在研发一项新技术,旨在为电动车带来类似手动挡的驾驶体验。该公司的工程师透露,本田正在开发一款模拟手动变速装置
2024-10-13 16:45:00