• 我的订阅
  • 头条热搜
...闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...彦宏在Create2024百度AI开发者大会上,正式宣布发布文心大模型4.0的工具版。李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
...印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上,给出了两种具体的结合方法,分别在水印检测效...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
AI一天,人间一年。现在不论是大模型本身,亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般,虽然AIGC目前还处于起步阶段,但市场规模...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为模型定制增强专家,实现行业最...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。随着模型规模急剧扩张,参数已经飙升到了千亿甚至万亿级,业界开启了千模大战,AI 算力需求不可避免迎来爆炸式增长...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
谷歌发布gemma2大语言模型,共有两种大小
...布新闻稿,面向全球研究人员和开发人员发布Gemma2大语言模型,共有90亿参数(9B)和270亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
引言:MaaS(ModelasaService,模型即服务)是一种将人工智能算法模型及其相关能力封装成服务,以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度,并提升人工智能技术的综合应用效能的模式。 上新了...……更多
大模型价格战“卷”向何方?|深度
...你降价,我免费。在经过一年多的“百模大战”后,AI大模型从5月初几乎毫无预兆地掀起了“降价潮”,阿里、百度、腾讯等纷纷加入战团。大厂“钱多、卡多、算力足”无惧价格战,以惯有的免费模式先聚集用户与开发者。中...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
文 | 苏建勋Transformer是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构,凭借强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,成为自然语言处理领域的主流模型架构。如今,一家创业...……更多
大模型降价背后,国产大模型的竞争逻辑变了
配图来自Canva可画随着人工智能技术的快速发展,大模型以其强大的数字处理能力和深度学习能力,不断与各领域交叉融合,逐步成为产业创新的关键抓手,和驱动新质生产力的关键引擎。据国家最新公布的数据显示,截至今年...……更多
36氪首发|打造分布式AI开发和部署平台,「潞晨科技」完成数亿元A轮融资
...。众所周知,如今生成式AI的“涌现”能力来自于底层大模型的成熟,但训练大模型需要的算力、网络、数据成本非寻常公司能承受。而本文主角潞晨科技,希望为这一难题提供解法。潞晨科技成立于2021年,主要业务是通过打造...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
“今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”在2024世界人工智能大会(WAIC 2024)期间,百度创始人、董事长兼首席执行官李彦宏,与第一财经传媒集团总编辑杨宇东和《硅谷101》创...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
...伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-……更多
...惠》主题演讲。演讲中,他系统阐述了联想对人工智能大模型技术浪潮的洞察与业务布局,首次完整定义了未来AI PC(人工智能电脑)所具备的五大特质。两大行业趋势推动AI PC应运而生杨元庆提到,丰富多样的公共大模型为人...……更多
李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型间差距会变大
9月11日消息,AI大模型经历了波澜壮阔大发展的2023年。2024年以来,全球基础大模型的更新速度均出现放慢,相伴随的,行业中各种质疑声音也开始涌现。“大模型之间的能力已经没有壁垒”、“还应该继续投入基础模型的研究...……更多
对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
...了许多,关注点更偏向于应用。大多数企业会选择在现有模型基础上加速功能迭代和研发。几乎没人还在比谁的模型更大、参数更多。”他补充道,“同等质量的模型,规模会变得越来越小,计算效率会越来越高,模型架构会变...……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...验布机专场推介会上发布了由TeleAI自研,基于星辰视觉大模型的AI验布机产品,预计年检测布匹3亿米。 赋能传统行业技术焕新 针对当前纺织行业织布和验布分开进行,无法在针织纬编机上直接进行验布,而是依赖人工质检,导...……更多
火山引擎ai大模型赋能千行百业成趋势
...正式在北京国贸大酒店举办,在大会上,字节跳动豆包大模型正式发布。火山引擎总裁谭待在会上介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿To...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
京东云曹鹏:AI变革之下,大模型技术如何为企业未来赋能?
文|罗曾过去一年,大模型技术在全球范围内持续狂热,中国信通院统计,全球已有超过1000个基础模型,其中中国大模型的数量占35%。尽管基础模型在不断进步,但大模型在C端尚未形成超级应用,反而在企业端的应用,已经逐...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...奖。评选委员会点评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...tificial Intelligence)进入人们视野。在这一概念下,借助大模型,机器人感知、决策与交互提升,具备更强的自主学习能力和环境适应性。机器人赋予大模型现实的物理载体,让曾经的虚拟智能走进现实世界。技术和现实的交织足...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异构混训,共五个方面的解决方案...……更多
更多关于科技的资讯:
蟹状元荣获“大国好货·2024年度品牌企业”
怀大国匠心,造品质好货。2024年11月28日,第31届中国国际广告节大国好货嘉年华在福建厦门国际会议展览中心B1馆盛大启幕
2024-12-01 12:23:00
大量编造百度前副总裁璩静虚假信息!网友登报公开道歉
快科技12月1日消息,在11月29日,有人公开在报纸上刊登致歉声明,称其以曾经是璩静下属的身份,通过社交媒体等渠道编造并传播了大量虚假信息
2024-12-01 12:35:00
连续3个月交付破万!岚图汽车11月交付10856台
快科技12月1日消息,岚图汽车11月交付量达到10856台,连续三个月销量破万,同比增长55%。岚图汽车官方近期宣布了两项吸引人的购车优惠政策
2024-12-01 12:35:00
西藏阿里地区首套电网侧带超容构网型SVG建成投运
本文转自:人民网-西藏频道阿里地区首套电网侧带超容构网型SVG工程全景。赵清鹏摄人民网阿里12月1日电 11月29日23时43分
2024-12-01 12:41:00
一加13r现身geek,将于12月份正式发布
一加13R现身Geekbench跑分网站,该机型号是CPH2645,对应的国行版机型是一加Ace5。据悉,一加Ace5搭载高通骁龙8Gen3处理器
2024-12-01 14:00:00
岚图汽车今日公布了梦想家系列12月购车政策,下定最高可享受价值6.2万元购车权益,包括现金抵扣、置换补贴、金融权益等,购车政策有效期为2024年12月1日至2024年12月31日
2024-12-01 14:02:00
活久见!首个被人类骗钱的AI诞生
快科技12月1日讯,据媒体综合报道,近期,一个名为Freysa的神秘AI智能体横空出世,迅速吸引了公众的广泛关注。这款AI智能体的独特之处在于
2024-12-01 14:05:00
微软Win11任务栏将迎新功能:采用WebView2、可快速查找文件
快科技12月1日消息,据媒体报道,微软正在为Windows 11系统开发一款名为File Search Companion的新应用
2024-12-01 14:05:00
北京汽车11月销量26048台!连续三个月批发、终端销量均破2万大关
北京汽车在11月的销量表现十分亮眼,共售出新车26048台,同比增长率高达67%。这一成绩标志着北京汽车连续三个月的批发销量和终端销量均突破了2万台大关
2024-12-01 14:05:00
iphone16:亲民定价,拓宽受众
在竞争激烈的手机市场中,旗舰机型始终占据着举足轻重的地位。它们不仅代表着品牌的技术实力与创新精神,更是消费者追求极致体验的首选
2024-12-01 14:12:00
iqooneo10pro与iqooneo10pro哪个更值得
不得不说最近新手机太多了,在红米K80系列刚刚发布之后,iQOONeo10系列也来了。其实中间还夹了vivoS20系列新品
2024-12-01 14:14:00
本文转自:人民网人民网北京12月1日电 (焦磊)近日,由中国移动通信集团有限公司指导,中移互联网有限公司和云能力中心共同承办的中国移动算力网络应用创新论坛在北京举行
2024-12-01 14:14:00
再创历史新高!极氪11月交付27011台 同比翻倍
快科技12月1日消息,极氪汽车今日公布了11月的销量情况,极氪11月交付27,011台,同比增长106%,环比增长8%
2024-12-01 14:35:00
Meta计划建设海底光缆:长度将超4万公里贯穿全球
快科技12月1日消息,据报道,Meta正计划建立一条属于自己的海底光缆,从互联网基础设施上保证可靠性。据悉,Meta规划的这条海底光缆将横跨全球
2024-12-01 14:35:00
扎克伯格筹建海底通信网络 计划“绕地球一圈”
周五的最新消息显示,作为全球互联网流量的超级使用大户,美国科技巨头Meta正在规划建设一条横跨全球的海底通讯电缆,而且是上市公司独享的传输渠道
2024-12-01 15:05:00