• 我的订阅
  • 头条热搜
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...成为一名称职的LLM研究者和从业人员,利用归纳偏差进行推理的能力都是必不可少的。而了解不同模型架构之间基本的细微差别有助于未来的不断创新。Yi Tay分享了他的主要收获:encoder-decoder和decoder-only模型都是自回归模型,但...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作者有30人,一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出特别的技...……更多
理想的智能驾驶,到底「City 不 City」?
...人过去的经验和习惯所形成的直觉;系统 2 则代表了思维推理能力,人们需要借助思考和推理来处理复杂的问题和应对未知的场景。端到端模型主要用于处理常规的驾驶行为,从传感器的感知数据输入到行驶轨迹的决策输出只经...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
5年后ai所需算力超100万倍
...提出的卷积神经网络(CNN);YoshuaBengio在深度学习的因果推理领域的贡献;GeoffreyHinton,人工智能的先驱之一,在2006年提出了深度置信网络(DeepBriefNetwork)模型和反向传播优化算法。J̈urgenSchmidhuber提出了广为使用的循环神经网...……更多
大模型的未来,快手在自己身上找答案
...通话、英语及多种方言,还以其卓越的性能表现和极低的推理时延脱颖而出,广泛应用于快手的多种场景。理解了外部世界之后,受到考验的就是「AI 关小芳」的表达能力。「AI 关小芳」已经不是木讷的问答机器。它在对话能力...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...ckwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款服务...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...著提升了用户的体验和接触AI技术的机会。结合阿里云在推理输入方面的优化,这些降价和优惠策略大大减轻了企业在AI应用中的成本压力,使得高性能AI模型的普及成为可能。通过云计算的支持,Token技术不再局限于实验室或小...……更多
国内规模高达200亿,AI 新浪潮真的是“具身智能”吗?|钛媒体AGI
...一的AI,也就是在‘知’的层面上,智能体要具有感知、推理、决策的能力。在‘行’的层面,智能体可以通过身体的动作和表情,与环境以及其他智能体进行交互。这是一种既要有大脑,还要有躯体的智能体。”上海人形机器...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,「天工...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经网络处理。行业内认为,这是一种可以将音频...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...型、有效预测未来行为、以及在复杂交互场景中进行灵活推理等方面仍然面临挑战。图丨谷歌 PaLM-E[2](来源:arXiv) 由功能型到智能型的转变总的来说,由于技术水平的限制,关于具身智能的构想并未得到充分发展。直到近来...……更多
骁龙xelite和npu对未来windows的影响
...NPU的设备上,核心问题是如何编写充分调用本地计算和云推理的应用程序,而这也是我们计划通过WindowsAI生态系统实现的目标。所以我认为我们实际上将会有很多具有本地模型、混合模型的应用程序,这就是人工智能的未来。混...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...模型的短板,此前行业也多次讨论过大模型的数学和复杂推理能力较差,即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次,第一财经曾在6月报道过,根据司南评测体系OpenCompass的高考全卷测试,包括GPT-4在内,7...……更多
专家模型不要专家并行!微软开源MoE新路径
...好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是在编码和数学测试中。...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...法分别将 BERT、GPT-Neo、BigBird 和 Longformer 在当前 GPU 上的推理速度加快了 1.25 倍、1.12 倍、1.57 倍和 1.65 倍,显著减少了片外内存流量。SoftMax。2022 年,Choi 等人提出了一种通过重组 Softmax 层加速 Trans……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起云涌...……更多
科技吉利创新吉利,吉利银河科技旗舰SUV“银河星舰”全球首发
... 北京报道4月25日,吉利汽车携自研的GEA全球智能新能源架构、银河11合1智能电驱、AI数字底盘、碳化硅混合驱动集成、天地一体化卫星科技等数十项行业最新、最热、最强的造车科技登陆2024北京国际车展,集中展示了吉利银河...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...I正在壮大。 能力一览11B和90B这两款模型,不仅支持图像推理场景,包括图表和图形在内的文档级理解、图像描述以及视觉定位任务,而且还能基于现有图表进行推理并快速给出回答。比如,你可以问「去年哪个月销售业绩最好...……更多
...其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5,拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力,同时能够实现单卡低...……更多
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
...三代至强® 可扩展处理器通过扩展出bfloat16加速功能,在推理加速能力之外又加强了训练能力;而第四代英特尔® 至强® 可扩展处理器又带来了全新的加速引擎——英特尔® AMX,进一步提升深度学习训练和推理性能,同时更适合...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的问题,让模型能按天迭代;解决高性能推理的问题,能秒级生成图片;...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。 基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...绍下Hyung Won Chung,从公布的o1背后人员名单来看,他属于推理研究的基础贡献者。资料显示,他是MIT博士(方向为可再生能源和能源系统),去年2月加入OpenAI担任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训...……更多
更多关于科技的资讯:
卢伟冰:小米砸700亿造车 是上牌桌的门槛
快科技12月12日消息,小米在进军汽车产业时,选择了一条与众不同的道路——完全使用自有资金进行造车,而非像许多同行那样寻求外部融资
2024-12-12 17:45:00
鲁网12月12日讯在推动信息通信基础设施建设、助力网络强国建设的进程中,泰安联通以人民为中心,着力提升网络感知,持续深化网络覆盖
2024-12-12 17:48:00
浸享聆听新体验,探索潮流新方式 JBL TUNE 2 系列
作为高保真至潮音频品牌,JBL推出了具时尚品味的JBLTUNE2系列(FLEX2晶噪豆二代,BUDS2琉璃豆二代及BEAM2琉璃荚二代)
2024-12-12 17:48:00
AI发展观察:AI结果优化(AIRO)已成为企业AI赛道高效
若把目光放回AI普及的年代前,可以发现企业品牌的网络拓客手段相对固定,习惯投放诸如自媒体、小红书、视频号、搜索引擎竞价等方式拓客
2024-12-12 17:57:00
李斌:明年乐道将推出两款改变市场格局的车
快科技12月12日消息,在今日举办的“蔚来面对面”活动中,李斌谈到了蔚来子品牌乐道和即将发布的萤火虫。李斌称,乐道明年会有比较重磅的产品
2024-12-12 18:15:00
关于空调电辅热的10个冷知识:40℃出风比60℃热得快
冬天来了,南方的很多朋友估计离不开空调的陪伴。近日,有熟悉家电行业的网友总结了关于空调电辅热的10个冷知识,怕冷的你或许可以学习一下
2024-12-12 18:15:00
NVIDIA、Intel、AMD三巨头罕见联手!共同投了AI芯片独角兽Ayar Labs
快科技12月12日消息,硅谷光互连芯片设计公司Ayar Labs宣布,完成由Advent Global Opportunities和Light Street Capital领投的1
2024-12-12 18:15:00
雷军曾说公司要预留18个月工资 网友集体点赞:这句话含金量还在上升
快科技12月12日消息,微博话题“再看雷军账上预留18月工资含金量”冲上热搜榜,引发热议。据了解,该话题之所以冲上热搜
2024-12-12 18:15:00
零极数字集团上榜2024年广东省名优高新技术产品名录!
近日,备受瞩目的“2024年广东省名优高新技术产品名单”正式揭晓,零极凭借其重磅产品——“企业数据基站节点软件”成功荣列其中
2024-12-12 18:16:00
极越崩盘或因百度吉利不愿投钱 李彦宏曾笑称:别给我亏太多
快科技12月12日消息,据报道,极越CEO夏一平于在召开线上全员会议上,承认公司面临着资金问题,接下来将合并职能重复的部门与岗位
2024-12-12 18:45:00
极越汽车的生死时刻:正寻求百度支持
极越汽车,正面临着生死时刻。12月12日凌晨,多位极越汽车各地区的一线门店主播在门店官方抖音号上表示,极越的产品与福利待遇都很好
2024-12-12 18:45:00
高速“见缝插针”超大货被撞还甩锅:我打喇叭打转向灯、他就不让!
12月12日消息,很多司机其实根本不合格,开车时随心所欲,全然不顾自己的行为到底存不存在危险。据“公安部交通管理局”最新披露的案例显示
2024-12-12 18:45:00
雷克萨斯下一代电动车最新进展:推迟一年发布
快科技12月12日消息,雷克萨斯近日宣布推迟下一代电动车的推出计划,预计延期至2027年中投产。官方表示,延长开发周期是为了引入更先进技术
2024-12-12 18:45:00
览邦 Watch Ultra 黑金美学丨再塑不凡,够狂野
12月12日消息,览邦正式公布WatchUltra智能腕表,无疑是当下令人振奋的科技时尚产品。新配色“黑金色调的”融合了卓越的工艺与前沿的技术
2024-12-12 18:45:00
100万元!开源鸿蒙OpenHarmony推出安全漏洞奖励计划
快科技12月12日消息,今天OpenHarmony社区宣布,为了社区软件版本的安全性,诚挚邀请上报OpenHarmony社区的疑似安全漏洞
2024-12-12 18:45:00