• 我的订阅
  • 头条热搜
百川智能发布baichuan3稳定语言模型
...方面实现较好的约束理解和遵循。此外,传统的单次RLHF范式在唐诗宋词面前也遇到极大挑战,PPO在训练过程中生成的Response有可能超出RewardModel的评价范围导致“探索”的过程失控。Baichuan3结合“RLHF&RLAIF”以及迭代式强化学...……更多
浙江电信成为 “西湖之光”算力联盟首批成员,助力打造AI for Science科研新范式
...合作研讨,通过共建联合实验室,打造AI for Science科研新范式。发布会期间开展科研课题合作研讨交流本次联盟彰显了信息技术与学科教学深度融合,探索政产研跨领域进一步合作。未来浙江电信将持续建设云智融合、算网一体...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...动化和智能化,激发人工智能驱动科学研究(AIforScience)的新范式。面向政务,将原本分散、碎片化的政务应用,通过“一模通办”为政务服务提质增效。首次提出新一代AI基础设施评估体系,商汤科技引领新一代AI基础设施当前,新一代A...……更多
中国车企的大模型战争,才刚刚开始
...动 BEV+Transformer 成为整个自动驾驶领域走向量产落地的新范式。所以,以 Transformer 为连接点,实际上大模型与自动驾驶一直存在着某种最底层的技术关联——也因此,一些车企在谈到自家采用的 BEV+Transformer 感知架构时,也会用...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
... OpenAI o1 的一步。o1 则代表了“从记忆答案到记忆推理的范式转变”。清北校友 o1-mini 主要负责人除了 Ilya Sutskever,关于 o1 背后团队也引发了不少关注。官网给出的全名单,分成了推理研究和推理技术安全两块。粗略一看已经远...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...准体系,通过多维系统感知、大模型等能力构建全局意图范式,实现对用户显性与潜在意图的理解,并及时、准确地将用户需求传递给生态伙伴,匹配合时宜的服务,为用户提供多模态、个性化的进阶场景体验。华为小艺架构师周剑辉...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
算力建设改变“小、散”局面 打开AI应用新范式
本文转自:中国新闻网中新网6月25日电(中新财经记者 吴涛)随着AI的飞速发展,算力结构市场也在调整,改变原来“小、散”局面,一些算力关键节点出现,进一步推动AI应用落地。算力产品根据大模型定向优化25日,中国移动...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...量在中国台湾和香港娱乐榜分别位列第一和第三。MoE训练范式具有「更高性能、更低成本」优势,元象在通用预训练基础上,使用海量剧本数据「继续预训练」(Continue Pre-training),并与传统SFT(监督微调)或RLHF(基于人类反...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
5月10日至14日,以“中国品牌,世界共享;国货潮牌,品筑未来”为主题的2024年中国品牌日活动在上海举行。联通数字科技有限公司参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...座大模型+负责操作的神经网络会成为通用机器人的关键范式曹巍:蓝驰创投合伙人。 Figure 01 此次呈现的亮点颇为丰富:首先,产品的整体质感与工程设计表现出色,外观精致,有独特的设计语言。同时,人机交互的音色经过调...……更多
算力卡不住大模型的脖子
...出的上一代预训练语言模型BERT开始,戴文渊和他的第四范式已经在研究AI大模型了,但直到GPT-3出现时,整个产业界才作出判断:大模型将会到达一个举足轻重的位置。作为国内最早一波AI产业逐浪者,第四范式创始人兼CEO戴文...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...说,与微调相比,RAG可能更有优势。然而,Meta认为这种范式过于简单化,因为在多种情况下,RAG不仅不是微调的替代方案,而且更像是微调的补充方案。根据问题的特点,应该尝试一种方法,或者两种方法。根据本文的框架,...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...始人兼CEO高雪峰受邀出席,并发表了题为《AI+行业落地新范式:知识引擎与大模型双轮驱动企业智能化升级》的分享,阐述了他对以大模型技术为代表的人工智能技术赋能产业转型升级的深刻见解。高雪峰认为,“如果仅停留在...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...启了GPT系列之外的新一代模型。它代表着人工智能发展新范式的开端,在LLM领域首次实现了通用复杂推理能力。在代码生成方面,o1可以媲美IOI金牌水准。在物理、生物、化学等STEM学科问题的基准测试GPQA中,甚至超越了人类博...……更多
本周(4.8-4.14)AI界发生了什么?
...△Udio界面,图源:官网前沿研究北大与字节合作提出VAR范式4月13日消息,北京大学和字节跳动的研究者提出合作提出新一代范式视觉自回归建模(VAR),将图像的自回归学习,重新定义为从粗到细的“下一个尺度预测”或“下...……更多
突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿
...之外,还需要哪些突破性进展才能让我们达到新的proto-AGI范式Scaling Law的存在意味着,随着模型变大,对数据的需求也呈现指数级增长,越来越多的人担心大模型会耗尽可用数据。Scale AI的主营业务——做AI模型的「数据工厂」,...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...能大会暨人工智能全球治理高级别会议“人工智能:科研范式变革与产业发展”主题论坛上,上海科学智能研究院院长(下称上智院)、复旦大学浩清特聘教授漆远,讲述了他对于通用人工智能(AGI)和科学智能的发展判断。参...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...了对多LLM协作或外部控制机制的需求,同时与标准LLM训练范式保持一致,便于集成到现有工作流程中。作者还为DoT框架提供了严格的数学基础,利用Topos Theory对推理过程进行了形式化描述。在这个框架中,命题被建模为拓扑中终...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...改造,显然不可同日而语。大模型落地终端或将迎来新的范式。但大方向趋同之下,微软与苹果在路径上的差异,也预示着演化路径仍将分叉而行。而与此同时,技术演进正在逐步消解端侧部署大模型的必要性,这又为路径演化...……更多
...命阶段,伴随着概念层的突破,已有的理论框架被新科学范式全面颠覆并重构,例如从牛顿力学到量子力学的转变。库恩创造了“范式转变(Paradigm Shift)”这一科学哲学新概念。在库恩定义的范式转变理论中,科学发现遵循的...……更多
荣耀magicos8.0:人机交互迎来新范式
...体验创新?无疑非常值得期待。AI时代,人机交互迎来新范式在具体分析MagicOS8.0的功能看点之前,我们需要先明确一个核心问题,就是在AI时代下,操作系统的UI交互范式会往哪个方向发展?这个问题对于主打AI体验的MagicOS来说...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
更多关于科技的资讯:
华为将会在10月带来一系列新产品
9月27日,有数码博主爆料称,华为将会在10月带来一系列新产品,其中便包括大家期待已久的nova13系列。华为nova13系列渲染图该博主发文称
2024-09-27 20:23:00
9月26日,阿维塔旗下第三款战略合作车型阿维塔07正式上市,该车型定位智美豪华SUV,内外兼修,将豪华感和智能感发挥到极致
2024-09-27 20:26:00
埃安aionrt开启预售,定位新颜控智驾轿车
9月26日,埃安在广州正式发布了其第二款全球车型——AIONRT,并开启预售。新车共推出包含520km和650km续航在内的四个版本
2024-09-27 20:27:00
埃安新款轿车aionrt开启预售,提供两个续航版本
9月26日晚,埃安宣布旗下新款轿车AIONRT正式开启预售,提供520km、650km两个续航版本。同时,该车的内饰官图也正式公布
2024-09-27 20:28:00
tcl空调斩获“中国冷暖智造年度卓越品牌”大奖
9月25日-26日,2024年中国暖通空调产业发展峰会暨中国“冷暖智造”颁奖盛典在武汉举行,来自暖通空调产业链的600多位精英人士
2024-09-27 20:28:00
三星theframe画壁艺术电视正式上线
在家居空间构筑的命题中,场景消费、体验经济正在搭建消费者与产品之间的桥梁。三星秉持“有AI的科技·艺术·家”理念,以艺术调动多重感官体验
2024-09-27 20:29:00
联合国大数据黑客松首届中国赛即将启动
9月26日,2024联合国大数据黑客松中国赛在第三届全球数字贸易博览会上正式发布。国家统计局浙江调查总队副总队长、联合国统计大数据和数据科学全球中心中方代表宋少英出席仪式
2024-09-27 20:30:00
拯救英特尔大作战:白宫据传将敲定85亿美元芯片拨款
财联社9月27日讯(编辑 马兰)英特尔正在努力自救,除了本月中旬宣布的重大业务调整之外,该公司近日还传出可能将被高通并购的消息
2024-09-27 20:31:00
大金链子配AR眼镜 扎克伯格抢光了苹果的风头
Meta创始人兼CEO扎克伯格最近心情很好,步入不惑之年的他似乎在个人形象和公司发展上都迎来了第二春。而他的秘诀:不怕大举押注
2024-09-27 20:31:00
以“向新·向上”为主题的2024中国国际汽车展览会将开幕
以“向新·向上”为主题的2024中国(天津)国际汽车展览会将于9月29日至10月5日在天津国家会展中心二期举办。作为年度最受瞩目
2024-09-27 20:31:00
怎样给2400万辆新能源汽车充电
充电桩突破1000万台只是第一步,接下来比拼体验和生态随着新能源汽车渗透率超过50%,作为和新能源车联系最紧密的行业,充电行业及其上下游产业正在经历重塑
2024-09-27 20:31:00
华硕a豆14air香氛版瑰蜜粉金高性能ai旗舰重磅发布
想要性能颜值双在线的AIPC?华硕a豆14Air香氛版瑰蜜粉金高性能AIPC旗舰重磅发布!全新搭载第三代AMD锐龙AI9365AIPC移动处理器
2024-09-27 20:32:00
Redmi Note 14 Pro+十一买来送父母,太香了!
9月26日晚,小米公司正式揭晓了RedmiNote系列的最新力作——RedmiNote14Pro+,这款新机以前所未有的优雅设计
2024-09-27 20:33:00
华为10月新品阵容曝光:nova13系列首当其冲
最近,知名数码博主提前揭秘了华为即将在10月推出的新品阵容,其中最为引人注目的莫过于万众期待的nova13系列智能手机
2024-09-27 20:35:00
苹果homeaccessory智能显示器将推出
苹果可能要推出一款被内部称为“HomeAccessory”的智能显示器,其设计概念与iPad相似却又独具特色,旨在成为控制HomeKit及Matter设备的核心中枢
2024-09-27 20:35:00