• 我的订阅
  • 头条热搜
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...源模型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多个...……更多
生成式AI在金融行业的应用及思考
...行业特定的大模型。例如,彭博社(Bloomberg)推出了一个500亿参数的金融大模型,使用了一半公开语料和一半金融语料进行训练,旨在更好地理解金融术语和场景。老虎证券在其券商App中集成了TagGPT模型,为客户提供金融问答服务。长桥...……更多
创新、合作、开放:英特尔多方位推动AI技术落地
...处理器不仅可以处理通用AI工作负载,同时还能应对模型参数小于10亿的生成式AI推理。随着模型规模的增长,至强亦能保证其运行所需的内存容量。而针对诸如700亿参数的AI大模型时,专门用于AI加速的英特尔Gaudi2将是更好的选...……更多
halcon18.11最新版下载-halcon18.11中文破解版下载
...et_framegrabber_param使用“event_selector”和“event_message_queue”参数注册事件回调,并使用dequeue_message函数等待该事件发生。(仅限USB3Vision、GenIcam 以及GigeVision2)下面奉上一段注册相机事件的……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期训练程序的改进大大降低了 Llama 3 的错误拒绝率,提高了对齐度,并增加了模型响应的多样性。他们还发现,推理、代码生成和...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科...……更多
斯坦福团队研发新型深度学习模型,能预测碳捕集引起的地表位移
... CCS 项目决策者更加高效地筛选最优的注入点位置和注入参数。在确保安全性的同时最大化碳封存量,从而大大节省选址评估的时间和成本。其二,本次所开发的深度学习模型可集成到 CCS 风险管理系统中,实现针对注入过程的...……更多
AI“卖铲人”英伟达,为何业绩再爆发?
...动业务,是GPU性能提升的技术支点,也是生态产品的拓展原点。2023年新推出RTX40 Super系列产品再巩固在游戏领域地位。三是AI应用,确立以智能汽车、人形机器人、工业数字化和医学AI为未来增长曲线。除算力芯片外,英伟达搭...……更多
中国银河维持传媒互联网推荐评级,AI技术潜在的应用行业将受益
...会现场发布了其Step系列通用大模型,其中包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版;3月22日,音乐科技领域初创公司Suno正式发布V3音乐生成模型,SunoV3能够在短短几...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。一种更优的方法是仅更新局部参数,从而在无损模型全局稳定性的前提下,让模型适应稀疏、个性化的 LTM ...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...问大模型也升级到了2.1版本。最受瞩目的首先是Qwen-72B,参数达到720亿,基于3T tokens的高质量数据训练。阿里云表示,Qwen-72B在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。△来源:阿里云具...……更多
从云栖大会,看阿里的科技本色
...会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开源的大型科技企业。云栖大...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...能化体验。 蓝心大模型包含覆盖十亿、百亿、千亿三个参数量级的五款vivo自研大模型,全面覆盖用户核心场景。其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,具备本地化的文本总结、摘要等能力。70亿模型...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...型。半年过去,如今阿里云正式推出通义千问的2.0版本,参数已达千亿,在各项评测集中,其综合性能已经超过GPT-3.5,加速追赶GPT-4。通义千问2.0参数已经在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和效率...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模型相比,大语言模型的构建过程涉及到更为复杂的训练方法,进而展现出了强大的自然语言理解能力和复...……更多
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
...机;阶跃星辰发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版;财跃星辰发布国内首个千亿参数多模态金融大模型;元始智能超越Transformer,RWKV第6代...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...领域,训练就是至关重要的一步,是一个把冰冷的数据、参数,变成有“思维”的工具关键一环。只有打好了技术的基础底座,才能让大模型拥有更成熟和精准的服务。业界常说,大模型训练有“三堵墙”:算力、内存、通信。...……更多
把大模型装进手机,总共分几步?
...差异化思路?第一步,端侧部署,三个基建大语言模型的参数量动辄百亿、千亿,其训练和推理过程,需要耗费大量计算资源,对于手机这样的移动智能终端来说,SoC芯片的算力是远远达不到数据中心万卡集群的规模的,怎么支...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
....2 1B 和 3B)!同时,小型和中型版本也获得了相应更新,参数量也都各有大幅增多,因为它们都获得了一个重大升级:可以处理视觉数据了!也因此,它们的模型卡都加上了 Vision 标签。 Llama 3.1 8B 升级成 Llama 3.2 11B Vision Llama 3.1...……更多
YashanDB V23.2 LTS发版
...产品 设备型号 华瑞指数云SDS2.0WDSV3 详细参数 硬盘:4xNVMe3.84TB 端口:100GbNic 缓存容量:256GB缓存 数量 服务器:3台 每台硬盘数量:4块(容量14TB) ……更多
阿姆斯特丹大学研究员开发自动化学合成ai机器人
...液配置、实验执行和在线分析;第二部分主要是选择反应参数,并将其传达给控制器开展实验,而后在分析反应参数和结果的基础上,推荐下一个实验参数,直至得到最优条件;第三部分则是帮助没有编程基础的研究人员更好地...……更多
百度All in的大模型何时能赚钱?
...模上,据IT之家报道,于10月17日最新发布的文心大模型4.0参数规模为目前所有公开发布参数最大的大语言模型,预计可能突破万亿级别。如此大参数量的模型,对算力的要求自然也更进一步,据媒体报道,文心4.0是在万卡AI集群...……更多
...原生应用开发。通用大模型之争最终将集中在算力成本和参数规模的竞争,通过构建AI原生应用生态、提供AI云服务来实现商业变现。趋势四:AI赛道投资火热,基建与应用两端爆发当前中国资本市场对于AI领域的主要关注在两端...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“...……更多
...理纳米金属工艺数据(包括但不限于金属材料种类、工艺参数、组织性能及力学性能参数),并结合人工智能(AI)和仿真数据、大数据分析和处理手段,实现数据存储、数据查询、数据分析、工艺设计、工艺优化、异常监控、应用模...……更多
...”经过半年多时间的努力,小米目前已训练出13亿和60亿参数规模的语言大模型,并在集团内开源赋能各业务。它们在小米澎湃OS系统和人工智能助手小爱同学的部分场景已经得到应用,更大参数规模的大模型也在紧锣密鼓地开发...……更多
openai公司宣布改善微调api,进一步扩展定制模型计划
...好地了解模型质量。Hyperparameter配置从仪表板配置可用超参数的功能(而非仅通过应用程序接口或SDK)改善微调控制面板可以配置超参数、查看更详细的训练指标以及从以前的配置重新运行作业的功能。扩展定制模型计划OpenAI为...……更多
更多关于科技的资讯:
3名游客意外落海:水上机器人成功拖回
快科技2月3日消息,机器人越发成熟起来,在各个领域发挥的作用也越来越大,近日,就有水上机器人成功救援了三名落水的游客。据央视网报道
2025-02-03 08:10:00
RTX 5090缺货到一塌糊涂!想预定都要等4个月
快科技2月3日消息,在RTX 50系列显卡发布后,市场出现了“一卡难求”的局面,许多零售商在开售后几分钟内就宣告售罄,甚至一些商家根本未能拿到RTX 5090
2025-02-03 08:10:00
华为XHUD-AR构图引擎亮点信息公布:让开车比开飞机更有趣
快科技2月3日消息,今日凌晨,华为乾崑智能汽车解决方案公布了XHUD-AR构图引擎的亮点信息,引擎支持多维坐标转换(虚实空间融合算法)
2025-02-03 09:10:00
火热一线过大年|厦企安费诺电子近4000名员工坚守岗位
春节假期,安费诺电子员工在产线上忙碌。(记者 张奇辉 摄)厦门网讯(厦门日报记者 李晓平)“为赶订单,这个春节我们有近4000名员工坚守岗位
2025-02-03 09:07:00
牢记嘱托 善作善成 春节假期,天津港依然是一派繁忙景象。港口里的拖轮,每天平均穿梭于码头和货轮之间8到10艘次。
2025-02-03 08:51:00
体长55米的巨型虫子!缩成一团蠕动 仿佛“毒液”
提起绦虫,第一时间的反应绝对是“恶心”,因为这是一种非常长的肠道寄生虫,人类也会被寄生。它到底有多长呢?开头这张照片就比较有名
2025-02-03 08:40:00
AMD惊喜连连!锐龙9 9000X3D与RX 9070系列显卡3月同步发布
快科技2月3日消息,据媒体报道,AMD计划在3月底同步推出锐龙9 9000X3D系列处理器和RX 9070系列显卡。锐龙9 9000X3D系列处理器包括16核心的9950X3D和12核心的9900X3D
2025-02-03 08:40:00
16大核32小核!Intel下代桌面CPU Nova Lake-SK很暴力
快科技2月3日消息,Intel已经官宣,将在今年下半年投产Intel 18A工艺,发布下代移动处理器Panther Lake
2025-02-03 08:40:00
春晚与淘宝,如何成为“最佳搭档”的?
作者:剑秋申遗后的春晚,正在变得更年轻? 在辞旧迎新的除夕夜,春节联欢晚会这个持续了43年的文化盛宴,在其与老搭档淘宝7年后第四次携手之际
2025-02-03 07:17:00
2024年全新上市车型销量榜:比亚迪秦L第一 一年狂卖228818辆
快科技2月2日消息,易车榜根据终端销量数据,整理了2024年上市的全新车型销量Top20榜单。具体来看,比亚迪秦L为去年上市的全新车型销冠车型
2025-02-02 23:10:00
苹果宣布开源Swift Build:拓展开发者生态建设
快科技2月2日消息,据报道,苹果宣布其将开源用于构建Xcode开发环境的工具引擎Swift Build。为开发者提供更加灵活和强大的工具支持
2025-02-02 23:40:00
阿西莫夫三定律 还适用于今天的AI吗
1942年,伟大的科幻作家艾萨克·阿西莫夫(Isaac Asimov)在他的短篇小说《转圈圈》(Runaround)中首次提出了“机器人三定律”
2025-02-02 23:40:00
想买YU7 先看看这台14000公里的创始版SU7现在咋样了
各位买新能源车的时候,会考虑二手车么?反正脖子哥我是有点心动的,二手新能源大部分年份都很近,里程数很低,而且一看价格全是骨折价
2025-02-03 01:10:00
“新冰箱吸不住高价买的冰箱贴”,气疯有囤积癖的年轻人
原标题:为什么新出的冰箱,吸不住冰箱贴了?作者:梁婷婷囤满食物的冰箱,在爸妈眼里自带一种年味儿,但一代人有一代人的“囤积癖”
2025-02-03 03:03:00
电动车主分享高速服务区充电小妙招:过个通道立马不用排队等桩
快科技2月2日消息,随着新能源汽车保有量的增多,每年春运期间都会出现服务区充电排队的情况。日前,有电动车车主分享了一个高速服务区充电小妙招
2025-02-02 12:40:00