• 我的订阅
  • 头条热搜
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...源模型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多个...……更多
生成式AI在金融行业的应用及思考
...行业特定的大模型。例如,彭博社(Bloomberg)推出了一个500亿参数的金融大模型,使用了一半公开语料和一半金融语料进行训练,旨在更好地理解金融术语和场景。老虎证券在其券商App中集成了TagGPT模型,为客户提供金融问答服务。长桥...……更多
halcon18.11最新版下载-halcon18.11中文破解版下载
...et_framegrabber_param使用“event_selector”和“event_message_queue”参数注册事件回调,并使用dequeue_message函数等待该事件发生。(仅限USB3Vision、GenIcam 以及GigeVision2)下面奉上一段注册相机事件的……更多
创新、合作、开放:英特尔多方位推动AI技术落地
...处理器不仅可以处理通用AI工作负载,同时还能应对模型参数小于10亿的生成式AI推理。随着模型规模的增长,至强亦能保证其运行所需的内存容量。而针对诸如700亿参数的AI大模型时,专门用于AI加速的英特尔Gaudi2将是更好的选...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期训练程序的改进大大降低了 Llama 3 的错误拒绝率,提高了对齐度,并增加了模型响应的多样性。他们还发现,推理、代码生成和...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科...……更多
斯坦福团队研发新型深度学习模型,能预测碳捕集引起的地表位移
... CCS 项目决策者更加高效地筛选最优的注入点位置和注入参数。在确保安全性的同时最大化碳封存量,从而大大节省选址评估的时间和成本。其二,本次所开发的深度学习模型可集成到 CCS 风险管理系统中,实现针对注入过程的...……更多
AI“卖铲人”英伟达,为何业绩再爆发?
...动业务,是GPU性能提升的技术支点,也是生态产品的拓展原点。2023年新推出RTX40 Super系列产品再巩固在游戏领域地位。三是AI应用,确立以智能汽车、人形机器人、工业数字化和医学AI为未来增长曲线。除算力芯片外,英伟达搭...……更多
中国银河维持传媒互联网推荐评级,AI技术潜在的应用行业将受益
...会现场发布了其Step系列通用大模型,其中包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版;3月22日,音乐科技领域初创公司Suno正式发布V3音乐生成模型,SunoV3能够在短短几...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。一种更优的方法是仅更新局部参数,从而在无损模型全局稳定性的前提下,让模型适应稀疏、个性化的 LTM ...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...问大模型也升级到了2.1版本。最受瞩目的首先是Qwen-72B,参数达到720亿,基于3T tokens的高质量数据训练。阿里云表示,Qwen-72B在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。△来源:阿里云具...……更多
从云栖大会,看阿里的科技本色
...会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开源的大型科技企业。云栖大...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...能化体验。 蓝心大模型包含覆盖十亿、百亿、千亿三个参数量级的五款vivo自研大模型,全面覆盖用户核心场景。其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,具备本地化的文本总结、摘要等能力。70亿模型...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...型。半年过去,如今阿里云正式推出通义千问的2.0版本,参数已达千亿,在各项评测集中,其综合性能已经超过GPT-3.5,加速追赶GPT-4。通义千问2.0参数已经在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和效率...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模型相比,大语言模型的构建过程涉及到更为复杂的训练方法,进而展现出了强大的自然语言理解能力和复...……更多
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
...机;阶跃星辰发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版;财跃星辰发布国内首个千亿参数多模态金融大模型;元始智能超越Transformer,RWKV第6代...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...领域,训练就是至关重要的一步,是一个把冰冷的数据、参数,变成有“思维”的工具关键一环。只有打好了技术的基础底座,才能让大模型拥有更成熟和精准的服务。业界常说,大模型训练有“三堵墙”:算力、内存、通信。...……更多
把大模型装进手机,总共分几步?
...差异化思路?第一步,端侧部署,三个基建大语言模型的参数量动辄百亿、千亿,其训练和推理过程,需要耗费大量计算资源,对于手机这样的移动智能终端来说,SoC芯片的算力是远远达不到数据中心万卡集群的规模的,怎么支...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
....2 1B 和 3B)!同时,小型和中型版本也获得了相应更新,参数量也都各有大幅增多,因为它们都获得了一个重大升级:可以处理视觉数据了!也因此,它们的模型卡都加上了 Vision 标签。 Llama 3.1 8B 升级成 Llama 3.2 11B Vision Llama 3.1...……更多
YashanDB V23.2 LTS发版
...产品 设备型号 华瑞指数云SDS2.0WDSV3 详细参数 硬盘:4xNVMe3.84TB 端口:100GbNic 缓存容量:256GB缓存 数量 服务器:3台 每台硬盘数量:4块(容量14TB) ……更多
阿姆斯特丹大学研究员开发自动化学合成ai机器人
...液配置、实验执行和在线分析;第二部分主要是选择反应参数,并将其传达给控制器开展实验,而后在分析反应参数和结果的基础上,推荐下一个实验参数,直至得到最优条件;第三部分则是帮助没有编程基础的研究人员更好地...……更多
百度All in的大模型何时能赚钱?
...模上,据IT之家报道,于10月17日最新发布的文心大模型4.0参数规模为目前所有公开发布参数最大的大语言模型,预计可能突破万亿级别。如此大参数量的模型,对算力的要求自然也更进一步,据媒体报道,文心4.0是在万卡AI集群...……更多
...原生应用开发。通用大模型之争最终将集中在算力成本和参数规模的竞争,通过构建AI原生应用生态、提供AI云服务来实现商业变现。趋势四:AI赛道投资火热,基建与应用两端爆发当前中国资本市场对于AI领域的主要关注在两端...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“...……更多
...理纳米金属工艺数据(包括但不限于金属材料种类、工艺参数、组织性能及力学性能参数),并结合人工智能(AI)和仿真数据、大数据分析和处理手段,实现数据存储、数据查询、数据分析、工艺设计、工艺优化、异常监控、应用模...……更多
...”经过半年多时间的努力,小米目前已训练出13亿和60亿参数规模的语言大模型,并在集团内开源赋能各业务。它们在小米澎湃OS系统和人工智能助手小爱同学的部分场景已经得到应用,更大参数规模的大模型也在紧锣密鼓地开发...……更多
openai公司宣布改善微调api,进一步扩展定制模型计划
...好地了解模型质量。Hyperparameter配置从仪表板配置可用超参数的功能(而非仅通过应用程序接口或SDK)改善微调控制面板可以配置超参数、查看更详细的训练指标以及从以前的配置重新运行作业的功能。扩展定制模型计划OpenAI为...……更多
更多关于科技的资讯:
《哪吒2》票房破146亿!冲击全球第6 距《复联3》一步之遥
快科技3月6日消息,今日,据网络平台数据显示,动画电影《哪吒之魔童闹海》(以下简称《哪吒2》)总票房(包含港澳台及海外票房)突破146亿元
2025-03-06 19:43:00
智界R7车主称开智驾出严重事故:事发原因公布看呆网友
快科技3月6日消息,近日有小红书用户,同时也是智界R7车主发帖称,自己新提的车才1个月,结果在高速路上出事故导致车辆被撞报废
2025-03-06 19:43:00
顺鑫农业牛栏山持续引领行业品牌创新,让中国白酒融入烟火气
2024年度,中国白酒行业风云变幻、竞争激烈,而顺鑫农业旗下的牛栏山酒厂在这一年中的表现则可圈可点。牛栏山酒厂在其2024年度厂务公开暨总结表彰大会上
2025-03-06 20:13:00
雷军:小米汽车已交付超18万辆 还有15万台在排队
快科技3月6日消息,据报道,全国人大代表、小米集团董事长雷军在大会上表示:去年我在全国人代会上表态,一定会把小米汽车干好
2025-03-06 20:13:00
12万的“青春版奥迪” 奇瑞艾瑞泽8 PRO值得买吗
在12万级家用轿车市场,消费者常常面临“选国产还是合资”“要配置还是品牌”的纠结。如今,随着奇瑞艾瑞泽8 PRO的预售开启(起售价11
2025-03-06 20:13:00
五菱汽车发布正面盈利预告:净利润1.04亿同比增长约50%
快科技3月6日消息,五菱汽车在港交所发布正面盈利预告,预计截至2024年12月31日止年度将录得净利润约1.04亿元人民币
2025-03-06 20:13:00
刷新岛城春天的N种打开方式!上抖音,焕新青岛春日生活
摘要:相约青岛“过春天”,上抖音,焕新春日生活!春回大地,万象更新。褪去厚重的衣物,换上轻盈的春装,和三五好友围坐小马扎
2025-03-06 20:25:00
东科克诺尔:做好节能降耗 “加减法” 打造绿色工厂
十堰广电讯(全媒体记者 吕行 李昀翔)企业践行绿色发展,节能降耗是关键。东科克诺尔商用车制动有限公司通过调整生产工艺、科技化手段利用等方式
2025-03-06 20:28:00
护眼台灯哪个牌子好?掌握这三个挑选诀窍,远离智商税!
每当孩子写作业、看书的时候,我们总会担忧不良光线伤害孩子的眼睛。可想要挑个合适的护眼台灯,简直比解数学难题还让人头疼!市面上五花八门的牌子
2025-03-06 20:30:00
3月6日阳曲县消息,健康阳曲平台通过接入DeepSeek大语言模型,全面升级县域慢病AI辅诊能力,阳曲县在智慧医疗领域迈入全新阶段
2025-03-06 20:32:00
Manus创始人是中国90后:毕业于华中科技大学
快科技3月6日消息,继DeepSeek之后,科技圈又迎来一款全新的通用型AI Agent产品Manus,它由中国团队打造
2025-03-06 20:43:00
“英伟达小弟”上市风波不断:创始人巨额套现遭质疑 大客户被传撤单
随着本周被称为“英伟达小弟”的美国云计算平台CoreWeave递交上市招股书,这份充满“金融交易智慧”的文件令吃瓜群众大开眼界
2025-03-06 21:13:00
聚焦9大领域打造60+应用新场景 重庆发布人工智能赋能超大城市现代化治理三年行动计划
3月6日,上游新闻记者从重庆市城市治理委员会办公室获悉,为深入推进国家“人工智能+”战略部署,创新探索人工智能赋能超大城市现代化治理新路径
2025-03-06 21:14:00
车位到车位全程自主通行!广汽NDA4.0高阶智驾官宣:首搭昊铂HL
快科技3月6日消息,广汽昊铂宣布其NDA 4.0城市领航高阶智驾系统将率先应用于中大型SUV昊铂HL,该车型将于3月18日启动预售
2025-03-06 21:43:00
人民日报下场降温:DeepSeek最大的价值是被超越!
快科技3月6日消息,DeepSeek自春节前成为国内“顶流”之后,犹如一声惊雷劈开垄断,跻身世界最强大模型行列,开启中国人工智能崭新的春天
2025-03-06 17:13:00