• 我的订阅
  • 头条热搜
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...得CoTracker在FastCapture数据集测试中表现出色,超越了众多模型,包括Meta自家的DINOv2。CoTracker的部署也相对简便,用户可以通过Colab版本或从GitHub Repo中获取相关代码和依赖来自行操作。这一开源工具的广泛应用前景令人激动,它...……更多
openai公司宣布改善微调api,进一步扩展定制模型计划
...闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍)的训练过程)...……更多
常见电子邮件分类算法的性能分析
...值向量,进而利用监督学习的方法进行训练。通过训练,模型能够学习到从文本到类别的映射关系,从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词:TF-IDF;决策树...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
...闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
腾讯推出 Hunyuan-Large 开源大模型
IT之家11月5日消息,腾讯今日宣布推出Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
...略合作关系,华为云以及昇腾算力产品线同样能为公司大模型的研发提供算力支持,公司目前正在积极与华为对接,展开大模型产品与应用的软硬件解决方案的研发。公司大模型相关产品的研发从规划之初一直采用自主可控的路...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
我国发布首个亿级参数量地震波大模型:名为“谛听”
...,据成都科技局官方公众号介绍,日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。同时,“谛听”也是目...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
中国石油获得发明专利授权:“地震储层参数预测方法及装置”
...:将目标地层的地震数据,输入预先建立的储层参数预测模型中,得到目标地层的多个地震储层参数;储层参数预测模型按照如下过程建立:获取目标地层的地震工区资料,形成训练数据集;基于人工神经网络模型搭建多任务学...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
【新智元导读】北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式,相比传统模型在多项任务中表现出色,同时降低了参数量和计算量,增强了对周期性特征的建模能力,应用潜力广泛。周期性现象广泛存在,深...……更多
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...et系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM还能再突破?这次,他们对激活值下手了!近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
为满足大模型的“暴力”计算需求,国内GPU企业正加码算力基础设施建设。12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍,这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多
轻量级的模型亦有其存在的市场空间。2022年11月底,基于GPT-3.5的ChatGPT刚出来的时候,小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌给ChatGPT抛出一个问题:证明一下勾股定理。最终,ChatGPT给出了一个基于数学归...……更多
中国石油发布700亿参数昆仑大模型建设成果
...月28日,以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真
...进行编码的样式参数。研究人员在六维N-body相空间上训练模型,将粒子速度预测为模型位移输出的时间导数,显著提高了训练效率和模型准确性。最终,模拟器在测试数据(训练期间未见过的各种宇宙学和红移)上实现了良好的...……更多
AIGC音乐的中场战事:从技术、产品到商业规则
...”。11月16日,谷歌旗下 DeepMind发布了最新的AIGC音乐生成模型Lyria,并与YouTube合作打造了两个重要应用场景:Dream Track和Music AI tools。同时,谷歌和YouTube还将AI识别工具SynthID扩展到音乐领域,为Lyria生成的AI作品打上水印……更多
大模型这把大火,烧到了手机领域
配图来自Canva可画AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。在很多人看来,手机厂商入...……更多
更多关于科技的资讯:
近日,河北永旭电源有限公司生产车间内,自动化生产线正有条不紊地运转。电池极耳焊接的关键工位上,曾经的质检员凝视生产线的身影已被一套AI工业视觉质检系统取代
2025-10-21 08:18:00
画里有话|直播售假“昼伏夜出”,监管需要“全时在线”
在电商和短视频平台上,一些商户仅在深夜凌晨开播,主播高喊“代工厂直供”“海外渠道货”,时不时用手遮挡标识,价格更是“打到骨折”
2025-10-21 08:19:00
记者走基层|机器人“关节”在这里协同智造
10月13日,智昆科技智能制造工厂,工业机器人正在操作数控机床。 河北日报记者 潘文静摄机器人如何做到精准操控、灵活运动
2025-10-21 08:19:00
添了“智慧帮手”,公路管养精准高效——AI赋能千行百业一线故事(十四)近日,记者来到张家口市公路管理处。一进门,墙上的一面智慧大屏映入眼帘
2025-10-21 08:21:00
丰草牧场荣膺京东“年度新品标杆奖”,打造从牧草到奶粉的三有机品质闭环
近日,在京东 2025 驼奶粉行业峰会上,新疆伊犁丰草牧场旗下核心产品——三有机纯驼奶粉,凭借其从牧草种植到奶粉加工的全链路掌控与数字化创新
2025-10-21 08:26:00
厦门网讯(厦门日报记者 林露虹)2025世界VR(虚拟现实)产业大会日前在南昌召开,会上发布“2025中国VR50强企业”名单
2025-10-21 08:41:00
聚焦粮食安全打造智慧农业“智能遥感大脑”
粮食安全是关乎国计民生的根本大事,智慧农业已成为全球农业科技竞争的核心制高点,而粮食生产信息的及时高效获取,正成为当下智慧农业发展的关键节点
2025-10-21 08:56:00
胖东来设立“胖东来开放日”:面向企业 2万元/人 申请条件为希望做品质、幸福的企业
10月20日,胖东来商贸集团官方发布公告称,将设立“胖东来开放日”,给大家提供进入企业内部参观的渠道。公告称,希望通过这样的方式
2025-10-21 10:33:00
在智能缆网、智慧机场、储能系统等新能源业务快速拓展的背景下,远东智慧能源股份有限公司作为2025年青海企业50强之一,正以“电能+算力+AI”为核心战略
2025-10-21 10:56:00
2025 年 10 月 14 日,亿纬锂能首套大容量钠离子电池储能系统在荆门基地并网运行,成为近期新能源领域的标志性事件
2025-10-21 11:27:00
支付宝发文《世子之争???我不需要》 并放话:AQ,你回去好好想想吧
10月20日,支付宝发布《关于支付宝首页AQ广告下架的声明》。文中提到经审慎研究决定,自本周起,暂停AI健康管家AQ在支付宝首页的广告投放
2025-10-21 11:45:00
临沂市信息工程学校电子商务专业技能培训圆满落幕
鲁网10月21日讯为深化电子商务专业教学改革,提升师生电商行业适配能力,临沂市信息工程学校于10月10-11日成功举办电子商务运营及实战课程培训
2025-10-21 12:18:00
在2025年这个金秋送爽的季节,佛山企业界传来振奋人心的喜讯!广东宜奥家居集团有限公司在最新发布的2025年度佛山企业权威评选中大放异彩
2025-10-21 14:59:00
天猫超级首饰发布携手周大福,以故宫美学与IP矩阵推动黄金年轻化转型
10月16日,天猫“超级首饰发布”第四期,迎来全球领先珠宝品牌周大福。作为传承百年而持续创新的品牌,周大福珠宝的IP矩阵颇具看点——既有承载文化底蕴的故宫系列
2025-10-21 15:10:00
在电网建设快速发展的新形势下,国网商河县供电公司物资供应分中心以创新思维推进物资供应管理改革,通过构建现代化物资供应管理体系
2025-10-21 15:10:00