• 我的订阅
  • 头条热搜
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
常见电子邮件分类算法的性能分析
...值向量,进而利用监督学习的方法进行训练。通过训练,模型能够学习到从文本到类别的映射关系,从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词:TF-IDF;决策树...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。针对此,港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
比ChatGPT省电10倍 Google研训练AI模型新方法
...次数比现在少13倍而运算量也少10倍,成功超越最先进的模型。根据Google DeepMind研究团队发布的研究报告,数据品质是预训练表现的重要驱动因素。Phi-3、Gemma 2等模型表明,更少但高品质的数据可以实现更强大的性能。若要筛选...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研究就拿出了非常有力的证据:Representation matters!扩散模型如何突破瓶颈? 成本高又难训练的DiT/SiT模型如何提升效率?对于这个问...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...为提升其聊天机器人产品Gemini的性能而努力,该公司希望模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,该...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2
...上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级点:▼MFU提升10% 最高可达55%在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。稠密模型集群训...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为模型定制增强专家,实现行业最...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...进行文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中,可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世,后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日,...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
openai新旗舰模型“orion”性能不及预期
11月11日,海外媒体表示OpenAI即将推出的新旗舰模型“Orion”在性能上的提升幅度不及预期。与GPT-3到GPT-4的显著进步相比,Orion相较于GPT-4的提升显得微不足道。Orion和GPT-4均基于变压器架构,但在设计上有所区别。GPT-4作为GPT-3的...……更多
...目——《云上之翼》,今天我们一起走进思必驰,探访大模型背后的算力“推手”。算力让AI“一路狂飙”思必驰是国内专业的对话式人工智能平台公司。以人机对话交互为核心,为智能汽车、智能家居、智慧政务等领域的客户...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
...设施练就“最强大脑”本报记者 曹政如果把人工智能大模型比作一位小学生,那么数据训练时所用的“语料”和“算力”,就相当于小学生“刷题”时使用的习题册和计算器,帮助他掌握知识点、更快给出正确答案。如今,北...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题,限制了模型的泛化能力和实际应用范围。近日,来自于香港科技大学(广州)、南方科技大学、...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
更多关于科技的资讯:
以旧换新消费热!汇川区家电家居卖场客流倍增
多彩贵州网讯 春节期间,消费市场迎来旺季,汇川区紧跟国家步伐,借力消费品以旧换新补贴政策,在家电、家居、汽车等关键领域精准发力
2025-02-12 22:48:00
雷军要学叉车了 还号召同事一起学 组织叉车比赛
快科技2月12日消息,此前在12月31日晚间,雷军在跨年直播时表示,他曾经想过开叉车,被告知还需要专门的驾照。雷军当场立下flag
2025-02-12 22:50:00
网友馋哭了!小米食堂好吃还不贵:午餐、晚餐平均仅16元
快科技2月12日消息,今晚雷军开启了元宵节直播,两个多小时里,带大家逛了小米食堂,还品尝了食堂最有特色的美食。据了解,小米食堂一共11800平方米
2025-02-12 22:50:00
贵州超算赋能动画电影《哪吒2》| 实现艺术性与工业美学完美结合
2025年春节档的票房大战硝烟未散,一部以东方神话为底色的动画电影《哪吒之魔童闹海》(以下简称《哪吒2》)以雷霆之势横扫市场
2025-02-12 22:51:00
【观点摘登】许淑萍:深化科技创新,提升体育产业竞争力
加强科技创新是提升体育产业竞争力的关键。近年来,随着材料技术、人工智能、大数据等前沿科技与体育深度融合,体育产业科技含量越来越高
2025-02-12 22:51:00
买奥迪当嫁妆两个月无法提车 4S店:合格证在银行 所有车都卖不了
快科技2月12日消息,据报道,浙江绍兴周女士介绍,去年12月8日,家里人在绍兴宏奥4S店,花费22.6万多给她外甥女购买了一辆奥迪A4L
2025-02-12 19:19:00
2.7万条三文鱼“出逃” 海产品公司竟以每条325元悬赏抓捕
快科技2月12日消息,据媒体报道,近日,总部位于挪威的全球知名海产品公司美威正在重金悬赏抓捕“出逃”的2.7万条三文鱼
2025-02-12 19:19:00
美味的深海怪物!一鮟鱇鱼海面游泳被人类偶遇:着实罕见
快科技2月12日消息,在常年见不到阳光的海洋深处,其实也生活着不少的动物,其中大多数长相丑陋,毕竟也见不到什么人,就随便长长算了
2025-02-12 19:19:00
23岁小伙两个月减肥40斤致秃头:不吃任何碳水化合物
2月12日消息,据媒体报道,宁波一名小伙遇到了“脱发危机”。据小伙介绍,他体重200斤,决心依靠“管住嘴”来减重,几乎不碰油脂
2025-02-12 19:19:00
最高频率近3.3GHz!索泰RTX 5080 AMP EXTREME INFINITY评测:超频后与RTX 4090相去不远
一、前言:支持双BIOS的索泰RTX 5080次旗舰1月29日,RTX 5080正式解禁,在实际功耗比上代RTX 4080低了近10%的情况下
2025-02-12 19:49:00
山东登上《哪吒2》全国各省票房榜第一名 网友:山东人不语只是一味买票
2月12日消息,据媒体报道,截至2月12日11时,《哪吒2》全国各省份票房数据显示,山东登上全国第一位。对此,有网友表示
2025-02-12 19:49:00
ABC比基尼安睡裤卫生巾被抵制 官方回应:非新品 去年已停止生产
快科技2月12日消息,日前,ABC一款“比基尼安睡裤”卫生巾新品引发热议。有网友认为,该产品为“经期性感”牺牲舒适度,比基尼式还有偷工减料的嫌疑
2025-02-12 19:49:00
如何理解引力波效应?《张朝阳的物理课》推导测地偏离方程
上次物理课已讲完引力波的挤压模式和摇摆模式,本次物理课从测地线方程推导出弱场慢速近似下的形变方程。2月9日12时,《张朝阳的物理课》第二百三十三期开播
2025-02-12 19:56:00
江西定南:开足马力忙生产
本文转自:人民网-江西频道在生产车间内,智能“下片”机器人在抓取生产的光伏玻璃产品。近日,在位于定南县老城镇的赣悦新材料有限公司生产车间内
2025-02-12 20:04:00
雷军元宵节宴请SU7 Ultra车主 称不少宝马Mpower车主选择我们
快科技2月12日消息,雷军元宵节直播时宴请了几位小米SU7 Ultra车主。在得知该用户是宝马M5车主后雷军表示:“不少宝马Mpower车主选择我们”
2025-02-12 20:19:00