• 我的订阅
  • 头条热搜
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...元导读】最近,Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路,并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文,但依旧激起了广大网友强...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...正的科学研究需求。 而苹果这次竟然来真的!!就连NLP科学家、AutoAWQ创建者也发出惊叹:Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集也引来网友在线调侃:至于这次开源的意义...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示,合成数据...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...细技术报告。消息一出,社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论:这是OpenAI王座的有力竞争者。 话不多说,一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现,也正如我们刚才所述,32个基准...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...多历史记录。首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试,通过270个基于90篇跨学科科学论文的任务,可评估AI智能体在计算可重复性方面的表现,最简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...过人类时,AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频,做了一个精彩亮点的总结。一共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...个例子,在 Kaggle 数据科学竞赛中(如图 1 所示),数据科学家需要遵循一个结构化的工作流程:收集、清理、预处理和标准化数据,创建数据加载器以实现高效管理,生成关键评估指标,以及开发自定义模型。然后,这些见解...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业,新公司将专注于构建新的AI模型,首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业,融资近80亿美元!华人科...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主要集中在深度学习、计算机视觉和多模态模型等方向,曾发表多项具有深远影响力的成果,例如AttnGAN、OSCAR...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...时间,可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称,模型不仅仅拥有训练时的Scaling law,还拥有推理层面的Scaling law,双曲线的共同增长,将突破大模型能力的提升瓶颈。同时,OpenAI表示,思维链...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...是数据分析领域的首个多代理沙盒环境,包含客户、数据科学家、管理员和 AI ChatBot 智能体,通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境,他们开发了 Tapilot-Crossing 基准,它涵盖了从常规代码生成...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...多基准测试中领先,并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日,开...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...了Mistral-7B ,性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar(也是DCLM研发人员)的说法,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在多模态大模型赛道的又一力作。图源:X平台Alphabet与G……更多
...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文,探讨用小模型监督大模型的方法,为未来超人类AI对齐工作提供支持。K...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...针对任何特定应用(例如对话)进行微调。对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。英伟达高级科学家Jim Fan表示,(这是)有史以来最大的开源大模型,由世界一流的团队训练。 ……更多
人工智能训练师与数据科学家的区别
...工智能和数据科学的快速发展中,人工智能训练师和数据科学家这两个职业常常被混淆。尽管两者在工作中有许多交集,但其核心职责和专业侧重点却有所不同。今天我们将深入分析人工智能训练师与数据科学家的区别,帮助读...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...证明,模型的自我提升可以摆脱对人类监督的依赖。 Meta科学家Yann LeCun也转发了这篇研究,并亲自下场玩起了双关梗——Meta提出的Meta-Judge,FAIR能否实现fair?研究不重要,重要的是Meta FAIR这一波曝光率拉满了。元奖励(Meta-Rewar...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只有头部几个有价值。 英伟达科学家Jim F……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...高1000倍在IEEE文章中,台积电董事长刘德音及台积电首席科学家H.-S Philip Wong讲述了台积电是如何达成1万亿晶体管芯片的目标。文章指出,从1997年击败国际象棋人类冠军的IBM深蓝超级计算机,到2023年爆火的ChatGPT,再过15年,人工...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。作者简介本文的通讯作者Zechun Liu是Meta Reality Labs的研究科学家。她本科毕业于复旦大学,博士毕业于香港科技大学,加入Meta前曾有两年多的时间在CMU担任访问学者。Zechun的研究兴趣是深度学习在现实场景中的应用,例如资源...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...智能研究所汇聚了数十名智能科学与机器人领域顶尖青年科学家,依托鹏城云脑、中国算力网等自主可控 AI 基础设施,致力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...飞也曾短暂进入工业界,出任谷歌副总裁即谷歌云AI首席科学家。她一手推动了谷歌AI中国中心正式成立,这是Google在亚洲设立的第一个AI研究中心。并带领谷歌云推出了一系列有影响力的产品,包括AutoML、Contact Center AI、Dialogflow...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...计算力。”针对GPT-4o强大的多模态能力,英伟达高级研究科学家JimFan发表长文表示,从技术角度来看,这需要对标记化和架构进行一些新的研究,但总体上是一个数据和系统优化问题。在JimFan看来,GPT-4o很可能是GPT-5的一个早期...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
...工程师简化了上述所有复杂环节。它的目标不是取代数据科学家或工程师,而是与人类合作并处理所有繁重任务。在人与 AI 合作的工作环境中,人们仅用几个小时就能完成一周的工作。听起来有点像今年 3 月在 AI 社区爆火的首...……更多
更多关于科技的资讯:
全国首个万兆家庭云电竞PC在济南交付 开启云端游戏新场景
鲁网10月16日讯2025年10月13日,山东济南中铁逸都小区迎来全国通信与云游戏领域的一项重大突破——山东联通产互、济南联通联合华为完成全国首台万兆家庭云电竞PC的正式交付与开通
2025-10-16 11:58:00
□南京日报/紫金山新闻记者曹丽珍近期,金融机构2026年度秋季校园招聘大幕(以下简称秋招)开启。当前,金融行业数字化转型正在加速推进
2025-10-16 07:38:00
南报网讯(通讯员宁数轩记者马道军)10月15日,记者从市数据局了解到,由南京大数据集团牵头建设运营的南京数据要素创新中心——“宁数服”近日成功入选首批“江苏省数据产业公共示范平台”名单
2025-10-16 07:39:00
南报网讯(记者王国俊)10月13日,中国联通、中国移动、中国电信三大电信运营商相继官宣eSIM手机商用试验获批。昨天记者从南京相关运营商获悉
2025-10-16 07:39:00
千米产线“擀面皮” 火红钢坯变钢卷
以 “高智绿” 三重发力筑牢南京钢铁产业根基,探访梅钢热轧厂——千米产线“擀面皮” 火红钢坯变钢卷梅钢热轧产线厂房外景
2025-10-15 08:08:00
南报网讯(记者朱旖旎通讯员汪维)近日,栖霞区人工智能产业链新联会正式成立。这是我市首家聚焦于人工智能产业链的新联会,旨在搭建政企沟通桥梁
2025-10-15 08:08:00
厦门网讯(厦门日报记者 林露虹)10月16日—19日,2025厦门国际时尚周将在厦门中山路、鼓浪屿等文旅地标举行。本届时尚周以“自在发生”为主题
2025-10-15 08:21:00
河北日报讯(记者刘光昱)10月14日,为期3天的2025第十四届中国创新创业大赛新一代信息技术领域全国赛在雄安会展中心开赛
2025-10-15 08:24:00
“正大杯”2025年全球大学生就业创业实战大赛全国总决赛首轮赛事圆满收官
10月11日至13日,"正大杯"2025年全球大学生就业创业实战大赛全国总决赛首轮赛事在北京圆满举办。本届大赛以"创未来
2025-10-15 09:08:00
兴业银行“消保大模型智审平台”获评AIIA“2025年度人工智能金融专项优秀案例”
东南网龙岩10月14日讯(通讯员 肖夏玲)近日,在中国人工智能产业发展联盟(以下简称AIIA)、工业和信息化部新闻宣传中心
2025-10-15 09:40:00
京东11.11开场, 海外用户大件也包邮,收货更快更省
10月14日,京东11.11惊喜开放日在京举行。身处海外的华人用户,只需通过京东 APP 进入全球售平台,即可同步享受 “又好又便宜” 的购物体验
2025-10-15 09:45:00
锐志机械圆满收官PACK EXPO拉斯维加斯:聚焦纸袋包装的可持续发展
锐志机械圆满完成于9月29日至10月1日在拉斯维加斯举办的 PACK EXPO 参展工作。作为全球具有影响力的包装行业盛会之一
2025-10-15 10:08:00
百世软件推AI商品智能管理功能:一键上架,助力卖家高效出海
10月14日,百世集团旗下百世软件正式宣布,其面向海外市场的核心产品千易软件全新上线AI商品智能管理功能。该功能深度融合AI技术
2025-10-15 10:39:00
政府点单 企业接单 郑州航空港发布首批45个招商场景清单
大河网讯 近日,郑州航空港正式发布《郑州航空港区2025年第一批招商场景清单》,围绕十大产业集群系统性开放45个具体发展场景
2025-10-15 11:02:00
中国移动咪咕多部短剧获奖,闪耀2025视听中国马栏山微短剧之夜
2025年10月14日,“2025视听中国马栏山微短剧之夜”在湖南圆满落幕。此次活动由中国网络视听协会、湖南省广播电视局
2025-10-15 11:09:00