• 我的订阅
  • 头条热搜
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...元导读】最近,Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路,并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文,但依旧激起了广大网友强...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...正的科学研究需求。 而苹果这次竟然来真的!!就连NLP科学家、AutoAWQ创建者也发出惊叹:Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集也引来网友在线调侃:至于这次开源的意义...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示,合成数据...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...细技术报告。消息一出,社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论:这是OpenAI王座的有力竞争者。 话不多说,一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现,也正如我们刚才所述,32个基准...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...多历史记录。首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试,通过270个基于90篇跨学科科学论文的任务,可评估AI智能体在计算可重复性方面的表现,最简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...过人类时,AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频,做了一个精彩亮点的总结。一共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...个例子,在 Kaggle 数据科学竞赛中(如图 1 所示),数据科学家需要遵循一个结构化的工作流程:收集、清理、预处理和标准化数据,创建数据加载器以实现高效管理,生成关键评估指标,以及开发自定义模型。然后,这些见解...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业,新公司将专注于构建新的AI模型,首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业,融资近80亿美元!华人科...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主要集中在深度学习、计算机视觉和多模态模型等方向,曾发表多项具有深远影响力的成果,例如AttnGAN、OSCAR...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...时间,可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称,模型不仅仅拥有训练时的Scaling law,还拥有推理层面的Scaling law,双曲线的共同增长,将突破大模型能力的提升瓶颈。同时,OpenAI表示,思维链...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...是数据分析领域的首个多代理沙盒环境,包含客户、数据科学家、管理员和 AI ChatBot 智能体,通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境,他们开发了 Tapilot-Crossing 基准,它涵盖了从常规代码生成...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...多基准测试中领先,并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日,开...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...了Mistral-7B ,性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar(也是DCLM研发人员)的说法,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在多模态大模型赛道的又一力作。图源:X平台Alphabet与G……更多
...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文,探讨用小模型监督大模型的方法,为未来超人类AI对齐工作提供支持。K...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...针对任何特定应用(例如对话)进行微调。对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。英伟达高级科学家Jim Fan表示,(这是)有史以来最大的开源大模型,由世界一流的团队训练。 ……更多
人工智能训练师与数据科学家的区别
...工智能和数据科学的快速发展中,人工智能训练师和数据科学家这两个职业常常被混淆。尽管两者在工作中有许多交集,但其核心职责和专业侧重点却有所不同。今天我们将深入分析人工智能训练师与数据科学家的区别,帮助读...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...证明,模型的自我提升可以摆脱对人类监督的依赖。 Meta科学家Yann LeCun也转发了这篇研究,并亲自下场玩起了双关梗——Meta提出的Meta-Judge,FAIR能否实现fair?研究不重要,重要的是Meta FAIR这一波曝光率拉满了。元奖励(Meta-Rewar...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只有头部几个有价值。 英伟达科学家Jim F……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...高1000倍在IEEE文章中,台积电董事长刘德音及台积电首席科学家H.-S Philip Wong讲述了台积电是如何达成1万亿晶体管芯片的目标。文章指出,从1997年击败国际象棋人类冠军的IBM深蓝超级计算机,到2023年爆火的ChatGPT,再过15年,人工...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。作者简介本文的通讯作者Zechun Liu是Meta Reality Labs的研究科学家。她本科毕业于复旦大学,博士毕业于香港科技大学,加入Meta前曾有两年多的时间在CMU担任访问学者。Zechun的研究兴趣是深度学习在现实场景中的应用,例如资源...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...智能研究所汇聚了数十名智能科学与机器人领域顶尖青年科学家,依托鹏城云脑、中国算力网等自主可控 AI 基础设施,致力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...飞也曾短暂进入工业界,出任谷歌副总裁即谷歌云AI首席科学家。她一手推动了谷歌AI中国中心正式成立,这是Google在亚洲设立的第一个AI研究中心。并带领谷歌云推出了一系列有影响力的产品,包括AutoML、Contact Center AI、Dialogflow...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...计算力。”针对GPT-4o强大的多模态能力,英伟达高级研究科学家JimFan发表长文表示,从技术角度来看,这需要对标记化和架构进行一些新的研究,但总体上是一个数据和系统优化问题。在JimFan看来,GPT-4o很可能是GPT-5的一个早期...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
对话百图生科首席AI科学家宋乐博士:“xTrimo”生命科学AI大模型,不应止于加速药物研发
...造?为了解答上述问题,3月3日下午百图生科CTO、首席 AI 科学家宋乐博士与36氪等多家媒体进行了交流。百图生科CTO、首席 AI 科学家宋乐博士据介绍,百图生科推出的“xTrimo”(Cross-modal Transformer Representation of Interactome……更多
更多关于科技的资讯:
狂卷能效与实用,三星进博会大秀 AI+冰洗家电全新可能
11月5日至10日,第七届进博会在上海举办,本届进博会吸引了来自129个国家和地区的3496家展商参加,其中包括297家世界500强和行业龙头企业
2024-11-13 20:18:00
7050mAh超大容量电池!这款即将发布的新机电池可太期待了
此前就有爆料消息称,即将会发布一款搭载最新的骁龙8至尊版芯片,而且电池容量突破7000mAh的手机,而今日,这个消息得到确认
2024-11-13 20:18:00
苹果神秘原型机曝光 设计比iPhone 16还激进
不久前,AppleDemoYT频道分享了一台iPhone原型机,它背面没有苹果Logo,电源按键、音量按键均采用固态按键
2024-11-13 20:18:00
售价不到4000元?曝iPhone SE 4相机模组即将量产
之前有传闻iPhoneSE4将会在明年发布,但一直没有直接的证据。而近日海外媒体获取到最新消息,苹果的相机供应商LGInnotek已经在进行量产前的测试工作
2024-11-13 20:18:00
PS5游戏主机热披萨 必胜客做到了!
大家都知道游戏主机在运行时会产生大量废热,那有没有办法变废为宝,加拿大必胜客做到了,它推出了一个利用PS5Slim废热保温披萨的设备——PIZZAWARM
2024-11-13 20:19:00
NVIDIA全力生产RTX 50系显卡:40系只有独苗
NVIDIA预计将会在2025年发布新一代RTX50系显卡,预计为CES2025上发布,而如今为了让RTX50系显卡能够更好地满足用户的需求
2024-11-13 20:19:00
小米折叠屏手机遭遇冰火两重天,小折叠卖爆,大折叠或暂停发布
今年7月份,小米召开新品发布会发布了小米MIXFold4以及小米MIXFlip两款折叠屏手机,虽然是同台发布,但是这两款折叠屏手机在市场上的销售情况可谓是天差地别
2024-11-13 20:19:00
美光亮相进博会:西安工厂已实现100%可再生能源电力使用
每年的进博会都是各大企业秀出自己肌肉的地方,特别是对于科技企业来说,通过展示最新的科技技术让客户了解到自身强大的研发实力
2024-11-13 20:20:00
外媒锐评索尼无人机失败:成本超两万美元,体验被DJI吊打
在上周,索尼宣布在2025年停产AirpeakS1无人机,暗示其将退出无人机赛道。由于大疆DJI的强势,国内还难看到AirpeakS1
2024-11-13 20:20:00
小透明也要出新品:AMD Radeon移动显卡曝光
AMD目前在CPU领域可以说如鱼得水,锐龙处理器的销量也是节节攀升,然而相比较CPU的大胜,AMD在显卡领域就十分地小透明
2024-11-13 20:20:00
视频和连拍性能都不变?索尼A1 II的惊喜或许翻转屏和定价上
最近已有许多外媒消息表示,索尼本月即将开办的α特别活动上可能会正式推出新一代旗舰微单A1II,目前这款相机的外观谍照和部分配置信息已曝光出来
2024-11-13 20:20:00
谷歌内部文件泄露,曝光为何采用定制芯片,因高通太贵!
从谷歌Pixel6系列开始,谷歌就开始给自家的手机使用定制的Tensor系列芯片,然而Tensor系列芯片的性能无法与同期的其他旗舰芯片竞争
2024-11-13 20:20:00
iQOO Neo 10系列双芯策略,将和K80系列竞争!
大约十天前,iQOO在中国推出了搭载骁龙8Elite处理器的iQOO13。如今,品牌正式预告了即将发布的Neo10系列中端旗舰手机
2024-11-13 20:21:00
苹果(Apple)的智能眼镜项目启动了,但估计需要3-5年!
今年早些时候,苹果推出了备受期待的VisionPro,但这款产品并未如预期那样取得全面成功。如今,有报道称苹果正在筹备一项颠覆性的智能眼镜项目
2024-11-13 20:21:00
Realme 14系列即将登场:新成员Pro Lite 5G
Redmi已经推出了其Note14系列,而竞争对手Realme则计划在明年初发布Realme14系列,看来他们还准备为这个系列增添新成员
2024-11-13 20:21:00