• 我的订阅
  • 头条热搜
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...元导读】最近,Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路,并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文,但依旧激起了广大网友强...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...正的科学研究需求。 而苹果这次竟然来真的!!就连NLP科学家、AutoAWQ创建者也发出惊叹:Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集也引来网友在线调侃:至于这次开源的意义...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示,合成数据...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...细技术报告。消息一出,社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论:这是OpenAI王座的有力竞争者。 话不多说,一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现,也正如我们刚才所述,32个基准...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...多历史记录。首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试,通过270个基于90篇跨学科科学论文的任务,可评估AI智能体在计算可重复性方面的表现,最简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...过人类时,AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频,做了一个精彩亮点的总结。一共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...个例子,在 Kaggle 数据科学竞赛中(如图 1 所示),数据科学家需要遵循一个结构化的工作流程:收集、清理、预处理和标准化数据,创建数据加载器以实现高效管理,生成关键评估指标,以及开发自定义模型。然后,这些见解...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业,新公司将专注于构建新的AI模型,首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业,融资近80亿美元!华人科...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主要集中在深度学习、计算机视觉和多模态模型等方向,曾发表多项具有深远影响力的成果,例如AttnGAN、OSCAR...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...时间,可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称,模型不仅仅拥有训练时的Scaling law,还拥有推理层面的Scaling law,双曲线的共同增长,将突破大模型能力的提升瓶颈。同时,OpenAI表示,思维链...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...是数据分析领域的首个多代理沙盒环境,包含客户、数据科学家、管理员和 AI ChatBot 智能体,通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境,他们开发了 Tapilot-Crossing 基准,它涵盖了从常规代码生成...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...多基准测试中领先,并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日,开...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...了Mistral-7B ,性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar(也是DCLM研发人员)的说法,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在多模态大模型赛道的又一力作。图源:X平台Alphabet与G……更多
...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文,探讨用小模型监督大模型的方法,为未来超人类AI对齐工作提供支持。K...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...针对任何特定应用(例如对话)进行微调。对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。英伟达高级科学家Jim Fan表示,(这是)有史以来最大的开源大模型,由世界一流的团队训练。 ……更多
人工智能训练师与数据科学家的区别
...工智能和数据科学的快速发展中,人工智能训练师和数据科学家这两个职业常常被混淆。尽管两者在工作中有许多交集,但其核心职责和专业侧重点却有所不同。今天我们将深入分析人工智能训练师与数据科学家的区别,帮助读...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...证明,模型的自我提升可以摆脱对人类监督的依赖。 Meta科学家Yann LeCun也转发了这篇研究,并亲自下场玩起了双关梗——Meta提出的Meta-Judge,FAIR能否实现fair?研究不重要,重要的是Meta FAIR这一波曝光率拉满了。元奖励(Meta-Rewar...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只有头部几个有价值。 英伟达科学家Jim F……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...高1000倍在IEEE文章中,台积电董事长刘德音及台积电首席科学家H.-S Philip Wong讲述了台积电是如何达成1万亿晶体管芯片的目标。文章指出,从1997年击败国际象棋人类冠军的IBM深蓝超级计算机,到2023年爆火的ChatGPT,再过15年,人工...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。作者简介本文的通讯作者Zechun Liu是Meta Reality Labs的研究科学家。她本科毕业于复旦大学,博士毕业于香港科技大学,加入Meta前曾有两年多的时间在CMU担任访问学者。Zechun的研究兴趣是深度学习在现实场景中的应用,例如资源...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...智能研究所汇聚了数十名智能科学与机器人领域顶尖青年科学家,依托鹏城云脑、中国算力网等自主可控 AI 基础设施,致力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...飞也曾短暂进入工业界,出任谷歌副总裁即谷歌云AI首席科学家。她一手推动了谷歌AI中国中心正式成立,这是Google在亚洲设立的第一个AI研究中心。并带领谷歌云推出了一系列有影响力的产品,包括AutoML、Contact Center AI、Dialogflow...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...计算力。”针对GPT-4o强大的多模态能力,英伟达高级研究科学家JimFan发表长文表示,从技术角度来看,这需要对标记化和架构进行一些新的研究,但总体上是一个数据和系统优化问题。在JimFan看来,GPT-4o很可能是GPT-5的一个早期...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
...工程师简化了上述所有复杂环节。它的目标不是取代数据科学家或工程师,而是与人类合作并处理所有繁重任务。在人与 AI 合作的工作环境中,人们仅用几个小时就能完成一周的工作。听起来有点像今年 3 月在 AI 社区爆火的首...……更多
更多关于科技的资讯:
这种螨虫的雄性出生就死亡 而雌性却每次都进行有性生殖
寄生虫的世界非常有趣,为了配合自己寄生的生活方式,许多寄生虫在我们看来都显得非常独特!△ 蓟马在中东地区有一种叫蓟马小昆虫
2025-02-13 23:51:00
看着都疼!女子10根手指戴了10枚戒指 全部套牢卡死
快科技2月13日消息,近日,据中山消防消息,在广东省中山市第三人民医院发生了一起紧急救援事件。一名女病人因戒指卡手而急需救助
2025-02-13 23:51:00
无论百度还是阿里 这波最急的可能是苹果。。。
众所周知,每次当马云马老师这边传出来什么消息,中国互联网上都要掀起一阵波澜。这不, 11 号马云穿着马甲现身西溪园区的照片刚一刷屏
2025-02-14 00:21:00
牵手阿里后 苹果仍在继续与百度合作:为国行iPhone落地AI
快科技2月14日消息,阿里官方已经确认目前正在与苹果合作,针对中国市场进行本地化AI接入。对于能够与苹果合作,蔡崇信表示阿里非常幸运
2025-02-14 00:21:00
iPhone SE 4真要来了!库克官宣:苹果2月19日发布新品
快科技2月14日消息,库克今天突然官宣,苹果将会在2月19日发布新产品。虽然目前尚未公布具体产品,但是结合近期多方爆料来看
2025-02-14 00:21:00
科大讯飞:纯国产算力的星火X1新版本要来了 能力超OpenAI o1
快科技2月13日消息,近日,在一次机构调研中,科大讯飞透露了其最新的研发进展:公司正在全力训练的纯国产算力平台“星火X1”新版本
2025-02-14 00:21:00
比尔盖茨自述曾是熊孩子:16岁徒步数百英里 边走脑中边写BASIC代码
步入70岁之际,比尔·盖茨终于出版了自己人生中的首部自传《源代码》。不同于以往的商业发展视角,无关对微软成就的宏大叙事
2025-02-14 00:51:00
12306回应特价车票:没有查询特价车票的网页
快科技2月13日消息,近期,特价火车票引起网友热议,有媒体报道称,从大城市出发到中西部地区的部分线路及小城市之间却出现不少打折车票
2025-02-14 00:51:00
靠AI 90分钟做出来的WikiTok 维基百科+抖音会让我知识成瘾吗
如何克服狂刷短视频带来的时间黑洞?屏幕健康、数字极简都太好用。如今,出现了一个新应用,想用魔法打败魔法:不是爱刷下一条吗
2025-02-14 01:21:00
聚焦现代旅游业体系建设 | 案例 · “AI游贵州”推动智能旅游服务再升级
上海游客张妍计划今年夏天携家人来贵州避暑,提前半年规划行程。当了解到“AI游贵州”这个智能小程序后,她立马咨询AI规划了9天8晚的自驾线路
2025-02-14 01:25:00
波音737客机起飞途中与皮卡车相撞:皮卡秒变敞篷车
快科技2月14日消息,据报道,当地时间2月11日,巴西GOL航空一架737 MAX 8(PS-GPP)在巴西里约热内卢加利昂机场滑跑起飞时
2025-02-14 01:51:00
国产重载AGV加速出海
本文转自:人民日报海外版本报记者 孙 懿广东嘉腾机器人自动化有限公司生产的八十吨重载自动导引车。受访企业供图天津朗誉机器人有限公司生产的80吨智慧矿山AGV
2025-02-14 04:48:00
“你有多久没吃过徐福记”,昔日零食钉子户成时代眼泪了?
原标题 | 广东糖果大王,过了个豪横春节你有多久没吃过徐福记了?今年春节,各个超市都迎来了意料之内的排队火爆,胖东来、山姆等年后几天人山人海
2025-02-14 05:26:00
本文转自:人民日报海外版上海徐汇区大模型产业加速发展人工智能引燃“模都”“语料创新技术与应用探索沙龙活动”“多模态大模型应用研讨会”“AI赋能下的开发流程蜕变”……走进位于徐汇西岸的模速空间创新生态社区
2025-02-14 04:50:00
“年轻态”,老品牌找准新方向(经济新方位·品牌的故事(下))
本文转自:人民日报糕点联名“悟空”、童车“马卡龙”风、直播手表穿搭——“年轻态”,老品牌找准新方向(经济新方位·品牌的故事(下))本报记者  王伟健  姜泓冰  李家鼎天津电商节上
2025-02-14 06:08:00