• 我的订阅
  • 头条热搜
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...元导读】最近,Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路,并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文,但依旧激起了广大网友强...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...正的科学研究需求。 而苹果这次竟然来真的!!就连NLP科学家、AutoAWQ创建者也发出惊叹:Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集也引来网友在线调侃:至于这次开源的意义...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示,合成数据...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...细技术报告。消息一出,社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论:这是OpenAI王座的有力竞争者。 话不多说,一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现,也正如我们刚才所述,32个基准...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...多历史记录。首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...过人类时,AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频,做了一个精彩亮点的总结。一共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业,新公司将专注于构建新的AI模型,首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业,融资近80亿美元!华人科...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...时间,可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称,模型不仅仅拥有训练时的Scaling law,还拥有推理层面的Scaling law,双曲线的共同增长,将突破大模型能力的提升瓶颈。同时,OpenAI表示,思维链...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...是数据分析领域的首个多代理沙盒环境,包含客户、数据科学家、管理员和 AI ChatBot 智能体,通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境,他们开发了 Tapilot-Crossing 基准,它涵盖了从常规代码生成...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...多基准测试中领先,并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日,开...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...了Mistral-7B ,性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar(也是DCLM研发人员)的说法,这是迄今为止性能最好的「真正开源」的模型,不仅有权重和训练代码,而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在多模态大模型赛道的又一力作。图源:X平台Alphabet与G……更多
...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说,我们一直在想如何以更低的算力消耗,提高整个大模型的应用效果,能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文,探讨用小模型监督大模型的方法,为未来超人类AI对齐工作提供支持。K...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...针对任何特定应用(例如对话)进行微调。对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。英伟达高级科学家Jim Fan表示,(这是)有史以来最大的开源大模型,由世界一流的团队训练。 ……更多
人工智能训练师与数据科学家的区别
...工智能和数据科学的快速发展中,人工智能训练师和数据科学家这两个职业常常被混淆。尽管两者在工作中有许多交集,但其核心职责和专业侧重点却有所不同。今天我们将深入分析人工智能训练师与数据科学家的区别,帮助读...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...证明,模型的自我提升可以摆脱对人类监督的依赖。 Meta科学家Yann LeCun也转发了这篇研究,并亲自下场玩起了双关梗——Meta提出的Meta-Judge,FAIR能否实现fair?研究不重要,重要的是Meta FAIR这一波曝光率拉满了。元奖励(Meta-Rewar...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只有头部几个有价值。 英伟达科学家Jim F……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...高1000倍在IEEE文章中,台积电董事长刘德音及台积电首席科学家H.-S Philip Wong讲述了台积电是如何达成1万亿晶体管芯片的目标。文章指出,从1997年击败国际象棋人类冠军的IBM深蓝超级计算机,到2023年爆火的ChatGPT,再过15年,人工...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。作者简介本文的通讯作者Zechun Liu是Meta Reality Labs的研究科学家。她本科毕业于复旦大学,博士毕业于香港科技大学,加入Meta前曾有两年多的时间在CMU担任访问学者。Zechun的研究兴趣是深度学习在现实场景中的应用,例如资源...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...智能研究所汇聚了数十名智能科学与机器人领域顶尖青年科学家,依托鹏城云脑、中国算力网等自主可控 AI 基础设施,致力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台,赋能工业互联网、...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...计算力。”针对GPT-4o强大的多模态能力,英伟达高级研究科学家JimFan发表长文表示,从技术角度来看,这需要对标记化和架构进行一些新的研究,但总体上是一个数据和系统优化问题。在JimFan看来,GPT-4o很可能是GPT-5的一个早期...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
对话百图生科首席AI科学家宋乐博士:“xTrimo”生命科学AI大模型,不应止于加速药物研发
...造?为了解答上述问题,3月3日下午百图生科CTO、首席 AI 科学家宋乐博士与36氪等多家媒体进行了交流。百图生科CTO、首席 AI 科学家宋乐博士据介绍,百图生科推出的“xTrimo”(Cross-modal Transformer Representation of Interactome……更多
纽约大学教授 Nature 发文:为了科学界的未来
...作为一名正在使用并教授如何使用这些模型的政治和数据科学家,我认为学者们应该保持警惕,因为目前最受大众追捧的语言模型仍然是私有且封闭的,即由公司运营,他们不会披露基本模型的具体信息,只会独立地检查或验证...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...千呼万唤中面世。△图源:谷歌一个月前,英伟达的资深科学家Jim Fan就为Gemini捏了把汗:“人们对谷歌Gemini的期望高得离谱!”他表示,Meta要惊艳世界的话,只要让Llama 3开源就好了。但谷歌想要重夺当年AlphaGo的辉煌,Gemini不...……更多
全国首个 DNA 存储领域预训练大模型“ChatDNA”发布
...智能可以帮助我们更快地研究特定基因组的变异和功能。科学家可以使用人工智能算法来分析大量的DNA序列,从而发现有价值的变异和基因功能,为疾病的治疗提供线索。DNA是生物世界中存在的最基础而又重要的分子,而人工智...……更多
用「AI人」模拟社会学实验,居然成功了?斯坦福、NYU用GPT-4模仿人类,准确度惊人!
...会学、社会政策、公共卫生、传播学)的77名社会和行为科学家设计,并测试了许多不同类型的实验治疗的效果(例如框架效应、显着性)主题、启动社会身份对一系列结果(如政治、文化和宗教态度、对少数群体的偏见、幸福...……更多
更多关于科技的资讯:
人社部:持续动态调整职业分类体系 每年征集发布一批新职业信息
本文转自:人民网秦榕人社部:持续动态调整职业分类体系 每年征集发布一批新职业信息
2024-09-24 20:06:00
日本车企开始布局插混市场
在当前的全球新能源汽车市场,纯电车型似乎遇到了一些发展阻碍,而可油可电的插混车型,则成为了不少人的选择。据日经中文网报道
2024-09-24 20:17:00
小米15系列两大机型已通过认证,支持90w快充
近日,CNMO注意到,小米通讯技术有限公司旗下一款型号为“2410DPN6CC”的5G数字移动电话机已经正式通过了认证
2024-09-24 20:18:00
苹果将九款mac设备列入“老旧”产品名单
近日,苹果正式将九款2015年和2016年发布的Mac电脑列为“过时”产品,同时将另外三款稍新的机型列入“老旧”产品名单
2024-09-24 20:20:00
A-dec 与 Baklib 的合作:创新知识管理,推动业务
总部位于俄勒冈州波特兰市的牙科设备制造商A-dec不直接向牙科诊所销售产品,而是向分销商销售,分销商再将设备提供给个人和团体牙科诊所
2024-09-24 20:20:00
美国老哥用一杯大便熏跑比赛对手!赢了一辆车
老话说得好,拖把沾屎如同吕布在世,有些时候人类最原始的攻击往往最具杀伤力。最近在美国一位老哥就深谙此道,原本是一场比拼耐力的游戏
2024-09-24 20:28:00
iqooz9turbo+屏幕介绍
iQOO新品发布会正在进行中,目前正在介绍iQOOZ9Turbo+的屏幕部分。iQOOZ9Turbo+配备了旗舰级华星光电C8发光材料的屏幕
2024-09-24 20:28:00
蔚来李斌:欧美对中国新能源汽车行业征收关税是没有道理的
快科技9月24日消息,据报道,蔚来汽车创始人、董事长兼CEO李斌在采访中谈到欧美对中国新能源汽车征收关税的看法:最近不管是欧洲还是美国
2024-09-24 20:28:00
iqooz9turbo+续航测试
iQOOZ9Turbo+搭载了天玑9300+处理器,这是一款安卓旗舰级处理器,其全大核CPU架构设计,包括4个Cortex-X4超大核和4颗主频稳定在2
2024-09-24 20:28:00
小米15pro通过3c认证:支持90w快充
近日,小米15Pro手机通过3C认证入网的消息引发了广泛关注。据悉,小米15(24129PN74C)已于上周通过该认证
2024-09-24 20:32:00
小米15系列有望在10月份正式与广大消费者见面
根据多方报道,小米15系列将成为首批搭载高通骁龙8Gen4移动平台的智能手机,并且有望在10月份正式与广大消费者见面。值得关注的是
2024-09-24 20:33:00
AI 引领客户服务转型,Baklib 的实践与探索
在当前的技术环境中,人工智能(AI)确实处于一个显著的炒作周期中。许多专业人士,如Baklib的数字化转型高级总监,指出AI并不是新兴事物
2024-09-24 20:35:00
女子解锁一部被锁定了近十年的iphone4s
一位江苏女生在社交媒体上分享了一段视频,内容关于她即将解锁一部被锁定了近十年的iPhone4s手机。视频中,她介绍道:“这是我曾经的iPhone4s
2024-09-24 20:37:00
探索下一代客户服务,Baklib 的创新解决方案
我们的新经济现实是竞争加剧、消费者知情且要求苛刻、产品和服务商品化以及削减成本的无情压力。在这种环境下,客户服务是市场上最大的差异化因素
2024-09-24 20:49:00
大疆osmoaction5pro运动相机具体表现如何
为了让广大消费者都能在国庆出游前获得最新的出游装备,京东上线大疆新品超旗舰画质运动相机OsmoAction5Pro,其中标准套装售价2598元
2024-09-24 20:55:00