• 我的订阅
  • 头条热搜
谷歌发布gemma2大语言模型,共有两种大小
...布新闻稿,面向全球研究人员和开发人员发布Gemma2大语言模型,共有90亿参数(9B)和270亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
开源大模型赛道迎来重磅新品。当地时间2月21日,谷歌宣布正式推出全新的开源大语言模型(LLM)“Gemma”, 旨在帮助开发人员和研究人员负责任地构建人工智能。据介绍,Gemma大模型与谷歌规模最大、能力最强的人工智能模型...……更多
英伟达新版旗舰AI芯片售价炒到4万美金 “算力垄断”难被打破
GPT等大型语言模型带动的芯片需求飙升趋势依然没有平息的迹象。英伟达的最新版旗舰AI芯片H100近日在网上的售价已经被炒到4万多美金,反映了科技行业对训练和部署人工智能软件的需求仍未被满足。受AI芯片需求的提振,英...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...MatX正在挑战英伟达在AI芯片领域的霸主地位,其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示,使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该公司还预言,使用其芯片训练,能够让世界上最好的...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
英伟达发布mistral-nemoai大语言模型
...国初创公司MistralAI,今天发布了全新的Mistral-NeMoAI大语言模型,拥有120亿个参数,上下文窗口(AI模型一次能够处理的最大Token数量)为12.8万个token。VentureBeat与Midjourney合作制作Mistral-NeMoAI大模型主要面向企业环境,让企……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为...……更多
烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
整理 | 苏宓出品 | CSDN(ID:CSDNnews)都说 ChatGPT 这种大模型研发是大公司之间的博弈,不仅仅是因为其要消耗的算力巨大,也是因为需要有强大的资金支撑。那么,加入这场战局,究竟要花费多少钱?此前,据 Techcrunch 报道,有...……更多
英伟达llama-3.1-minitron4bai模型发布
...,英伟达公司联合Meta公司发布了最新的Llama-3.1-Minitron4BAI模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出40亿参数的“小而强”模型。图源:英伟达Llama-3.1-Minitron4B模型在Llama-3.1-Minitron8B基础上……更多
英伟达发布80亿参数的ai模型
...伟达(NVIDIA)宣布,其已成功研发并发布了一款全新的AI模型,该模型拥有高达80亿的参数规模,具备精度高、计算效率高等优点,可在GPU加速的数据中心、云和工作站上运行。据介绍,这款新发布的AI模型是基于英伟达在深度学...……更多
英伟达:CPU已落伍 用GPU训练大语言模型成本可降低96%
...上的演讲,该公司宣称其 GPU 可以大幅降低训练大型语言模型(LLM)的成本和耗能。英伟达首席执行官黄仁勋在演讲中,向 CPU 行业发起了挑战,他认为生成式人工智能和加速计算是未来计算的方向。他宣布传统的摩尔定律已经...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款...……更多
GPU受限,国内AI大模型能否交出自己的答卷?
这个4月,成为国产大模型混战期。继百度之后,阿里、华为、京东、360等大模型也陆续浮出水面,大模型军备竞赛正式开启。4月7日,阿里云宣布自研大模型“通义千问”开始邀请企业用户测试体验。4月8日,华为云人工智能领...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
微软拟推出人工智能芯片,训练大模型语言
...出人工智能芯片,为负责理解和生成类人语言的大型语言模型(LLM)提供动力。报道称,了解相关项目的人士透露,微软自2019年开始开发内部代号为“雅典娜”(Athena)的芯片。并已向一小部分微软与OpenAI员工提供这款芯片,...……更多
AI“卖铲人”英伟达,为何业绩再爆发?
...智能在2023迎来爆发,生成式AI以ChatGPT为代表掀起全球大模型浪潮,全球各行业的算力需求激增。英伟达GPU作为主流AI训练解决方案使其成为最大受益者,实现量价双收。英伟达财报也揭示了未来发展战略的三大方向:一是以数据...……更多
英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%
...两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更换成最新的H200。全世界的AI公司都陷入算力荒,英伟达的GPU已经千金难求。英伟达此前也表示,两年一发布的架构节奏将转变为一年一发布。 就...……更多
英伟达尖端图像处理半导体h200开始供货
...英伟达方面公布的性能评测结果,以Meta公司旗下大语言模型Llama2处理速度为例,H2000相比于H100,生成式AI导出答案的处理速度最高提高了45%。市场调研机构Omdia曾表示,2022年英伟达在AI半导体市场约占8成的份额,与此同时AMD等...……更多
微软难以摆脱英伟达 |焦点分析
...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用,就必须大量购入英伟达的芯片。而英伟达的产能有限,按照上一年计划制定的供给,远不能满足蓬勃的市场需求,抢不到芯片的云厂商、...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的速度快40%,在推理端比英伟达H100快50%。基辛格在现场...……更多
程序员福音 英伟达推出AI编程新模型:代码生成、补全、调试样样精通!
程序员福音 英伟达推出AI编程新模型:代码生成、补全、调试样样精通!快科技2月29日消息,近日英伟达和Hugging Face、ServiceNow一起发布了StarCoder2模型,代码生成、补全、调试样样精通。据介绍,系列模型包括一个ServiceNow训练...……更多
Meta首次公布AI芯片细节 功耗低于英伟达
...)计划的一部分,主要用于提升广告投放和其他内容推荐模型的效率。据Meta介绍,首个MTIA芯片将专注于AI推理。Meta软件工程师Joel Coburn表示,Meta最初考虑将GPU用于推理任务,但后来发现GPU并不不太适合推理工作。“GPU在真实模...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
AI芯片下半场:英伟达不再一家独大
...开发者大会上,推出两款定制芯片,以应对不断增加的大模型训练成本挑战,并试图降低提供AI服务的成本。微软表示,新发布的芯片不会出售,仅供支持自己的产品,并作为微软云Azure云计算服务的一部分。微软最新推出的两...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多
AI春晚:黄仁勋称需要更强大的GPU,马斯克吹捧英伟达最适合AI
...介绍最新AI芯片GB200等产品外,黄仁勋还谈到了对于AI、大模型和机器人未来的一些展望。“算力需求”在演讲中,黄仁勋重申了自己在此前财报中提出的观点:“加速计算已经达到引爆点——通用计算已经到达瓶颈。”不到一个...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
英伟达blackwell计算引擎制造商推出的ai模型
...最新这代Blackwell计算引擎的出炉,面向生成式AI的大语言模型则进一步推动架构的发展,强调不断压缩更大规模AI训练与推理工作负载的处理成本。英伟达公司超大规模与HPC副总裁IanBuck在大会前的简报中解释道,“在过去的2023年...……更多
更多关于科技的资讯:
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-08-27 09:52:00
黑神话悟空背后140人:华科校友带队,核心团队平均合作超10年
一只黑吗喽引爆全世界,在座的都是天命人。国内首款顶级3A大作《黑神话:悟空》一上线,就创下诸多纪录,不仅快速成为多平台销量榜首
2024-08-27 09:52:00
49位科学家上榜,清华方璐、复旦周鹏等获得科学探索奖
今年获奖年龄平均 41 岁。今天,第六届科学探索奖获奖名单正式公布,共 49 位青年科学家获奖。科学探索奖设立于 2018 年
2024-08-27 09:53:00
合合信息:智能文档处理技术助力大学生探索AI创新边界
谈“糖”色变、追求养生、低卡生活……这些热门词汇频频在社交媒体上掀起讨论热潮。有这样一批年轻人不但捕捉到了这些词汇背后真实的用户需求
2024-08-27 10:45:00
36氪研究院 | 2024年中国烤鱼行业消费者洞察报告
烤鱼发源于川渝地区,历史悠久,是我国传统美食之一。历经百年发展,烤鱼逐渐形成腌、烤、炖三种有机结合的烹饪手法,口味也由最初的麻辣拓展至番茄
2024-08-27 11:11:00
4名MIT学霸两年造AI编程帝国,撼动全球2600万开发者!成立2年估值4亿美金
【新智元导读】4名MIT本科生创业,才两年公司就已经估值4亿美元。开发AI编码助手Cursor的Anysphere,最近在A轮融资中已经筹集超6000万美元
2024-08-27 11:55:00
数学系本科生卧室手搓「核聚变反应堆」,Claude 3.5立大功!0基础,狂肝1个月
【新智元导读】前段时间,Claude 3.5帮助右手骨折工程师一周肝出3000行代码。现在,又有00后数学系本科生借助AI
2024-08-27 12:02:00
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
【新智元导读】微调的所有门道,都在这里了。开源,就要开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发
2024-08-27 12:03:00
打破AlphaFold大模型局限,世界最大蛋白质相互作用数据集AlphaSeq横空出世
【新智元导读】虽然AlphaFold等系列的大模型已经在蛋白质预测方面取得了前所未有的突破,但依旧无法胜任蛋白质-蛋白质相互作用(PPI)这种复杂的任务
2024-08-27 13:32:00
脑机接口“升级”赛博人类!AI挑战燃爆《天府工匠》第三季
当前,我国人工智能产业蓬勃发展,在给各领域注入发展驱动力、促进产业转型升级的同时,也为加快形成新质生产力提供了重要支撑
2024-08-27 13:38:00
特斯拉CEO马斯克呼吁加州加强AI监管,市场关注国际贸易动态
特斯拉与AI监管:马斯克的倡议特斯拉(TSLA)首席执行官埃隆·马斯克(Elon Musk)周一在社交媒体上再次表达了他对人工智能(AI)监管的坚定立场
2024-08-27 13:38:00
第二十六届中国机器人及人工智能大赛全国决赛(宜兴)圆满结束
8月25日,第二十六届中国机器人及人工智能大赛全国决赛(宜兴)圆满结束。来自清华大学、哈尔滨工业大学、浙江大学、国防科技大学
2024-08-27 13:38:00
每年节约上亿元!法大大“音视频双录”助力深圳营商环境优化
8月26日,深圳经济特区迎来44周岁。深视新闻栏目推出系列报道,首篇便聚焦改革,并重点呈现了“音视频双录签名模式”如何帮助营商环境优化
2024-08-27 11:00:00
《逆水寒》手游玩家自创智能NPC突破500万!超过100个国家人口
近日,国内知名MMO游戏《逆水寒》手游上线了开创性的“自捏AI江湖友人”玩法,短短3天收件,玩家自创的智能NPC就突破了500万
2024-08-27 11:00:00
SpaceX首次私人太空行走任务推迟:火箭氦气泄漏
快科技8月27日消息,据媒体报道,SpaceX公司在其社交平台上发布推文,备受瞩目的“北极星黎明”(Polaris Dawn)任务将因技术原因微调日程
2024-08-27 11:00:00