• 我的订阅
  • 头条热搜
NVIDIA RTX显卡AI推理提速5倍!
...理性能可以跑到每秒319tokens,相比其他后端的每秒61tokens提速足足4.2倍。RTX4090则可以从每秒tokens加速到每秒829tokens,提升幅度达2.8倍。基于强大的硬件性能、丰富的开发生态、广阔的应用场景,NVIDIARTX正成为本地端侧AI不可或缺...……更多
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多
微软研究院推出orca2llm
...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...2.5%,表明了目前基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来,大型基础模型如GPT-4...……更多
AI芯片下半场:英伟达不再一家独大
...)”的新AI芯片组,目的是为ChatGPT等大语言模型的训练及推理提供英伟达芯片之外的替代方案。另据Tom’s Hardware消息,Athena使用的是台积电5nm工艺,专为大语言模型训练设计。 曾有知情人士透露,在开发Athena期间,微软为了满...……更多
intelarca770升级改进ai大模型
IntelArc锐炫虽然初入独立显卡市场,但表现可圈可点,尤其是随着驱动的不断优化,各方面性能都在持续突飞猛进,包括游戏,包括AI。比如最高端的ArcA770,不但集成XMXAI加速功能,还拥有16GBGDDR6大容量显存,非常适合做生成式A...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...可以加快数据处理速度,尤其是在语音和图像识别方面。提速的关键,自然是算力。为了提升算力,微软也是下了血本:采用台积电的5nm制程工艺,晶体管数量达到1050亿个。和今年4月被曝光的信息相比,Maia的制程工艺、设计架...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为微软找到实现这两大梦想的答案。随后,Nadella聚焦Copilot。纳德拉提到了包含随时可用本地API...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...算力是上一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升...……更多
英伟达宣布rtx系列显卡支持微软copilot+计划
...划,宣告了其拥抱人工智能的决心。英伟达宣布其RTX系列显卡将大力支持微软的全新Copilot+计划,该计划旨在为Windows11系统带来一系列强大的本地化功能。IT之家注意到,首批适配的设备包括来自华硕的五款笔记本电脑以及来自...……更多
RTX 40系GPU AI性能首测
...RTX40系列多款型号的显卡、笔记本电脑GPU在StableDiffusion的推理性能表现,其中在ULBenchmarkSD1.5TRTvs.OpenVINO的对比测试中RTX4090笔记本电脑GPU相对于Arc核显有超过27倍的性能提升。使用吐司基准测试完整LoRA模型在StableDif……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就...……更多
...比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU可提供400Gb/s的带...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”,Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图像类型。特点:旨在提供一个全面、多样、复杂的视觉数学推理挑战...……更多
国产低价显卡坞评测:能让轻薄本用上本地大模型
...消息是,尽管CUDA是N卡专属,但这并不意味着A卡不可以AI推理加速,通过DirectML、GGML或者OpenCL,A卡可以绕开这个限制,使用GPU进行AI推理。在这里,我直接选用农企推荐的第三方解决方案LM Studio,这是一个闭源、跨平台和跨供应...……更多
微软:从“软件老大”到“AI帝国”
...Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。这款芯片采用了 5 纳米工艺制造,拥有 1050 亿个晶体管。 Azure Maia 100 美颜照|Microsoft微软自己的DPU——Azure Boost也已全面上市。微软在今年早些时候……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...出世,到后来的百模大战如火如荼,再到如今AI落地换挡提速,围绕算力的“全民焦虑”始终贯穿其间。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力...……更多
AI应用遍地开花,AI应用该如何选择显卡?
...个大家都比较熟悉了,更高的算力意味着计算AI相关模型推理的时候,速度更快、效能更高。但是值得注意的是,硬件架构对应的软件支持在这里也有很重要的地位。比如英伟达的GPU在Stable Diffusion的应用中,专门推出了针对GPU Te...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...,从发现新材料到助力化学合成、生物医药等领域的研发提速,AI将在推动科学进程方面发挥关键作用。 张祺指出,AI新时代,微软正在为广大客户提供的服务和保障。长期以来,微软一直致力于打造全球生态、推动新技术普及...……更多
AI“卖铲人”英伟达,为何业绩再爆发?
...过1亿台RTX的AI PC提供生成式AI功能,包括用于加速大模型推理的Tensor-RT LLM。可以说游戏级显卡让PC端具备部署大模型应用的能力,而英伟达仍是该领域的引领者。 3、汽车业务成为第三增长曲线最新财季英伟达汽车业务收入达到2...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...ckwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款服务...……更多
美国25万一张的显卡,禁止向中国供应!
...模、算法模型的精巧度、数据的质量和数量。AI大模型的推理、训练高度依赖英伟达的GPU芯片。缺少芯片会导致算力不足。算力不足意味着无法处理庞大的模型和数据量。最终的结果是,AI存在智商差距。拿当红的聊天机器人ChatG...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
微软难以摆脱英伟达 |焦点分析
...在其科技大会上发布了两款自研芯片——用于云端训练和推理的AI芯片Azure Maia 100,和CPU(中央处理器)Azure Cobalt 100,分别在AI芯片和CPU芯片上正面对刚英伟达和英特尔。2023年3月ChatGPT火热后,英伟达的AI芯片A100、H100便一卡难求...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...pilot。定制化的Copilot可通过记忆和知识了解上下文背景、推理需要进行的操作和行动,基于用户反馈进行学习,并主动寻求帮助,独立管理复杂、长期运行的业务流程。▲Copilot扩展的专属平台Microsoft Copilot Studio从IT设备采购、销...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
...左右API“价格战”?在降价之外,有媒体指出,加快模型推理速度(即每秒生成Token的数量)也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗?硅谷在“拼”什么?5月中旬,字节跳动豆包以0.0008...……更多
更多关于科技的资讯:
有望命名唐MAX!比亚迪全新MPV曝光:竞争别克GL8
快科技6月21日消息,据媒体报道,一组比亚迪全新MPV车型的伪装实车图被曝光,据车辆细节推测,这款车可能被命名为“唐MAX”
2024-06-21 12:49:00
走进江阴丨江苏江阴:织密“经纬线”打造千亿级高端纺织服装产业集群
高端纺织服装产业是江苏江阴重点打造的千亿级主导产业之一,经过多年的发展,已经构建了从上游原材料生产,中游纺织染齐备,到下游终端销售及品牌打造的全产业链
2024-06-21 13:44:00
腾讯元宝AI搜索解析能力升级:单文档支持1000万文字处理
快科技6月21日消息,据媒体报道,腾讯旗下的AI大模型应用“腾讯元宝”近日进行了重要升级,显著提升了其AI搜索及解析能力
2024-06-21 13:34:00
守住钱袋子,护好幸福家!快来测测你的“防骗能力”吧!
AI骗术来了!你能通过官方“防骗测评”吗?你知道AI骗术吗? 赶快测测你的“防骗意识”吧!今日,由处置非法集资部际联席会议办公室指导
2024-06-21 13:28:00
华为发布“智慧枢纽”解决方案,助力站城融合发展
近日,在2024北京-南京国际城市轨道交通展览会暨高峰论坛期间,华为面向全球发布“智慧枢纽”解决方案,以创新ICT(信息与通信技术)技术助力城轨行业站城融合发展
2024-06-21 13:00:00
中国经济的信心丨邹安康:以科技赋能中小微企业数字化转型
新华网推出“中国经济的信心”大型主题系列采访,对话重点行业领域企业负责人,传递市场声音、提振发展信心、激励使命担当。近日
2024-06-21 13:27:00
比苹果抽成还多!腾讯挑战安卓系手机厂商 重谈分成比例
快科技6月21日消息,据国内媒体报道称,腾讯正挑战安卓系手机厂商,为旗下多款热门手游正重谈分成比例。本周,腾讯旗下游戏《地下城与勇士
2024-06-21 14:04:00
蟑螂开始对杀虫剂无感了 德国蟑螂产生抗药性
6月21日消息,新加坡国立大学、西澳大利亚大学的研究人员在2024年5月20日的《美国国家科学院院刊》(PNAS)上发表的一项研究揭示
2024-06-21 14:04:00
出海不利?vivo被传出售印度子公司
文|罗曾日前,媒体报道提及,vivo印度公司正与印度塔塔集团(Tata Group)展开深入谈判,探讨塔塔集团收购vivo在印度的多数股份并成立合资公司的可能性
2024-06-21 14:22:00
首款骁龙8 Gen3国产平板!一加平板 Pro来了:安卓最强性能
快科技6月21日消息,一加夏季性能生态新品发布会将于6月27日举办,届时,除了发布一加Ace 3 Pro外,还将带来一加平板 Pro
2024-06-21 14:19:00
一加Ace 3 Pro超跑瓷典藏版官宣:陶瓷质感超越万元旗舰
快科技6月21日消息,今天,一加宣布将于6月27日推出一加Ace 3 Pro,这次一加还带来了Ace 3 Pro陶瓷版
2024-06-21 14:34:00
2024全球数字经济大会7月初举行 首设新技术新产品首发首秀
本文转自:中国新闻网中新网北京6月21日电 (记者 吕少威)2024全球数字经济大会将于7月2日至5日在国家会议中心举办
2024-06-21 14:34:00
本文转自:中国新闻网中新网北京6月21日电 (谢雁冰)《全球传播生态蓝皮书:全球传播生态发展报告(2023)》(以下简称“报告”)21日发布
2024-06-21 14:26:00
中国全新高端电动汽车亮相莫斯科
来源:俄罗斯卫星通讯社俄罗斯卫星通讯社莫斯科电据卫星通讯社记者发回报道,中国高端电动汽车ExlantixES亮相莫斯科可再生能源及电动汽车国际展览会(RENWEX)
2024-06-21 14:12:00
Faker评《英雄联盟》阿狸名人堂皮肤:玩得不多、有点贵
日前,T1直落两局战胜DK后,俱乐部工作人员在返程的大巴车上开启直播,队长Faker和队友们聊起了阿狸名人堂皮肤。Q:问下Faker选手
2024-06-21 14:34:00