• 我的订阅
  • 头条热搜
华为联合WPS AI,见证昇腾大模型推理应用启航
...场,华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...后,开发者们甚至还发现,Reflection可能就是个「套壳」模型,而且还是连套三家的那种(Claude/GPT/Llama)。这下子,Reddit和X等平台上,立刻掀起了质疑的声浪。 左右滑动查看为此,Shumer承诺将和Glaive创始人Sahil Chaudhary一起调查...……更多
...文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等...……更多
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
...行围观。他提出了一项名为“noise_step”的新技术,允许模型直接在1.58-bit低精度下训练,且无需反向传播或动量(Momentum)加速,从而降低算力和存储消耗。对此,网友们也纷纷发来祝贺,表示很高兴看到模型越来越具有性价比...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
...道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。据媒体报道,在AI领域,字节跳动的这一做法通常被视为一种“失礼”行为,也直接违反了OpenAI的...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
国产大模型首次在公开榜单上超过GPT-4o!就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6,数学分榜并列第3,...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五...……更多
...划的路线图,就是通过大量堆砌算力,建立多模态通用大模型。同时,其压制中国AI发展的思路,也是通过限制芯片这一算力的核心而来。 但经过两年发展,美国限制措施并没有取得预想中“拦腰斩断”的效果。据《华尔街日报...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
就在刚刚,云计算一哥亚马逊云科技,在大模型这件事儿上搞了波大的——亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐...……更多
Llama3.1训练平均3小时故障一次,H100万卡集群好脆弱
...硬件问题导致。而且GPU问题最严重,占了58.7%。Llama 3.1 405模型是在一个含16384块Nvidia H100 80GB GPU集群上进行训练的。虽说针对大规模系统有句老话:唯一确定的就是会出故障。但这一问题还是引起不少网友关注。放慢速度,check一...……更多
阿里云的AI路线图
...“未来,云计算的算力都会被这些智能时代的电动机——模型消耗掉。”不过,在王坚看来,2023年人工智能和云计算有了一次集中体现和爆发后,第三次浪潮不会在一两年内完成,而是需要十年、几十年的时间。 阿里云将在其...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation...……更多
小扎新开源的Llama3.1,要带着套壳大模型追平GPT-4o?
...,开源 AI 界扛把子 Meta AI ,昨晚更新他们最新最强的大模型, Llama3.1 。 这玩意跟上次 Llama3 一样也是三个版本,除了同参数量的 80 亿和 700 亿,这次最亮眼的是他们的超大杯,在老黄数万显卡的供应下,小扎的新模型用了足足...……更多
亚马逊云科技,如何用AI再赢一次
...施)市场份额为39.0%,位居全球首位。十年后的今天,大模型是新的技术浪潮。“AI转型”替代“云转型”成了IT产业的新趋势。每一次IT技术变革,关键窗口期只有两三年。巨人倒下时,身上还是暖的。如果不能及时跟进,很快...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。比如最近,Llama-3.1 登上了最强开源大模型的宝座,但超大杯 405B 版本的内存就高达 900 多 GB,这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛,...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
今日值得关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开源的Hermes 3(基于Llama 3.1)而引起广泛关注的Nous Research,再次宣布了一项重大突破——DisTrO(分布式互联网训练)。通过使用与架构...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础设施服务,为中国大模型产业繁荣发展提供技术支撑。去年9月,腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
...期公司营业收入及净利润实现一定幅度增长。推动前沿大模型技术应用资料显示,同花顺的主要业务是为不同机构客户提供各类基于AI智能的软件产品和系统维护服务、金融数据服务、智能推广服务,为个人投资者提供各类基于A...……更多
ai生命周期:ai训练和ai推理的完美结合
...部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时候根据情况也可以使用超...……更多
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
...顶配,405B版本拥有4050亿个参数,是迄今为止最大的开源模型之一。昨夜凌晨,META突发Llama 3.1-405B评测数据的泄漏事件,有网友预计可能还会同时发布一个Llama 3.1-70B版本,因为“(模型提前泄露)是META的老传统了,去年的Llama模...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...专家 Ted Xiao 都忍不住为这项研究点赞,称其对机器人大模型时代具有里程碑意义! Scaling Laws:从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗?答案就是 scaling laws!现在,清华团队首次证明:这个法则在机器...……更多
2023 re:Invent——从云计算到AI未来的一场全面重塑之旅
...来的愿景。据陈晓建介绍,在底层,亚马逊提供用于基础模型训练和推理的基础设施,强调自研芯片的创新。在会上,亚马逊云科技推出生成式AI和机器学习训练的专用芯片Trainium2处理器,其针对训练具有数千亿至数万亿参数的...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每...……更多
腾讯云升级 AI 全家桶,混元对标 GPT-4o
...腾讯云这次也公布了一系列进展。首先是发布了新一代大模型「混元 Turbo」,相较前代,混元 Turbo 性能大幅提升:训练效率提高 108%,推理效率提升 100%,推理成本降低 50%,目前,混元 Turbo 已在腾讯云上线,提供多个版本供企...……更多
更多关于科技的资讯:
蚂蚁集团大动作!“阿福”APP来了:新增健康陪伴功能 问答能力升级
12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布APP新版本,升级健康问答、健康陪伴、健康服务三大功能
2025-12-17 10:18:00
项目卡壳90%是资源管理“掉链子” ?易趋教你四步破局
“张总,研发部李工被临时抽去支持紧急项目,咱们的核心模块开发得延期了”,“设备组反馈,原定下周到位的测试服务器,现在还在另一个项目组占用着”
2025-12-17 11:10:00
远见协同:解码米连科技稳健发展的深层动能
在互联网行业潮起潮落、监管环境持续完善的背景下,一家企业如何锚定航向,实现可持续的稳健增长?这不仅考验着创始团队的初心
2025-12-17 11:10:00
赋能印度农业现代化丨潍柴雷沃亮相第33届印度浦那国际农业展
鲁网12月17日讯日前,第33届印度浦那国际农业展KISAN在浦那国际展览中心举办。作为印度西部规模最大、最具影响力的农业展会
2025-12-17 11:18:00
面对“哪些中国企业全球化做的不错?”这一问题,联想集团无疑是具有代表性的答案之一。作为出海时间早、全球化程度深的中国企业
2025-12-17 11:52:00
京东产发与日日顺达成全球战略合作 共建超级供应链新生态
近日,京东产发与日日顺供应链正式达成全球战略合作,建立共创共赢的生态战略合作关系。 双方在物流基础设施、仓配网络、供应链管理等良好的合作基础上
2025-12-17 10:11:00
【宅男财经|专家面对面】当前许多年轻人热衷于“谷子”、棉花娃娃等小众二次元文化产品。针对年轻人为何更偏爱此类小众消费,中国广告协会会长
2025-12-17 10:12:00
“我喜欢我”:vivo S50系列携“告白”美学与长焦Live,开启自我表达新旅程
2025年12月15日,vivo正式发布全新 vivo S50系列,包括 vivo S50 与 vivo S50 Pro mini 两款新品
2025-12-17 10:18:00
聚焦企业福祉与跨境管理 百年人寿协办德国商会专题论坛共话创新解决方案
2025年12月5日,一场聚焦于在华企业福利创新与人力资源挑战的高端论坛于北京成功举行。本次活动由中国德国商会与安顾方胜联合主办
2025-12-17 10:18:00
为积极响应全民消费热潮,充分发挥金融服务实体经济的重要作用,江苏银行围绕 “双十二” 消费节点,精心部署多项线上促消费举措
2025-12-17 10:18:00
王志顺最近,社交平台被一批“装修博主”刷屏了——清一色的夫妻站在新家门口微笑合影,有的怀里还抱着婴儿,配文都是“装修已定”“聊聊感受”
2025-12-17 10:40:00
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00