• 我的订阅
  • 头条热搜
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
NVIDIA首秀Blackwell GB200超级芯片系统:AI推理性能飙升1.5倍
...性能方面只给出了一个数据:Llama 3.1 700亿参数大模型的AI推理性能对比H200提高了足足1.5倍。散热怎么办?NVIDIA透露正在开发热水散热系统,可以将耗电量减少28%。不过,NVIDIA仍然没有给出Blackwell GPU服务器的出货时间,估计在...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
...元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员,推出了一项针对性...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...I正在壮大。 能力一览11B和90B这两款模型,不仅支持图像推理场景,包括图表和图形在内的文档级理解、图像描述以及视觉定位任务,而且还能基于现有图表进行推理并快速给出回答。比如,你可以问「去年哪个月销售业绩最好...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... 3.5依旧答错了。LeCun在此嘲讽大模型一番,大模型竟可以推理...?问题在于,LLM没有常识,不理解现实世界,也不会规划和推理。LLM行不行,就看提示了一位网友分析总结了,以上LLM失败的原因。他表示,LLM本身就是个「哑巴」...……更多
...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成...……更多
NPU IP累计出货超1亿颗!芯原股份一站式AI解决方案揭秘
...的IP更重要,一定要有比较好的PPA。因为端侧主要是要做推理,也要有一些浮点运算的能力,更关注的是低比特的量化及压缩能力。而在云端一定是高性能、非常高的TOPS,它要能够去做训练和推理。而且不光是单卡的训练推理,...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...、输入文本,还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...擎天、锋锐、元景系列AI服务器产品,为大规模数据训练和推理提供强劲性能,帮助AI用户高效构建AI基础设施和应用环境,满足AI场景下的多元算力需求,为AI新质生产力提供强劲引擎。擎天系列L20 AI服务器,4U8卡PCle擎天系列L20 AI服务...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...MGSM(跨语言数学能力)提升 2.3%,而DROP(文本段落分析推理)则下降了 3%。但与此同时,杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据,早在去年6月,ChatGPT流量即已见顶,当月其网站与移动客户端的全球流量(PV)...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...理、术语标准化后构建患者画像,再经由惠每医疗大模型推理计算做出提醒或预警,同时大模型还可以基于用户的反馈持续进行优化。图:惠每科技病历内涵质控方案架构最终,在界面的呈现上,惠每科技这个系统会有医生端和...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
推理性能飙升1.5倍!微软疯狂下单GB200芯片提升其AI算力
...,新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外,微软还计划在低温数据中心部署GB200服务器,以缓解冷却系统的潜在压力。其他云服务提供商订单量则显著低于微软,如亚马逊在2...……更多
字节、阿里云大降价之后,百度:两款主力大模型全面免费
...是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE Speed则是百度的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,能更好地处理特定场景问题,同时具...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...微调,(4) LLM 的上下文扩展,以及 (5) 长监督微调。对于推理,MM-SP 解决了 KV 缓存内存使用率的挑战, 这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数,实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元,同比增长100%。上半年新增交付70.5万辆车,...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
最强大模型训练芯片H200发布!
...味着什么?来看测试数据。 在HBM3e加持下,H200让Llama-70B推理性能几乎翻倍,运行GPT3-175B也能提高60%。对AI公司来说还有一个好消息:H200与H100完全兼容,意味着将H200添加到已有系统中不需要做任何调整。最强AI芯片只能当半年除...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...仅解码器LLM)作为文本编码器,以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展,但大多数现有模型仍依赖CLIP或T5进行文本编码,这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同,Gem...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。在腾讯全球数字生态大会上,腾讯公司副总裁、云与智...……更多
AI时代CPU不老!Intel五代至强五大革新:340亿参数小意思
...架的支持,特别是PyTorch、TensorFlow等等,在AI训练、实时推理、批量推理等方面,基于不同算法,性能提升最多可达40%,甚至可以处理340亿参数的大模型。根据Intel提供的数据,五代至强SPECInt整数计算性能提升21%,AI负载性能...……更多
...理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Lla...……更多
...强结合,GLM-4稳定、高效运行于云端,并具备大规模实时推理能力,成功实现了成本效益和服务质量的平衡。这一创新使得智谱大模型能够深入理解用户需求,快速作出响应,为用户提供智能化生活的便利与高效。自2022年起,优...……更多
更多关于财经的资讯:
兴业银行南京分行为江苏企业撑起汇率“安全伞”
出口利润被汇率变化“吃掉”是许多外贸企业长期面临的挑战。近日,兴业银行南京分行为省内一家年出口2亿美元的锂电国企量身定制“12个月稳价方案”
2025-09-26 07:31:00
中重科技等在江苏成立机器人科技公司
近日,中重灵希机器人科技(江苏)有限公司成立,注册资本1000万元,经营范围包含:人工智能行业应用系统集成服务;智能机器人的研发;智能基础制造装备销售;人工智能硬件销售等。企查查
2025-09-25 16:48:00
打破“快牛”多劳“慢牛”逍遥怪圈
在机关工作中,能力强、责任心强的干部被不断加担子,俗称“鞭打快牛”。而效率低、主动性差的“慢牛”却逍遥自在。提升机关工作效能必须打破“快牛”多劳“慢牛”逍遥怪圈
2025-09-25 16:48:00
赛力斯成功注册RoboREX商标
近日,赛力斯(601127)申请的“RoboREX”商标注册成功,国际分类包括设计研究、机械设备、运输工具。据悉,RoboREX是赛力斯推出的智能控制技术
2025-09-25 17:00:00
纵横股份在深圳成立低空运营服务公司
近日,深圳纵横低空运营服务有限公司成立,法定代表人为王陈,经营范围包含:智能无人飞行器制造;导航、测绘、气象及海洋专用仪器制造;海洋环境服务;通用航空服务等。企查查股权穿透显示,
2025-09-25 17:00:00
光环新网等成立数据科技公司
近日,浙江光环数据科技有限公司成立,法定代表人为庄小航,注册资本为1000万元,经营范围包含:互联网数据服务;数据处理服务
2025-09-25 17:00:00
三峡不动产 × 北京远行 | 精英开讲以专业赋能
面对瞬息万变的市场环境,如何紧跟趋势,为运营注入新动能,成为当下众多企业突破发展瓶颈的关键命题。9月23日,三峡不动产管理有限公司精心策划并组织了“房产土地经营管理能力提升暨‘五化’体系建设专题培训班”
2025-09-25 17:08:00
智慧赋能、创新支撑,党建引领打造高质量建设标杆
9月18日,2025年东莞市住房和城乡建设系统“质量月”现场观摩交流会在中建三局深圳公司承建的团泊洼11号地块项目成功举办
2025-09-25 17:08:00
民生银行济南分行举办科技型企业银企对接活动
近年来,伴随经济形势发展及社会信息化程度的提高,实体企业经营中面临的降本增效、企业管理智能化需求日益突出,民生银行济南分行顺应企业实际需求
2025-09-25 17:32:00
中建六局交通公司:志愿服务添力 护航世界生物圈保护区大会
第五届世界生物圈保护区大会国际协调理事会召开在即,中建六局交通公司主动对接大会需求,投身杭州临安区服务保障工作,以“交通力量”为这一国际盛会保驾护航
2025-09-25 17:38:00
宜美照明:节能不止于关灯,更在于智慧与健康
在绿色转型成为各行业共识的今天,商业与工业空间的能源管理正迎来新一轮升级。照明系统作为建筑能耗的重要组成部分,其智能化与高效化已成为企业降本增效
2025-09-25 17:38:00
中建三局西北公司安装分公司召开“清风明月共团圆 党建引领话廉洁”中秋六方联建共建暨廉洁教育活动
古韵今风,共赏一轮明月;中秋之际,共赴团圆盛宴。为弘扬中华民族优秀传统文化,营造温馨浓厚的节日氛围,进一步推动党业融合
2025-09-25 17:38:00
农行济南槐荫济兖公路支行:特事特办紧急服务,暖心助力客户应急就医
近日,农业银行济南槐荫济兖公路支行在非营业时间紧急协助一名客户办理定期存单支取业务,缓解其医疗费用急需,获得客户高度赞誉
2025-09-25 18:07:00
农行济南槐荫阳光新路支行:暖心服务退伍老兵,耐心关怀获敬礼致谢
近日,农行济南槐荫阳光新路支行因持续耐心服务一位八十多岁退伍老兵,获得老人多次敬礼致谢,暖心互动成为网点佳话。该老人曾服役于文工团
2025-09-25 18:08:00
农行济南绣惠支行:反诈宣传为银发老人筑牢安全防线
为切实增强社区年迈老人的反诈意识和能力,农行济南绣惠支行组织工作人员与社区工作者一同深入社区老人家中开展上门反诈宣传活动
2025-09-25 18:09:00