• 我的订阅
  • 头条热搜
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,...……更多
科大讯飞申请推理方法相关装置及推理系统专利,具有较高的推理速度
...局信息显示,科大讯飞股份有限公司申请一项名为“一种推理方法、相关装置及推理系统”的专利,公开号CN119918679A,申请日期为2025年4月。专利摘要显示,本申请公开了一种推理方法、相关装置及推理系统,应用于推理加速技...……更多
OPPO:用AndesGPT迎接下一个十年
...打法:在AndesGPT的定义中,“对话”是GPT记忆能力、逻辑推理能力、模糊意图理解能力、生成能力等等的一个集合,作为大模型与用户沟通的桥梁,“对话”的重要性不言而喻。面对这座大山,坚持长期主义的OPPO做出了与“愚公...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
... network, ANN)相区分。和ANN类似,PNN系统同样使用可训练权重处理输入数据,但不同之处在于,系统中至少有一部分是模拟的而非数字的。这意味着部分或者全部的输入/输出数据被连续编码为物理参数,权重也可以是物理参数...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...首先,“打败 Google 的,只可能是 Google”。就像社交帝国腾讯用微信“打败”了 QQ 一样,Google 几十年来在搜索引擎领域的绝对话语权,使其在对话式 AI 在搜索领域的应用上,也具有不可撼动的优势。目前,Google 在搜索引擎中...……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...为ARM的20%左右,AI性能得到极大提升。目前,世界主流AI推理生态主要包括英伟达的GPU推理生态和X86的CPU推理生态。K1芯片通过复用X86成熟的AI推理软件栈,把底层核心算子改用RISC-VVector和AI指令,其余部分复用CPU推理软件栈,从...……更多
国产GPU力挺!摩尔线程宣布支持满血Deepseek-V3-0324
...然采用混合专家(MoE)架构,每个token激活约370亿参数,在推理、编程、数学、中文处理等多个领域达到行业领先水平。根据DeepSeek官方发布的测试报告,DeepSeek-V3-0324在各项能力评测中表现出色。DeepSeek-V3-0324不仅全面超越Claude-3.7-So...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
...现象被研究者称为Underthinking(欠思考)。研究团队来自腾讯AI实验室、苏州大学和上海交通大学,主要研究对象是开源的DeepSeek-R1和Qwen QwQ系列模型。通过分析AI的错误答案,他们发现当前的推理大模型经常在思考早期就走上了正...……更多
...术壁垒的消解,更催生了全球开发者的共创生态。从模型权重到推理框架,开发者均可基于DeepSeek快速构建定制化应用,甚至通过模型蒸馏培育垂直领域的小型AI系统。这种开放性与包容性,与西方科技巨头“闭源垄断+高额订阅...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
百度发布两款大模型,对标DeepSeek、聚焦多模态
...百度外,近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”,试图让AI突破表层语义匹配,建立因果推理...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
李彦宏批“百模大战”:造成算力极大浪费 开源模型并不万能
...源模型的能力,就需要更大的参数规模,这将导致更高的推理成本和更慢的响应速度。李彦宏表示,大多数应用场景并不适合开源模型,商业化的闭源模型才是真正有竞争力的。他指出,没有实际应用的基础模型,无论开源还是...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...输入序列中的所有位置,并为每个位置分配不同的注意力权重。这使得模型能够更好地处理长距离的依赖关系,也就是说,对于句子中距离较远的单词,模型也能有效地捕获其关系。这种通过比较文本中每个token来理解上下文的...……更多
华东师范大学的老师,上课已经用上了大模型
...型海量、频繁的数据访存需求提供支撑,专攻涉及大量的权重数据读取的场景。 除这些CPU新老主力的布局外,英特尔还提供Arc系列独立显卡供学生体验学习,并通过组织编程竞赛等形式,激发学生创新实践的兴趣与潜力。“通...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转绘、AI音乐等多模态能力,大大提升了我的短视频创作...……更多
DeepSeek-R1联网搜索能力首测:腾讯元宝第一
...epSeek-R1爆火后,许多第三方平台陆续接入了该模型,比如腾讯、阶跃星辰、蚂蚁集团、百度、字节跳动等等。今日,中文大模型测评基准SuperCLUE发布DeepSeek-R1联网搜索能力首测,公布了10家第三方平台测评结果。从结果来看,腾...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...技等也分别推出全新的大模型产品。李开复表示,大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段,今年会迎来“大模型应用爆发元年”。他同时预测,明年下半年,随着大模型推理成本的大幅度下降,人们...……更多
...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成...……更多
零代码基础也能复刻!大模型化身AI售前助手,百页万字标书秒解读
...据绝对安全,因而不能上传云端利用公共大模型进行训练推理,也就是说,企业大模型必须进行本地化私有部署。这些要求叠加在一起,涉及多环节、工具,使得这样的模型开发本就十分困难且周期漫长。虽然售前人员最了解业...……更多
智慧供热新突破!济南热力集团 × DeepSeek打造更聪明的智慧供热大脑,引领行业变革
...与响应效率。依据实际用户反馈,动态调整知识图谱中的权重,为供热企业提供专家级的决策支持。用户可以通过大模型自动读取换热站实时运行数据,结合viHeating®模型在线水力计算与专家知识库,自动生成供热管网、换热站...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
来源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五,在为期12个...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...接之间的映射关系,即调制模块的训练可驱动任意网络的权重优化,从而保障了训练的速度与能效。薛智威表示:“通过这种新型光学系统,我们为复杂物理系统的在线训练提供了‘光速’解决方案。”图丨全前向智能光计算训...……更多
百度加码AI见效?一季度智能云营收增42%,文心4.5模型6月将开源
...动力是来自各行业对生成式人工智能和基础模型在训练及推理方面的需求激增。” 百度集团执行副总裁、百度智能云事业群总裁沈抖解释称,随着基础模型近期迭代加速,各类模型训练需求快速增加,得益于百度在AI基础设施方...……更多
DeepSeek开源周才第二天 有些公司就已经坐不住了
...了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ,还是个推理模型和传统模型的 “ 混血 ” 。我估计今天那些专门做模型测评的博主,都快要忙不过来了吧。。。再加上 Grok 3 、 DeepSeek R1 、 o3 mini ,世超猜到了今年推理模型必有...……更多
更多关于科技的资讯:
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00
2025年11月8日窪田制药控股株式会社为应对全球日益严重的“近视”问题,作为眼科医疗解决方案公司,窪田制药控股株式会社(总部
2025-11-19 20:39:00
三大核心价值赋能,浪潮海岳智能服务平台为企业运维保驾护航
在数智化转型加速推进的今天,企业运维正面临前所未有的挑战。传统运维模式响应慢、协作难、效率低,难以支撑业务的快速发展;运维环节中的流程堵点与系统孤岛
2025-11-19 22:02:00
《燕赵都市报》即将推出的二次元专版“漫潮”,即日起正式启动专属OC(原创角色)形象设计征集活动,诚邀社会各界设计爱好者
2025-11-19 22:17:00