• 我的订阅
  • 头条热搜
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长...……更多
亚马逊推出“自动推理检查”工具,对抗 AI 幻觉
...,亚马逊云科技(AWS)发布了一款新工具,旨在解决 AI 模型产生的幻觉问题。IT之家注意到,在拉斯维加斯举办的 re:Invent 2024 大会上,AWS 推出了“自动推理检查”(Automated Reasoning checks)工具,该工具通过交叉引用客户提供的...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...平的推理能力,提升了行业的标准。不过也有人表示经过实测可见,它仍然具有 Transformer 架构的局限性。对此,图灵奖获得者 Yann LeCun 表示,问题不在于 Transformer,而是因为 Claude 3.5 仍然是一个自回归大模型。无论架构细节如...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
谁是苹果AI的“中国合伙人”?
...l等11个业界主流的公开评测集上,是同期整体得分最高的国产模型。另外,豆包大模型也为小米、荣耀和OPPO提供大模型服务。其三,"国家队"。人工智能"国家队"是一股不可忽视的力量,与之合作大有裨益,这其中科大讯飞尤为...……更多
深化应用场景:泰康在线保险“大模型”赋能全业务
自ChatGPT横空问世,人工智能-大模型技术成为全球关注焦点,带来新一轮科技革命浪潮。站在人工智能颠覆保险产业现状,洗牌旧竞争格局的新历史时期,泰康在线作为科技互联网财险公司,深度拥抱“大模型”是基因使然,也是重塑业...……更多
...中国电子信息产业发展研究院公布数据显示,截至11月,国产大模型共有188个,其中通用大模型27个,目前已有超20个大模型获得备案,大多数已向全社会开放服务。我国人工智能大模型市场正呈现快速增长态势,应用场景不断拓...……更多
「搜索」迈入 3.0 时代
百度发布新搜索文小言。大模型带动的这波创新浪潮里,所有人都在猜测第一个杀手级应用会诞生在哪个领域。今天来看,搜索毫无疑问是排在前三位的种子选手。早在去年年初,微软就借着 OpenAI 这块好铁,给 Bing 打了一把好...……更多
联想发布DeepSeek一体机解决方案:支持千亿参数大模型训练
...机采用ThinkStationPX工作站为载体,搭载沐曦曦思N260 GPU。实测数据显示,在相同并发条件下,沐曦曦思N260 GPU在Qwen2.5-14B模型推理实测性能达到NVIDIA L20 GPU 的110%-130%, 可支持本地部署DeepSeek各种参数蒸馏模型推理。而面向更……更多
第三季度,百度已经尝到了AI的甜头 | 最前线
...勋2023年,百度发布了第三季度财报——这也是8月取得大模型服务许可证后,百度交的第一份季度答卷。财报显示,2023年第三季度内百度集团(Baidu Inc)总营收为344亿元,同比增长了6%;百度核心(Baidu Core)收入为266亿元,同比...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教...……更多
百度智能云:最新旗舰大模型文心4.0 Turbo开放精调服务
在国产大模型中,文心大模型一直名列前茅。昨天,文心旗舰大模型ERNIE 4.0 Turbo精调服务正式开放,可以帮助企业利用自身业务数据训练出更适合企业应用场景的大模型,提升大模型在业务中的使用效果。本文作者进行了分析...……更多
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
...数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线。项目依托百度文心大模型技术,联动百度百科,通过“文心智能体+3D文物词条”形式,整合权威抗...……更多
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
《科创板日报》8月24日讯(记者 张洋洋)国产大模型企业DeepSeek“点燃”资本市场。近日,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale参数精度,并明确指出该精度标准是针对即将发布的下一代国产芯片设计。这一消...……更多
...——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一...……更多
AI下半场 百度依然坚挺
...年这场整整一个小时的演讲里,正如李彦宏的演讲主题《模型的世界,应用的天下》,应用仍是那个最大的关键词。“应用才是真正创造价值的,没有应用,芯片、模型都没有价值。我们这次大会的主题:模型的世界,应用的天...……更多
死磕AI原生应用,李彦宏重新定义大模型
“没有构建于基础模型之上的丰富的AI原生应用,基础模型就没有任何价值。”、“未来将由我们一起生成。”。10月17日,在一年一度的2023年百度世界大会上创始人、董事长兼首席执行官李彦宏重新定义了大模型的未来——“...……更多
百度核心净利润增长38%,2024“盈”就是“赢”
...| 孙 晓编辑丨高远山来源 | 野马财经市场都在期待百度大模型对业绩带来的最新影响,百度(9888.HK)于2月28日给出了一份超出市场预期的答卷。2023年四季度,百度总收入349.51亿元,归属百度的净利润(non-GAAP)77.55亿元,同比增...……更多
AI模型火拼,科大讯飞选择做“老实人”?
...得一提的是,刘庆峰重点强调了“星火4.0模型是基于我们国产算力平台训练出来的,每一行代码、每一个数据都是我们自己编写、自己清洗得出的。”这意味着,星火4.0AI大模型是一个地道的“国货”,技术完全自主可控。净利...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...地与环境和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多
清华团队开源大模型推理引擎“赤兔Chitu”:硬件成本削减50%
...,开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型,解决了FP8精度模型对英伟达Hopper架...……更多
ChatGPT上了iPhone,文心一言和豆包谁更有机会?
...的AI成果——苹果智能套件。据悉,这个套件将AI大语言模型集成到了iPhone、iPad、Mac等各种苹果设备中,用户可以在各种情况下用AI进行稿件撰写、内容检查校对,发送短信时还可以直接允许AI生成图片。来源:苹果官网这项能力...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...使用了更深的网络结构。Gemma 2关键模型参数如下:网友实测目前,用户还可在Hugging Chat上与Gemma 27B聊天。有网友上手测试了一番:不过似乎是出Bug了,让Gemma 27B讲个故事,它愣是没刹住车,回复巨长:我们也上手体验了一下,...……更多
...件的市多路线及多模式建设公共智算中心、开展智能算力国产软硬件协同攻坚和应用等多种举措……在中国信息通信研究院院长余晓晖看来,大算力、大算法加大数据正成为大模型主要的突破路线,这对集群高速互联、大容量并...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...领域,如整机算力、内存宽带、视频处理等等,也有同样的实测结果。 这份结果则是来自采用了第五代英特尔® 至强® 可扩展处理器的火山引擎——其全新升级的第三代弹性计算实例,整机算力提升39%;应用性能提升43%。而且在性能...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
...ixabay撰文 | 张天祁● ● ●今年年初,DeepSeek发布DeepSeek-R1模型,引发全球的关注。在公开评测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。...……更多
全网最低价!百度智能云上线DeepSeek-R1/V3:还有限时免费
...2月3日消息,今天百度智能云正式宣布DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架,并推出了极具竞争力的超低价格方案,同时提供2周免费服务。根据官方公布的信息,DeepSeek-R1模型的输入价格为2元/百万Tokens,输出价...……更多
更多关于科技的资讯:
中新经纬11月19日电 中国疫苗行业协会微信公众号19日发布《关于反对“内卷式”竞争 促进疫苗及其相关生物制品行业高质量发展的倡议》(下称《倡议》)称
2025-11-19 17:36:00
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00