• 我的订阅
  • 头条热搜
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
...说,“这太激进了。”“大型语言模型有能力做一些涉及推理方面的事情。”马塞利诺说。但它们与人类的思维方式不同。他说:“我不想对其实际智能做出断言。”生成式人工智能程序通常基于人工神经网络,分析数据并找到...……更多
DeepSeek开源惠四方(科技名家笔谈)
...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。 坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献,必须坚持历史视角,将其放在人工智能创新发展的...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。为了克服这些障碍,状态空间语言模型 (SSLM) 架构应运而生,该架构通过在处理单词时不断更新状态来工作,已成...……更多
...息,能实时检索最新的医学文献,生成诊断建议,并通过推理过程展示,帮助医生验证诊断的可靠性。作为“侦探”,它能实时检索最新的医学文献,生成诊断建议,并通过推理过程展示,抽丝剥茧地分析疾病在孩子身上留下的...……更多
“最懂你的AI助手”来了!讯飞星火大模型,成了打工人职场搭子?
...国内大模型,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对GPT-4 Turbo的整体超越。底座能力全面进化,叠加智能体的出现,让打造个性化、懂你的AI助手逐渐落地、融入现实生活。而在体验的过程中,...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...。在数学方面大模型还有很大的提升空间。数学关乎复杂推理相关能力,这是大模型普遍面临的难题,也是大模型在金融、工业等要求可靠的场景落地需要的关键能力。上海人工智能实验室领军科学家林达华此前在采访中对第一...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...型有效训练时长占比达到 98% 以上。TeleChat-52B在OpenCampass推理榜单排名第一在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval ……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先,开普云将不断完善...……更多
阿里发布全球最强开源模型千问3 通义App第一时间已上线
...布的千问3开源模型包含8款不同尺寸,均为全新的“混合推理模型”,智能水平大幅提升的同时也更省算力。其中,千问3旗舰模型Qwen3-235B-A22B是一款混合专家(MoE)模型,该模型创下所有国产模型及全球开源模型的性能新高;而...……更多
中国科技创新“乘”数直上
...15家厂商的模型产品已经通过备案。凭借语言理解、逻辑推理、知识问答、文本生成等通用能力,这些大语言模型产品一经推出,便受到用户的欢迎。“科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。”这是写进...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...、智能检索的专业服务。性能方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在CMMLU权威榜单的最新评测结果中,取得优异成绩。同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知...……更多
华为联合WPS AI,见证昇腾大模型推理应用启航
...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多
...法学问题形式化为可计算问题”。论证与决策模型、证据推理模型、法律推理模型、可执行立法模型、电子取证机器学习与数据挖掘等就是其典型代表,呈现出司法论证的建模化、司法推理的算法化和司法解释的智能化发展趋势...……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
「解放办公室社畜」,钉钉给出AI方法论
...大进展时,只需使用AI搜索,它能够借助大模型的理解、推理、生成等能力,基于平时的资料,罗列出客户进展、产品更新、市场策略、合作进展等内容。又或者,作为钉钉总裁,叶军每天都会接收到不可胜数的客户反馈。有了A...……更多
...次重大迭代升级,文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面的功能也在逐步完善。这些大模型的应用领域日益扩大,从知识问答到内容生成,再到创意策划和编程辅助等多种场景需求...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...成式AI可以生成图像、文本和声音,现在还有可以感知、推理、规划和行动的AI代理(AI Agent),以及物理AI。“2018年谷歌发布了Transformer,这完全改变了AI的格局,甚至完全改变了整个计算的格局。”黄仁勋表示,AI不仅仅是一个...……更多
...信息,对各种数据、特征进行提取,基于规律实现统计和推理。这种技术逻辑决定了,产业领域越清晰、任务越明确,就越能够发挥其技术的优势。而金融就是这样的产业领域。金融每一秒都伴随着海量信息的产生,这些信息伴...……更多
广汽宣布加入DeepSeek!覆盖昊铂、传祺、埃安三大品牌
...云端生成大模型接入DeepSeek模型,实现了原生自然的深度推理体验,并基于模型新增的强推理和反思能力,主动为客户提供更多个性化服务。这种融合使得汽车从简单的指令响应工具进化为能够预见需求的伙伴,重新定义了智能...……更多
大模型到了该「验收」的时候
...万亿级分层异构MoE结构,不仅模型效果大幅提升,其训练推理效率也提升了超过100%,并带来了50%的推理部署成本下降。而Turbo版本的混元大模型,定价仅为前一代Pro版本的一半。性能更强、价格更低,这是大模型是深入落地场景...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的声音说出文本内容,就像一个能即时模仿的口技大师。听到这里,不知道你会不会突然警觉——有这种能力...……更多
洞察者融合DeepSeek大模型,打造航天测控智能化基石
...天器故障,提高故障诊断准确率。借助DeepSeek强大的知识推理功能,星图测控在航天测控数据分析、智能定轨、任务规划、故障诊断、决策辅助等多个关键环节实现智能化升级,这不仅将提升服务效率与精准度,更能为客户提供...……更多
腾讯元宝重磅更新:同时上线混元T1正式版+DeepSeek V3最新版
...混元T1正式版是腾讯自研的深度思考模型,主打的就是“推理更快,思维超强”。相比此前的T1 Preview,T1正式版更快了:能秒回、吐字速度更快,同时效果也更好了,推理能力进一步提升。长文处理方面,T1的进步也很大,面对...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推理
...于之前的预期。根据之前的报道,“草莓”是一款专注于推理的AI产品,预计于今秋发布。但这两位测试过该模型的人士称,OpenAI计划在未来两周内发布“草莓”。当然,最终的日期也可能生变。需要指出的是,虽然“草莓”是C...……更多
更多关于科技的资讯:
丰台怡海中学无人驾驶实训教学项目落地
11月28日,AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学(北校区)举行
2025-12-02 12:04:00
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00
中国网12月2日讯 据国家安全部官微消息,国家安全部提示,SDK(软件开发工具包)是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合
2025-12-02 07:26:00
全球首创全动压空气轴承产业化成果发布,开启高端制造新纪元
北京讯—— 2025年11月28日,“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破
2025-12-02 07:32:00
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00