• 我的订阅
  • 头条热搜
...以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。据了解,s1模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。李飞飞团队研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Fl...……更多
全球权威评测榜单BIRD:蚂蚁数科超越谷歌等公司位居第一
...(组序列策略优化)强化学习训练方法,能够增强SQL内在推理,让大模型在推理阶段,深度思考SQL框架,避免潜在的逻辑错误,提升SQL逻辑准确性;此外,Agentar-SQL具备多轮反思修正的能力,让模型对生成的SQL进行多轮次的审视...……更多
...律事实,并根据云端海量法律数据,结合运算模型,进行推理决策,一键生成咨询意见书、民事诉状、仲裁申请、报案材料等法律文书。吴怡表示,法律大模型能为当事人提供专业、便捷、免费的法律咨询,帮助解决人们日常生...……更多
...研发中心,专注于算法研发和模型调优,凭借自主创新的推理加速技术,对 DeepSeek全参数版进行软硬件协同深度优化,实现了每秒超6900 Token的超高吞吐率,性能远超行业平均水平,大幅提升了大模型效率。此次入围的算力强基...……更多
八年满勤,数字中国讯飞答卷:AI如何让城市更聪明、生活更便捷
...算力底座训练的讯飞星火大模型及最新升级的星火X1深度推理大模型,更携一系列在城市、教育、医疗、企业数字化、运营商及智能硬件领域的AI创新成果亮相,以全栈自主可控的AI技术,为数字中国高质量发展贡献解决方案。讯...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...够在多模态大模型(如 LLaVA)的训练中显著提升复杂视觉推理的表现。代码与模型均已公开,欢迎访问 https://aka.ms/llm2clip 了解详情和试用。LLM2CLIP 目前已被 NeurIPS 2024 Workshop: Self-Supervised Learning - Theory and Practice 接收……更多
...的飞跃,就无法进入家庭领域,而Helix模型能像人类一样推理。据Figure AI介绍,Helix不仅实现了对整个机器人的上半身,包括手腕、躯干、头部和单个手指输出高速率连续控制,也可以在两台机器人上同时运行,使它们能够解决...……更多
掰开安卓手机 满屏都是三个字:大模型
...的内存单元,是大模型进手机面临的第二道难关:大模型推理需要大量计算资源做支撑,与此同时,内存大小决定了数据处理速度的上限以及推理的稳定性。另外,在手机上跑大模型,也给电池带来了更大的压力。因此芯片能耗...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...重量很轻等。如何准确理解不同商品隐含的知识并且进行推理,是在线购物领域的另一个独特挑战。 异质且隐式的用户行为:在线购物平台上存在多种多样的用户行为,例如浏览、查询、加购物车、购买等。这些行为大部分都...……更多
...考”即可体验。API接口和使用方式保持不变。“如非复杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。”新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推...……更多
夏张镇岱夏红大樱桃合作社:“御寒”有方,草莓温暖“过冬”
...产带来的不利影响,全力守护老百姓的“菜篮子”。走进草莓大棚,一股热浪扑面而来,一株株草莓长势喜人,溢出浓浓香气。朱家庄村党支部书记杨桂元告诉记者,大棚抗寒保温能力强的最主要原因,是因为今年引进了煤气灶...……更多
MemGPT团队官宣创业,融资1000万美金,硅谷大佬Jeff Dean也投了
...I领域的新趋势。这些AI Agent不仅能为用户规划任务、进行推理,还能执行复杂的多步骤任务。同时,基于大语言模型构建的应用程序正在变得越来越复杂。它们不再仅限于生成聊天消息,还能够调用工具、连接外部数据源、与其...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。 基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强...……更多
Kimi概念股继续暴涨!多家上市公司回应,月之暗面致歉系...
...3月20日观测到流量异常增高后,已经进行5次扩容工作。推理资源会持续配合流量进行扩容,以尽量承载持续增长的用户量;设计了一套更有效的SaaS流量优先级策略,以保障付费用户的调用稳定,预计3月25日之前完成并上线。 ...……更多
OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!
...R1所带来的竞争,OpenAI正式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Ca...……更多
破解实时性与成本难题!白山云发布“大模型API”产品
...、算力成本的指数上升,更低延时、更优成本的边缘算力推理成为必需。边缘推理通过分布式算力下沉与智能调度,能够为高实时、高隐私、高性价比场景提供关键支撑,驱动AI从集中式智能迈向“云-边-端”全域协同智能。聚...……更多
快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验
...p分辨率30fps的视频。得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频。在推理过程中,还可以做到同样内容输出多种视频宽高比。下面的视频展示了分钟级的视频生成,...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是,前不久上市的小...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...同的模型形态,采用混合专家模型(MoE)结构,提高训练和推理效率及专业领域适应性,具备强大的中文创作能力。 腾讯混元大模型构建三层自主可控的国产大模型全栈技术架构:上层为自研高速网络互联来支撑模型训练,预计20...……更多
美的集团首席AI官唐剑:AI和智能机器人是家电行业巨大的机遇|新质生产力·AI Partner大会
...题,能够准确识别家居控制意图,大模型有非常强的逻辑推理能力,结合对用户习惯的学习以及逻辑推理能力,预测下一步用户想做什么,从而做一个简单的规划,提前为客户提供主动服务。有了美言大模型,结合美的入口设备...……更多
新年的第一杯草莓塔已经翻车了
...:郭艺 贾诗卉今年冬天,没吃过、没见过、也没听说过草莓塔的人,请反思一下自己的社交能力。几十颗艳红的草莓呈塔状叠至30-50厘米高,间隙里填满丝滑细腻的白色奶油,各种绸带、蝴蝶结、彩色糖粒、小饼干、小卡片装饰...……更多
AI泡沫不可避免!李彦宏敲响警钟:PMF是生存关键
...苹果研究员最近发布了一篇名为《理解大语言模型中数学推理局限性 》的论文,质疑大语言模型的数学推理能力,甚至认为大语言模型不具备真正的推理能力,放弃造车、战略押注AI的苹果甚至放弃了OpenAI的新一轮投资机会。与...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...短两个月,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。据了解,“日日新5.5”模型训练是基于超10TB tokens高质量数据,包括大量合成的思维...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
算力逻辑修复!各大厂商接入DS催化港股AI基建概念 李彦宏称仍应持续投入
...极发展成本较低的自有ASIC方案,并把重心从AI训练转往AI推理,预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展。中信证券的研报也指出,DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成...……更多
火山引擎ai大模型赋能千行百业成趋势
...片。大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。谭待表示,超低定价来自于用技术优化成本的信心,...……更多
...大模型产业正在经历从“百模大战”的预训练竞赛向云端推理服务效能优化的战略迁移,工程化作为大模型技术实现产业化的必要手段,在训练和推理阶段分别侧重软件工程和应用工程,需实现“硬件、软件、模型、应用+专业...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...比,苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升,并预计在Trainium 2上预训练模型时,效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic,宣布与AWS共同构建面向机器学习训练...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
更多关于科技的资讯:
杭州日报讯 还没毕业就带队创业,把密码学原理变成孩子爱玩的闯关游戏。日前,在第十一届杭州市大学生科技创新大赛决赛现场,杭州电子科技大学在校生唐萌团队带来的“秘密传递小特工”项目
2025-12-10 06:43:00
智能穿戴产品打开千亿市场空间
从运动健康到生活全场景︐智能穿戴设备以技术融合重塑消费生态︐开启市场新增长极腕间智能手表实时监测心率,耳畔智能耳机同步语音控制
2025-12-10 07:13:00
病理诊断准确率可达到90%以上,AI破局病理诊断痛点每日商报讯 12月4日-6日,第四届中国智能肿瘤学大会在杭州举行。作为大会核心专题板块之一
2025-12-10 07:44:00
从“卖布料”到“卖创意”杭州日报讯 眼下,绍兴未远品牌管理有限公司负责人周凯正为其一手打造的品牌“GUYUANDAI”筹备新系列的作品
2025-12-10 06:44:00
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00
“小丰”又一次在走位中撞到了同伴。在杭州市滨江区大丰科创中心的实验室里,这个站在C位的人形机器人突然停顿——它的“大脑”
2025-12-09 08:19:00
浙江日报讯 (记者 应磊 通讯员 崔宁 洪映映) 外形酷似“机械战警”,行动稳健有力,即便遭遇人为干扰也“不动如山”。近日
2025-12-09 08:20:00
产业炬光灯聚焦新诺北斗:坚持自主创新 为船舶装上“智慧大脑”
厦门网讯(厦门日报记者 林露虹)茫茫大海上,船舶的行踪与航向,由船载北斗终端精准“掌舵”。位于火炬高新区的新诺北斗航科信息技术(厦门)股份有限公司(以下简称“新诺北斗”)
2025-12-09 08:57:00
厦门跨境电商出海加速 多家厦企亮相2025亚马逊全球开店跨境峰会
2025亚马逊全球开店跨境峰会。(主办方 供图)提供亚马逊出海服务的厦门企业AMZ123服务台前围满咨询的客商。(受访企业 供图) 厦门网讯 (厦门日报记者 沈彦彦 通讯员 周晓雅) “每年的亚马逊全球开店峰会
2025-12-09 08:57:00
长白时评评论员 久泰平“方向盘装饰贴”竟成“夺命杀器”!凌晨1点28分,一车辆在高架行驶时,主驾驶位空无一人,王某某竟在副驾驶酣睡
2025-12-09 11:09:00
根据工业和信息化部的数据,近年来我国互联网数据中心(IDC)产业规模年均增速达30%左右。然而,高速增长累积的高能耗问题也逐渐暴露
2025-12-09 14:21:00
第十一届全国大学生物理实验竞赛:西工大荣获三个“国赛一等奖”
近日,第十一届全国大学生物理实验竞赛(创新)决赛成绩公布,西北工业大学三支代表队进入决赛,均荣获国赛一等奖,获奖数量与质量位居全国高校前列
2025-12-09 14:29:00