• 我的订阅
  • 头条热搜
...真正意义上的“政策+产业”共振。事件驱动 DeepSeek线上模型版本升级至V3.18月 21日 ,DeepSeek发 布 了DeepSeek—V3.1大模型。本次升级后的模型采用了混合推理架构,即一个模型同时支持思考模式与非思考模式,用户可以使用“深度...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是一个...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在...……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
鲁网1月4日讯AI领域飞速发展,大模型的出现更是为通用人工智能带来曙光,越来越多的企业开始探索行业与AI的深度融合,进行产业应用创新。2023年12月28日,在WAVE SUMMIT+2023深度学习开发者大会上,百度发布了飞桨和文心大模...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...向合作伙伴开放“云天天书-2.0-68B”(680亿参数)行业大模型方案,从而把大模型应用成本降到千元级别。云天励飞表示,“深目”AI 模盒具备算法边缘侧在线学习能力,能够做到“3个90%”——覆盖场景超过90%、算法精度超过90%...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...决了空间智能研究中的一个主要瓶颈。这是首个全面评估模型在真实场景中对精细3D细节理解能力的基准。」 知名科技博主、前微软策略研究者Robert Scoble:「有了这项工作,机器人将能够自主组装IKEA家具,或者通过AI驱动的AR...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线...……更多
...迹来自云计算内部使用,但2022年谷歌称60%的能耗与语言模型有关。环境战略咨询公司iCare by BearingPoint高管利奥·热南认为:“AI企业应更透明,也应找出一些共同的新方法评估推理带来的影响。”目前,大学科研人员和企业在尝...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...媒体App获悉,4月19日,Meta公布期待已久的多模态开源大模型Llama 3系列。同时,Meta还推出了其首款基于Llama 3开源模型的AI聊天机器人产品——AI助手,直接对标ChatGPT-4。与此同时,科技行业裁员消息频出。谷歌宣布从3月10日开始...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的特征,正越来越多地在人工智能领域,尤其是大型语言模型(LLMs)中得到广泛应用,最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我纠正的方法。传统的大语言模型,因为在输出答案的时候是逐个Token输出,当输出...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
上海:加速实施“模塑申城”
...俊俊摄“这一波AI浪潮的特点是训练和推理的成本更低、模型能力更强以及多模态融合。其中,随着整体推理成本的降低,我们可以在相同硬件上部署更大、更通用的模型,这也是我们在产业落地上非常重要的关键点。”商汤科...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
智慧家庭重磅文件,征求意见稿来了!事关千亿市场、8大应用场景
...机交互、互联互通和安全防护。其中,推理与表达包括大模型、生成式人工智能(大模型)等新技术的训练、推理、部署等环节技术标准;人机交互包括触控交互、声控交互、动作交互、眼动交互、虚拟现实交互以及多模态交互...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...的突破使得 GenAI 在多个领域广泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群,——还...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Space,秉持着开源分享的精神,对以上问题...……更多
...科技企业或科研机构面向公众正式开放自研的人工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。大模型将如何为个人和产业赋能?这轮开放服务将为行业竞争带来什么影响?国内大模型未来的发展趋势又将...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...LLM和Tensorrt-LLM的混合精度推理,用户可以方便地一键部署模型。△图2 使用VLLM一键部署4比特和8比特混合精度量化并推理MixQ已支持多个主流大模型LLaMA3,Qwen2,Baichuan2,ChatGLM等。据了解,目前MixQ开源技术已被清程极智等AI行业公...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...。 此外,第五代至强还能够支持运行200亿参数的大语言模型(LLM)。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起,英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力,对于这类工作负载,内存带...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
更多关于科技的资讯:
[摘要]随着人工智能技术的迅猛发展,高等教育正在经历深刻变革。这就要求高校在研究生培养模式上深化改革,大胆创新,积极推动人工智能(AI)技术在研究生培养中的融合路径与实践
2025-12-22 11:10:00
据媒体报道,今年以来,杭州知名“网红大楼”丽晶国际大厦——这座巅峰时期汇聚了近两万名主播与从业者、“一栋楼的GDP堪比一个县”的楼宇
2025-12-22 08:18:00
味蕾实验TASTELAB首次亮相引领零食行业科学化升级新征程
2025年12月20日,全新零食品牌味蕾实验TASTELAB在上海正式举办品牌发布会。本次活动以“让味觉被看见”为核心主题
2025-12-22 08:49:00
乌江榨菜全民创意共创:深度对话Z世代的品牌焕新
当传统品牌纷纷叩响年轻化的大门,仅靠历史底蕴已不足以触动Z世代的心。作为榨菜行业的领军者,乌江榨菜早已展开前瞻布局:从早年携手B站打破次元壁
2025-12-22 08:49:00
在保险行业向专业化、精细化、集约化发展的背景下,富德生命人寿以科技引领创新,积极布局集约化运营模式,构建起以总部为核心的全国理赔集中运营格局
2025-12-22 10:32:00
彰显实力!大咖素质训练营荣获“2025年度影响力教育品牌”奖项
近日,由新浪教育与微博教育联合主办的“新浪&微博 2025 教育盛典”于北京圆满落幕。大咖素质训练营凭借在素质教育领域的深耕积淀
2025-12-22 10:49:00
不用提前抢,西湖消费券带火实体商户:3天,星巴克黄龙广场店增收50%
作为促消费的首创实践,杭州西湖区“疯狂碰友日・西湖首发季”交出亮眼成绩单:首期三天,21 万市民参与“即碰即用”消费券活动
2025-12-22 10:49:00
近日,深耕青少年语言教育领域近十年的创业者徐萌,凭借其专业的课程体系与显著的教学成效,受到教育界广泛关注。徐萌毕业于中国传媒大学播音与主持专业
2025-12-22 08:49:00
张明磊摘要:随着数字化转型的深入推进,企业创新活动的结构与逻辑正在发生根本性变化。数据、算法与平台成为核心生产要素,推动企业从封闭式研发向跨组织
2025-12-22 06:58:00
马辉 山东广播电视台摘要:凭借弹性扩展、资源共享、高效协同等突出优势,在融媒体与数字化变革的浪潮中,云转播技术在广播电视行业的应用场景日趋丰富
2025-12-22 06:58:00
富瑞浦张序宝:一位浙商的品牌出海“长征”
从2001年怀揣着开拓国际贸易和自主品牌的梦想远赴俄罗斯,到如今业务遍布数十个国家,富瑞浦的23年,是一部浓缩的中国制造业出海史
2025-12-22 07:48:00
12月8日,浮力森林公众号发布了一则“破产公告”,这家在杭州开了20多年的老牌烘焙店正式画上句号。自2020年7月首度关门闭店后
2025-12-22 06:47:00
太原日报社《朝阳专刊》今日正式亮相
“美美朝阳”微信公众号二维码由太原日报社倾力打造的《朝阳专刊》今日正式亮相,“美美朝阳”微信公众号已上线,为读者朋友们提供更及时
2025-12-22 07:11:00
国家人工智能应用中试基地(医疗)·浙江开放服务12月20日,国家人工智能应用中试基地(医疗)·浙江(以下简称“浙江基地”)多项年度成果发布
2025-12-21 08:22:00
“厦门制造”发力长时储能赛道
海辰储能生产线。(资料图)厦门网讯(厦门日报记者 李晓平)当下,新能源汽车、数据中心等场景电力需求快速增长,全球能源结构正向可变可再生能源加速转型
2025-12-21 09:02:00