• 我的订阅
  • 头条热搜
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...含四个主要任务:信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试,”企鹅卷轴”有以下几个优势:数据多样性:”企鹅卷轴”包含了各种真实场景下的长文本,如财务报告、法律文档、学术论文等,...……更多
阿里云支持一键部署DeepSeek-V3/R1!仅需3步、0代码
...写代码,即可通过阿里云平台实现从模型训练到部署再到推理的全过程,极大地简化了AI模型的开发流程。根据官方介绍,一键部署DeepSeek模型的操作流程非常简单,仅需以下3步:登陆PAI控制台,在左侧导航栏选择工作空间列表...……更多
360智脑大模型重新定义AI数字人
...话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景,并在多个第三方评测中位居国产大模型第一梯队。会上周鸿祎表...……更多
AI幻觉:它真的会一本正经胡说八道!
...情况时,会基于自己的“经验”(训练数据)进行填补和推理。这不是因为它想要欺骗我们,而是因为它在试图用自己理解的模式来完成这个任务。1、基于统计关系的预测因为AI(尤其是像ChatGPT这样的语言模型)通过大量的训...……更多
...理,利用预训练语言模型中的自然语言理解能力、思维链推理能力,结合天眼查的中控技术,精准识别用户真实意图,并返回天眼查商业知识库中的商查数据和商查知识结果,实现数据可信。在汽车领域,百度智能云为长安汽车...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
第九届信也科技杯决赛举行,探索语音大模型鉴伪应用
...新大模型的识别技术,并且考虑了模型的实用性,尝试提高推理效率、减少模型推理耗时。信也科技副总裁、大数据及AI负责人陈磊表示:“选手们探索了多种语音鉴伪方案,为对抗假语音欺诈的应用提供了不少思路。例如,有些选手...……更多
...合了 Anthropic 最近发布的 Claude2的优势,在数学、编码、推理和安全等领域取得了显著进步。内部测试显示,Claude Instant1.2在编码基准测试中的得分比1.1版本高出近6个百分点,并且在一组数学问题上的得分也有所提升。 DARPA发起...……更多
“Sora”王炸,20篇研报带你走进人工智能(下载)
...智能原理本白皮书主要内容包括了:人工智能总论、逻辑推理人工智能和计算智能、神经网络人工智能和生物人工智能、数学人工智能和物理人工智能、信息主义人工智能。提出了智能作为一个科学概念的模型、原理与方法;智...……更多
腾讯自研混元大模型亮相,将通过腾讯云对外开放
...万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。据腾讯称,腾讯混元大模型是“从实践中来,到实践中去”的实用级大模型。腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会...……更多
华东师范大学的老师,上课已经用上了大模型
...的算力,还要有灵活组合、弹性扩展的能力,既能兼顾AI推理等新型负载,又要进一步强化传统的通用计算平台及应用。第二,软硬兼修的优化适配。随着大模型在教育领域的应用兴起,高校对AI平台提出了更高的要求。一方面...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
2023服贸会|大模型光环之下 科技巨头逐鹿AI赛道
...凭借其掌握的超过10亿与图像相关的参数,执行多达20步推理,创作出用户想要的图像。北京商报记者在现场了解到,完成这些任务全程无需联网、无需访问云端,全部在手机端完成且用时不超过15秒,是迄今为止在智能手机上实...……更多
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023
...大模型商量2.0,徐立透露,其AI代码助手性能全面提升,推理效率提升619%,HumanEval测试集一次通过率达48.7%,超过GPT-3.5的48.1%。而且,无需训练模型,就可以快速融合知识生成,搭配企业知识库可以快速解决相关领域问题。此外...……更多
质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
...ble)(外循环):构建并结合多个模块来完成任务。 多步推理 (Multi-step Reasoning)(内循环):要求 LLM 逐步推理。 少样本学习 (Few-shot Learning)(内循环):从输入样本中添加一些高质量的示例演示。 模型选择 (Model SelectioN……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
深度结合行业场景需求,苏州思必驰发布行业语言大模型
...言计算涌现了三种能力,即情景理解、指令学习、思维链推理,这使得通用人工智能受到了更多关注。俞凯介绍,对话式语言计算经历了统计对话时代、深度学习时代,以及大模型时代。作为具有源头创新和持续创新能力的技术...……更多
解读大模型赋能自动驾驶各个环节及相关产业链玩家的投资机会
2022年底ChatGPT横空出世,其在理解人类意图、思维链推理、零样本下处理问题的能力优异。2023年3月大模型GPT4发布,性能进一步增强,并拥有多模态能力可实现“看图说话”。诸多科技巨头纷纷推出自己构建的大模型,并且将多...……更多
“3D视频版Sora”来了!
...,用户可任意指定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成8个视图的各5帧视频,整个4D优化需要20-25分钟。该模型已在Hugging Face上开源,适用于游戏开发、视频编辑、虚拟现实(VR)等场景的应用,可免费用于...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30%,多模态性能超越GPT-4V。同样在4月17日,昆仑万维还宣布,中国首个音乐SOTA(领域最佳水准)模型“天工SkyMusic”音乐大模型也正式开启...……更多
华人团队爆火instructblip抢跑看图聊天
...成员:InstructBLIP据介绍,InstructBLIP模型更擅长「看」、「推理」和「说」,即能够对复杂图像进行理解、推理、描述,还支持多轮对话等。比如,下图这一场景可能发生了什么?InstructBLIP推理出,可能飓风,或者恶劣的天气因素...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...的帮助性,无害性,可靠性,生成 / 检索文档的相关性,推理过程中每一步的可行性,以及生成文本的综合质量。Methodology:如何评判 表 1:LLM-as-a-judge 训练方法(1)微调:最近许多工作开始探索如何使用微调技术来训练一个...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...胜在全面,有琳琅满目的大模型品类,还有加速从训练到推理的各种工具“套餐”,以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的,即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多
智汇金陵 共探AI未来:开发者圈层沙龙·南京站圆满举行
...专家骆秀韬深度解析了DeepSeek R1,其通过强化学习具备强推理和“自我反思”能力。他建议企业根据需求选择推理类模型,并利用小模型蒸馏降本增效,同时介绍了星河社区提供的DeepSeek R1 API服务及免费模型部署资源。 百度飞桨...……更多
...思维链的模式,通过专家介入诱导它一步一步地进行思维推理。邬贺铨以度小满为例,称其选择金融大模型切入是一个很好的基础,是大模型跟行业大模型相结合的好机会。“当然,这里边有很大的创新要求,在金融上对可信度...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
更多关于科技的资讯:
“数聚江宁 数领未来”论坛在宁举办多措并举,亮出“数据强基”组合拳南报网讯(记者孙秉印通讯员何俏闵子豪)第九届未来网络发展大会“数聚江宁数领未来”论坛昨天在江宁召开
2025-08-21 08:16:00
●黄伟伟鼓浪屿、园博苑等景区游人如织,演唱会、小剧场一票难求,博物馆、科技馆门庭若市,毕业游、亲子游不断升温……厦门,为火热的暑期文旅经济再添一把“火”
2025-08-21 08:31:00
厦门外贸优品秀出硬实力 创意快闪活动在高崎机场启幕
体育器材企业参与快闪活动,图为工作人员向旅客介绍产品。 (厦门日报记者 卢剑豪 摄)厦门网讯 (厦门日报记者 吴晓菁)18日
2025-08-21 08:31:00
近日,国家广播电视总局印发实施《进一步丰富电视大屏内容 促进广电视听内容供给的若干举措》。《若干举措》强调,要多措并举加强内容建设
2025-08-21 08:39:00
厦门网讯 (厦门日报记者 何无痕)前天,福建省首届“青春之歌”创业创新大赛厦门选拔赛举行,经过激烈角逐,“高精度大功率激光精密制造机器人研发及产业化”“智剪工坊——AI 直播切片
2025-08-21 09:02:00
“新区外贸何以逆势增长”系列报道①丨沂河新区企业“出海”记
当下,“出海”已成为中国制造企业的核心关键词——这不仅是扬帆远航的必然方向,更是转型升级的必由之路。在此背景下,沂河新区交出的外贸答卷尤为亮眼
2025-08-21 09:14:00
汽车地毯的“绿色密码”:坤泰股份用创新编织低碳未来
大众网记者 王瑜 摄影 胡斌 通讯员 刘丽丽 烟台报道在全球积极践行绿色发展理念、大力推进“双碳”战略的当下,各行各业都在探索绿色低碳转型之路
2025-08-21 09:51:00
民宿托管如何稳定收益?旭客用组合拳拆解空置率
很多房东都有这样的困扰:做日租,旺季像“爆单”,淡季却惨淡;做长租,收益总觉得低了一截;想做短租,频率又不稳定。其实,问题不在房子
2025-08-21 10:11:00
伴鱼成立十周年,创始人黄河发布内部信:打造极致的个性化教育
2025年8月20日,在线教育领域的知名企业伴鱼迎来了其成立十周年的里程碑时刻。在这个具有特殊意义的日子,伴鱼创始人兼CEO黄河发布了以“Evolving Speed is Everything”(进化速度决定一切)为核心的全新主题
2025-08-21 10:21:00
满足“健康”与“美”的时代新需求 稳健医疗荣膺2025“西普金奖”
2025年8月16日-21日,中国健康产业(国际)生态大会(英文缩写CPEO,以下简称西普会)在海南博鳌拉开帷幕。本届峰会以“快蜕变
2025-08-21 10:50:00
8月20日,喜临门(603008.SH)发布2025年半年度报告,上半年公司实现营业收入40.21亿元,同比增长1.59%
2025-08-21 10:52:00
从工业端到消费端 智能机器人加速融入生活
编者按:IFR(国际机器人联合会)最新数据显示,2024年中国机器人专利申请量占全球总量67%,人形机器人的运动控制与灵巧操作技术取得关键性突破
2025-08-21 11:05:00
中国特许加盟展2025全年展会收官 见证加盟浪潮的回归与新生
随着8月10日第65届中国特许加盟展在上海的落幕,中国特许加盟展2025全年展会圆满收官。今年的中国特许加盟展现场,再次见证加盟浪潮的回归
2025-08-21 11:12:00
在8月15日国务院新闻办举行的新闻发布会上,国家统计局相关负责人介绍,我国新质生产力正稳步发展,为高质量发展注入了源源不断的新动能
2025-08-21 11:37:00
滴滴私家车车内除臭添高性价比方案,捷茜曼技术+价格双优势破解异味难题
网约车市场持续火热,滴滴出租私家车作为大众出行的重要选择,车内环境的洁净度与舒适度愈发成为乘客评价的关键。长期以来,车内异味问题——食物残渣发酵味
2025-08-21 12:02:00