• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
... Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力,这些能力都通过SFT和预训练从庞大的训练数据集中学习。但是...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...有多模态大模型结合。比如,驾驶员注意力机制可以实时输出,让乘客实时观察当前大模型所认为权重较大的板块。如果乘客认为不合理,可以语音告诉端到端模型,从而实现自动调节,进而实现持续学习和不断优化。 端到端...……更多
...海量信息里发掘潜在规律,从而更好的预测下一个token的输出。这使得大模型即使面对它不曾见过的情景,或者没有见过的问题,也能进行作答,仿若人类思考和学习的方式。02大模型即操作系统每个时代都有自己的操作系统,...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...果。7、Meta 更新了许可证,允许开发者使用 Llama 模型的输出结果来增强其他模型。在这篇论文的最后,我们还看到了长长的贡献者名单:这一系列因素,最终造就了今天的 Llama 3 系列。当然,对于普通开发者来说,如何利用 405B...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...场景的需求;第二,鉴于 Transformer 注意力机制作为概率输出模型,天生具有不可控的机理,AI 须具备可预测和稳定的性能;第三,面对大模型可能产生的信息幻觉,确保内容的准确性和真实性是一大挑战;最后,必须包括内容...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...; ShieldGemma 基于 Gemma 2 构建,用于过滤 AI 模型的输入和输出,确保用户安全; Gemma Scope 提供对模型内部工作原理的无与伦比的洞察力。其中,Gemma 2 2B 无疑是「最耀眼的仔」,它在大模型竞技场 LMSYS Chatbot Arena 中的结果令人眼……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...知系统运行,比如通过一系列的神经网络层,并产生一个输出的过程。 对于任何一个单一输入,通常只有一个输出,但在很多情况下,对于一个感知输入,可能存在多种可能的输出解释。你需要的是不仅仅计算单一函数,而是...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...与人类的意图相对齐、研究如何通过不同对齐算法让模型输出更符合人类预期和价值观具有重要意义。该框架的独特之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区...……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...用门槛,让大模型变得更为“实用”,腾讯开始加快对外输出大模型能力的脚步。如腾讯混元发布了智能体平台“腾讯元器”,帮助用户以极低的门槛创建专属AI智能体,并支持一键分发至QQ、微信客服、腾讯云等渠道。这被普...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...。此外,D-FINE 将定位知识 (Localization Knowledge) 融入到模型输出,通过高效的自蒸馏策略在各层共享这些知识,因而在不增加额外训练成本的前提下,实现了性能的进一步显著提升。 论文标题: D-FINE: Redefine Regression Task of DE……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...模型开发的预训练阶段引入了 Llama 3.1 的 8B 和 70B 模型的输出,用作训练过程中的 token 级目标。在 post-training 阶段,Meta 采用了与 Llama 3.1 相似的方法 —— 在预训练模型的基础上进行多轮对齐,其中每一轮都包括监督式微调(SFT...……更多
...索”“公式召回”“代码生成”“编译计算”等环节,可输出最终的正确答案。金融事件分析方面,具有多轮高质量金融相关对话、思维导图生成、问题推荐等功能。 ……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...并配合语言指令进行下一步动作的预测。与以 token 形式输出文本内容的大语言模型不同,在 VLA 模型中,算法需要实时处理视觉环境中的动作,快速准确地面对外界做出连续的动作反应。创新奇智的机器人可以保持一秒钟 30Hz 的...……更多
Sora “拯救”元宇宙,世界模型的潜力才刚释放
...说,Sora 的最大贡献是作为革命性平台,极大降低了视频输出成本。这被一度看作是元宇宙发展的核心桎梏。表面上,它的出现冲击了贴片广告、影视或严肃新闻的禁脔。深层次而言,它更是可以改变教育、文旅和会展等诸多行...……更多
大模型商业化模式详解:烧钱之后如何挣钱?
...民币之间。1、 什么是token?Token是用来计量大模型输入、输出的基本单位,也可以直观的理解为“字”或“词”。但是目前并没有统一计量标准,各家大模型平台根据自己的偏好“随意”定义。如腾讯1token≈1.8个汉字,通义千问...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...的多样性进行了探索。对此,他们提出了假设,想让模型输出的答案更加丰富,需要在自然语言的概念或想法的空间内进行搜索。为了验证这个假设,研究人员进行了一系列实验。首先,研究人员发现,如果给模型一些简单的草...……更多
谷歌发布了3个新的开源Gemma人工智能模型
...用。ShieldGemma是一款分类模型,用于检测并过滤有害的AI输出来保护用户安全。Google设计ShieldGemma用于检测来自生成式AI模型黑箱中的仇恨言论、骚扰、淫秽内容和其他可能从生成式AI模型黑色盒中出现的不被允许的结果。它是在GE...……更多
腾讯宣布下调大模型价格
...tokens调整为全面免费。混元-standardAPI输入价格下降55%,API输出价格下降50%,新上线的混元-standard-256k,API输入价格下降87.5%,API输出价格下降50%。最高配置万亿参数模型混元-pro,API输入价格降幅达70%。元器-API分发(其他场景)..……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...能力,即:输入具有单个对象的图像,理解并遵循指令,输出基于该对象的新图像。同时,OmniGen 具有更高阶的能力:指代表达生成能力,我们把这种能力定义为能够从包含多个对象的图像中,识别指令所指代的对象并生成新的...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...型深度模型训练后仅适合单一任务和场景,具有固定输入输出长度,适配的变量数等难以泛化的性质,难以像大语言模型一样,适用于各类下游任务,例如T5,LLaMA和BLOOM等。 (3)可扩展性:大模型关键特征之一在于Scaling Law:...……更多
Yann LeCun说自回归要完,DeepMind论文证明自回归能实现通用计算
...码的一种自然泛化,其中在处理每个连续的上下文之后,输出的 token 都会被添加到序列末端 —— 只要输入能放入上下文窗口中,则该过程就会简化成标准的自回归解码。不过,该团队得到这一结果的过程比较复杂,涉及到一步...……更多
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%
...义为一个函数LLM:T*→ T*,该函数将输入的词元序列映射到输出的词元序列。 给定一个语义判断函数JUDGE : T*×T*→ {NO, YES} 和一个有害请求R∈T*,攻击者的目标可以表述为:当然,想要测试出大模型致命缺陷,研究方法需要依赖将...……更多
超级干货丨360AI搜索如何准确识别用户意图?
...的话,通过自主反思、自主纠错、多方法和调用多模型,输出更全面、更优质、更精准的答案。3、赋能广告营销,让AI撬动生意新入口在360AI搜索开发过程中,我们发现AI也可以来做关键词和用户意图匹配的角色,对营销广告进...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...语言完全说清,通过明确定义的语言 prompt 来控制模型的输出行为难以奏效。这个时候,图文信息一起「看」来理解,就像我们婴童时期那样观察、模仿、学习,往往更加直接与准确。 这其实就是多图 ICL(In context learning)上下...……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...,持续探索在相同的硬件条件下实现高吞吐量(tokens/s)的输出,更好地支撑大模型实际应用。成都西交智汇基于⻜桨和文心大模型打造的中学实验操作教考智评系统,实现实时采集多模态数据,进而评价实验操作并给出定量评价...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...和调用API。价格根据官方公布的价格所示,Minstral 8B输入输出价格为百万token,0.1美元。Minstral 3B则为百万token0.04美元。开源版OpenAI,不再Open自去年成立以来,Mistral曾以磁力链方式开源了多款媲美OpenAI的模型,一路走红得到AI社...……更多
用大模型一站式解决企业服务难题,「安安创新」完成1500万天使轮融资|36氪首发
...等AI工具进行智能诊断,结合自主知识图谱+专家知识库,输出专业解决方案。公司的核心创始团队来自国内外知名院校,具备传播、金融、法律、管理等多元背景,在主导企业上市、智能科技应用等领域有着丰富的经验和资源。...……更多
...语言模型进行处理,得到添加有水印词的第一回复信息并输出,其中,目标指令用于指示语言模型在处理的结果中添加水印;在请求文本的类别不属于目标类别的情况下,将请求文本输入至目标语言模型进行处理,得到第二回复...……更多
从系统对接到科技输出,科技驱动的银行协同创新模式在过去十余年不断演进。日前,由《中国金融电脑》杂志主办、兴业数金出品的“科技驱动的同业协同创新与数字化转型”分主题活动在上海举办。来自工银科技、平安金...……更多
更多关于科技的资讯:
参半出席中国口腔新健康行动“全国爱牙日”活动 共筑国民口腔健康防护基石
9月19日,“中国口腔新健康行动・2025年全国爱牙日”活动在人民网演播厅举办。活动现场,中国口腔清洁护理用品工业协会
2025-09-22 11:44:00
CICAS组委会联合知乎开启第三届全国人工智能应用场景创新挑战赛AGI专项赛
9月20日,以“AI之下,科技重构”为主题的知乎首届TechClub新知科技大会在杭州拉开帷幕。学界专家、企业高管、AI开发者
2025-09-22 11:52:00
于都“织”出老区振兴新图景
本报讯 (全媒体记者李思成) 9月的赣南大地,秋意正浓。近日,记者随“高质量发展中国行·焕新江西”专题活动采访团一行走进赣州市于都县
2025-09-22 07:15:00
近日从太钢获悉,太钢供应用于国家能源局首台(套)重大技术装备项目——扎拉水电站的900兆帕超高强磁轭钢顺利通过叠检试验
2025-09-22 07:26:00
南京微短剧有流量更有“料”
微短剧《平凡警事》海报。微短剧《金箔奇缘》海报。百川短剧剧组在拍摄现场。 中国(南京)游戏谷。□芮天舒韶静王懿闫葛菲地铁里
2025-09-22 07:40:00
为什么越来越多的女生,恋爱前要交换体检报告?
“亲亲许可证”在即将接上吻的那一刻,女友的脑袋往后一躲,闪开了。紧接着,她抬起头,认真地盯着老王,问他,“你有没有幽门螺旋杆菌
2025-09-22 00:56:00
河北日报讯(见习记者康晓博)AI工业内窥镜、无针注射笔、分布式储能路灯、风滚草仿生播种机器人……9月20日,2025河北国际工业设计周活动开幕
2025-09-21 08:12:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜 徐燕) 最近,不少厦门市民都注意到这样一个现象:上班高峰期,正当大家为等候BRT快速公交车而焦急时
2025-09-21 09:00:00
乐陵杨安镇香辛料数智化交易平台正式启动
9月20日,乐陵市杨安镇以“智链未来・香聚全球”为主题的香辛料数智化交易平台启动仪式暨黄河商品交易市场香辛料品种上线仪式隆重举行
2025-09-21 09:25:00
现场签约金额达115亿元!中国制造业民营企业合作交流对接会聚焦“AI+”
大皖新闻讯 9月20日,2025世界制造业大会中国制造业民营企业合作交流对接会在合肥举行。活动现场签约项目10个,总额115
2025-09-21 10:14:00
留交会上首次设立“新招引企业专区”,200多个岗位虚席以待——这里有一份令人“新”动的邀约□南京日报/紫金山新闻记者张甜甜在9月20日举行的留交会现场
2025-09-21 10:24:00
“+”上去,活下来——2025世界制造业大会采访引发的思考
大河网讯 9月20日,2025世界制造业大会在安徽合肥开幕。河南省作为主宾省参会,30家企业参展。在人们的印象中,河南农业可圈可点
2025-09-21 14:48:00
十堰成功举办2025新能源汽车零部件交易会项目路演 十大前沿技术项目集中亮相
十堰广电讯(全媒体记者 耿吉国 通讯员 刘爱理)9月21日上午,2025新能源汽车零部件交易会项目路演活动在十堰国际会展中心成功举办
2025-09-21 15:32:00
河北新闻网讯(王丽英)近日,宁晋县晶龙餐饮管理总公司凭借市场化转型与外向型发展战略的深入实施,成功签约宁晋县产融区学生食堂
2025-09-21 15:53:00
中新经纬9月20日电 题:L2新国标将给智能驾驶立“铁律”作者 江瀚 盘古智库高级研究员智能网联汽车组合驾驶辅助系统或将迎来国家标准
2025-09-21 19:36:00