• 我的订阅
  • 头条热搜
大模型应用疯狂加速,洗牌却在静悄悄进行了
...腾讯混元大模型却基于自身的技术能力,保证正确答案的输出。 与业界消除“幻觉”的通用做法不同,混元大模型并没有为大模型增加搜索或者知识图谱等外挂,而是从源头上解决问题。具体来说,混元大模型从第一行代码开...……更多
专访微软AI CEO:没有 OpenAI,我们也能训练出世界上最好的模型
...统注定会重复它们所接受的训练数据”。查询训练数据和输出结果之间存在某种一对一的映射关系。如今很明显,它们实际上并没有这么做。对训练数据的多个 N 维元素之间的空间进行插值,这本身就是一个创造性的过程,对吗...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
...块执行。4、结果整合:汇总各子任务的结果,形成最终输出,并反馈给用户。基于上述框架,咱们接着看整个系统架构,DS Assistant整套系统有4个主要模块。 先说右侧的DS Assistant,它作为整个系统的大脑,负责调度整个系统的...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进行交互成为可能。然而,开源社区对于构建此类基于 LLM 的语音交互模型仍然缺乏探索。实现与 LLM 进行语音交互...……更多
多地政务系统接入DeepSeek,“AI公务员”上岗将带...
...的情况,统称为‘幻觉’。保证信息的精确程度,就需要输出的内容达到场景需求,这要求技术团队提供综合化的端到端的解决方案。”韩斯睿表示,针对AI+政务的应用面临数据质量、隐私安全和技术适配性挑战,需要强化数据...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
... Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力,这些能力都通过SFT和预训练从庞大的训练数据集中学习。但是...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...有多模态大模型结合。比如,驾驶员注意力机制可以实时输出,让乘客实时观察当前大模型所认为权重较大的板块。如果乘客认为不合理,可以语音告诉端到端模型,从而实现自动调节,进而实现持续学习和不断优化。 端到端...……更多
AI占卜爆火,准得让算命师傅害怕?
...抱着AI能提供情绪价值的角度让它给自己算一卦,模型能输出连贯且生动的语言风格,预测的准确性反倒显得不那么重要了。从这个角度出发,无论是让AI算命,还是拿它来做心理咨询,其本质上相差无几。作者| 哈吉编辑 | 陆一...……更多
从“政务助手”到“故障预言家”,人工智能可以赋能哪些场景?
...案归档智能体”,自动化分析公文内容,比对归档规则,输出归档结果,准确率达到90%以上,分类归档工作效率提升近80%。未来,该智能体将持续迭代更新,通过实际使用搜集语料,进一步提升模型分析准确度。在衢州,浙江移...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...果。7、Meta 更新了许可证,允许开发者使用 Llama 模型的输出结果来增强其他模型。在这篇论文的最后,我们还看到了长长的贡献者名单:这一系列因素,最终造就了今天的 Llama 3 系列。当然,对于普通开发者来说,如何利用 405B...……更多
...海量信息里发掘潜在规律,从而更好的预测下一个token的输出。这使得大模型即使面对它不曾见过的情景,或者没有见过的问题,也能进行作答,仿若人类思考和学习的方式。02大模型即操作系统每个时代都有自己的操作系统,...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...; ShieldGemma 基于 Gemma 2 构建,用于过滤 AI 模型的输入和输出,确保用户安全; Gemma Scope 提供对模型内部工作原理的无与伦比的洞察力。其中,Gemma 2 2B 无疑是「最耀眼的仔」,它在大模型竞技场 LMSYS Chatbot Arena 中的结果令人眼……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...场景的需求;第二,鉴于 Transformer 注意力机制作为概率输出模型,天生具有不可控的机理,AI 须具备可预测和稳定的性能;第三,面对大模型可能产生的信息幻觉,确保内容的准确性和真实性是一大挑战;最后,必须包括内容...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...知系统运行,比如通过一系列的神经网络层,并产生一个输出的过程。 对于任何一个单一输入,通常只有一个输出,但在很多情况下,对于一个感知输入,可能存在多种可能的输出解释。你需要的是不仅仅计算单一函数,而是...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...与人类的意图相对齐、研究如何通过不同对齐算法让模型输出更符合人类预期和价值观具有重要意义。该框架的独特之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区...……更多
OpenAI开启调查:GPT-4o及4o-mini模型性能下降
...中,即便提供了明确的时间节点和直飞航班信息,模型的输出结果中仍出现了不存在的航班信息,即产生了“幻觉”现象。实验进一步揭示,即便是最前沿的模型,在生成连贯且冗长的内容方面仍存在较大提升空间。特别是在需...……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...用门槛,让大模型变得更为“实用”,腾讯开始加快对外输出大模型能力的脚步。如腾讯混元发布了智能体平台“腾讯元器”,帮助用户以极低的门槛创建专属AI智能体,并支持一键分发至QQ、微信客服、腾讯云等渠道。这被普...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...。此外,D-FINE 将定位知识 (Localization Knowledge) 融入到模型输出,通过高效的自蒸馏策略在各层共享这些知识,因而在不增加额外训练成本的前提下,实现了性能的进一步显著提升。 论文标题: D-FINE: Redefine Regression Task of DE……更多
...指标,结合大数据分析技术,提出一套涵盖输入、过程、输出三个层面的评估指标体系,并利用层次分析法确定指标权重,进而建立起综合评估模型。该模型有助于企业全面、客观地评估思政工作绩效,为改进思政工作提供有力...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...模型开发的预训练阶段引入了 Llama 3.1 的 8B 和 70B 模型的输出,用作训练过程中的 token 级目标。在 post-training 阶段,Meta 采用了与 Llama 3.1 相似的方法 —— 在预训练模型的基础上进行多轮对齐,其中每一轮都包括监督式微调(SFT...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
...出了一个两次重加权框架,分别对草稿模型和目标模型的输出分布进行重加权。这个框架具有很高的自由度,两次重加权函数可以不同,验证算法也可以任意选择,只要满足最终算法保持输出概率分布,从而维持输出质量即可。...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...并配合语言指令进行下一步动作的预测。与以 token 形式输出文本内容的大语言模型不同,在 VLA 模型中,算法需要实时处理视觉环境中的动作,快速准确地面对外界做出连续的动作反应。创新奇智的机器人可以保持一秒钟 30Hz 的...……更多
...索”“公式召回”“代码生成”“编译计算”等环节,可输出最终的正确答案。金融事件分析方面,具有多轮高质量金融相关对话、思维导图生成、问题推荐等功能。 ……更多
AI重构人力资源管理新范式:HRrule以“专业+智能”双引擎驱动企业效能革命
...)与知识图谱技术,实现从“单点问答”到“结构化成果输出”的跨越。例如,在绩效考核表模式下,输入任意岗位名称,系统可自动关联OKR/KPI指标库、行业标杆数据及企业历史绩效分布,生成含权重分配、评估维度的完整表...……更多
Sora “拯救”元宇宙,世界模型的潜力才刚释放
...说,Sora 的最大贡献是作为革命性平台,极大降低了视频输出成本。这被一度看作是元宇宙发展的核心桎梏。表面上,它的出现冲击了贴片广告、影视或严肃新闻的禁脔。深层次而言,它更是可以改变教育、文旅和会展等诸多行...……更多
...段,经典算法可帮助过滤噪声、提取关键特征;而在决策输出环节,又可借助其可解释性增强结果可信度。大模型负责复杂语义理解与生成,经典方法则承担精细化校正与规则约束,如此协同,方能兼顾效率与安全。三、迭代升...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...类似高斯分布,而在FFN下采样之前的激活值和注意力中的输出投影中,发现了很多异常值通道和大量接近零的条目(全精度LLM也有类似观察结果)。如图3所示,直接将低位量化应用于这些中间状态会引入很大的量化误差。因此...……更多
大模型商业化模式详解:烧钱之后如何挣钱?
...民币之间。1、 什么是token?Token是用来计量大模型输入、输出的基本单位,也可以直观的理解为“字”或“词”。但是目前并没有统一计量标准,各家大模型平台根据自己的偏好“随意”定义。如腾讯1token≈1.8个汉字,通义千问...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...内免费试用。定价上,Turbo S 输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代混元Turbo模型价格下降数倍。三大方面升级未来将成为混元系列衍生模型的核心基座总结来看,Turbo S模型有三大方面的升级。第一,模...……更多
更多关于科技的资讯:
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00
阿里全力进军AI to C市场 千问APP上线公测
11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。当天,千问APP公测版上线,基于全球性能第一的开源模型Qwen3
2025-11-17 11:08:00
中新经纬11月17日电 据韩联社报道,三星集团将在未来五年对本土科学研究与试验发展等领域共投资450万亿韩元(约合人民币2
2025-11-17 11:48:00
近日,南都湾财社记者注意到,因为小天才电话手表社交圈的流行,已经产生了相应的产业链——加好友、冲点赞、买“靓号”、卖“高粉”账号
2025-11-17 12:04:00
“25岁,我勇敢从大厂裸辞”“37岁年薪百万,却主动告别互联网大厂”“离开大厂两年,我活成了想要的样子”……近来,“大厂离职”话题在社交平台持续升温
2025-11-17 12:05:00
潍坊联通圆满完成2025潍坊企业家大会通信保障任务
鲁网11月17日讯在第6个潍坊市 “企业家日”到来之际,2025潍坊企业家大会于11月1日隆重召开,主会场设在富华国际会议中心
2025-11-17 14:33:00
蓝盾出击!一场与病毒的闪电战——记潍坊联通快速响应团队的72小时攻坚
鲁网11月17日讯2025年10月21日下午,一阵急促的电话铃声在某单位响起,揭开了与病毒赛跑的序幕。“系统异常!多台办公电脑感染未知病毒
2025-11-17 14:34:00
安谋科技Arm China发布“周易”X3 NPU IP,破局AI算力勾勒智能未来全景图
2025年11月13日,国内领先的芯片IP设计与服务提供商安谋科技Arm China,正式揭开了新一代NPU IP“周易”X3的神秘面纱
2025-11-17 14:35:00
凯盛浩丰集团创新人力资源管理斩获北森2025AI应用先锋奖
鲁网11月17日讯近日,凯盛浩丰集团凭借人力资源领域的AI创新实践,斩获“北森2025AI应用先锋奖”。通过将AI技术融入招聘
2025-11-17 14:35:00
2026亚洲100必打卡榜目的地!福州入选
日前,携程正式发布口碑榜2026年度榜单,福州入选“2026亚洲100目的地榜”“2026中国100目的地榜”两个榜单
2025-11-17 15:20:00
当“工业硬核”遇见“健康温度”:如新在一汽开放日奏响家企健康新乐章
鲁网11月17日讯11月15日的青岛,寒意初显,但一汽解放青岛汽车有限公司的即墨厂区内却暖流涌动。一场名为“扬帆家年华·领航新乐章”的2025员工家属开放日暨员工音乐节正在这里温情上演
2025-11-17 15:45:00
2025年中共中央、国务院印发的《教育强国建设规划纲要(2024-2035年)》指出要全面推进智能化,促进人工智能助力教育变革
2025-11-17 16:28:00
吉林“智造”再启航:长光卫星三颗新星成功出征!
2025年11月17日,在吉林省航天信息产业园,长光卫星技术股份有限公司隆重举行了“瑶海科创号”、“电力工程号B星”及“吉星”高分07B01星三颗卫星的出征仪式
2025-11-17 16:36:00