• 我的订阅
  • 头条热搜
智源评测体系发布 国内外“百模”评估结果出炉
...存在一定的偏差。当前,大模型的发展具备了通用性,在逻辑推理能力上有显著提升,日趋接近人脑的特征。因此,在海淀区教委支持下,智源研究院联合与海淀区教师进修学校对齐学生测验方式,考察大模型与人类学生的学科...……更多
...求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开...……更多
...加持的行业安全可信大模型,具备生成创作、多轮对话、逻辑推理等多项核心能力,通过海量通用数据与行业特有数据融合,更好的适应行业客户的业务需求,推动大模型在政企行业场景的精准落地。面向行业的安全可信行业专...……更多
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
...出现的松鼠。这类游戏的逻辑相对复杂,更考验OpenAI o1的逻辑推理能力。官方还表示,相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。比如在解答编程问题时也会更有...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...不足,腾讯还特别强化了模型在高质量文本创作、数学和逻辑推理等方面的能力。 文本创作能力的显著提升在文本创作领域,大多数大模型表现平平,尤其在专业写作方面,常常缺乏足够的灵活性和精准度。混元Turbo在这方面...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...下,夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...布了GPT-o1大模型,“思考能力”显著提升,能够进行复杂逻辑推理和问题拆解。在本次大会上,朱光也分享了度小满用推理大模型在风控场景上做的一些创新性探索。在信贷领域,推理大模型可以通过分析客户的征信报告、银行...……更多
国产大模型真正角逐时刻:从钉钉智能客服开始谈起
...通常被设定了几个高频关键词,但一旦遇到稍难或者带些逻辑推理的问题时便无计可施。这是横亘在过去企业数字化最普遍同时也是最棘手的问题。一般来说,以往的智能客服的聪明程度往往取决于它背后有多少人工,你标记的...……更多
我国首个农业通用大语言模型发布
...决现有通用基础大模型知识记忆错误、信息时效性不足、逻辑推理错乱、缺乏专业知识等问题,突出专业、安全、可信等特色。信息所副所长赵瑞雪介绍,大模型可提供智能决策和知识服务,应用于种植生产管理、农业气象预警...……更多
国内首个针对汽车行业的大型语言模型标准发布
...包括但不限于感知环境的准确性、理解用户意图的深度、逻辑推理的严谨性以及信息生成的创新性。这一标准的设定,促使大模型在处理复杂的道路状况、识别驾驶员情绪变化、预测潜在风险以及提供个性化建议等方面展现出更...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...势以外,CoE模型在其余11项指标上均优于GPT-4o,特别是「逻辑推理」、「多步推理」、「诗词赏析」这类比较具有中文特色的问题,CoE的领先优势更加明显。目前,360的「多模型协作」已经能打败并远远甩开GPT-4o,媲美o1-preview。...……更多
...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
...了强化。首先面对复杂问题的解决全面升级了多层次分析推理能力,再难的问题都努力为你解答。其次细分了更明确的目标群体,升级了金融投资和科研学术专业 AI 搜索,将这些领域的解答精准度提升到了前所未有的水平。最...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
中国科技创新“乘”数直上
...中,15家厂商的模型产品已经通过备案。凭借语言理解、逻辑推理、知识问答、文本生成等通用能力,这些大语言模型产品一经推出,便受到用户的欢迎。“科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。”这是...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。简单来说,现在通义千问不仅能“看”,也能“听”了,而且更加耳聪目明。此前8月,通义千...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...1.6的智能服务可以覆盖更多元的场景、具有更强的常识和逻辑推理能力。图片来源:用户在X平台对LLaVA-1.6的试用截图在上图的应用场景中,用户发给LLaVA-1.6一张机票,询问与之相关的接机和日程安排。LLaVA-1.6不仅准确的估计了...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...力平台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。百川智能发布Baichuan 3大模型,更好理解中文1月29日,百川智能发布超千亿参数的大语言...……更多
文心大模型赋能千行百业,自主进化
...型3.5相比3月份的版本,效果提升50%,训练速度提升2倍,推理速度提升30倍,文心大模型3.5还新增了插件机制,扩增了大模型的能力边界。10月17日,百度世界2023大会上,李彦宏宣布文心大模型4.0正式发布。文心大模型4.0是迄今为...……更多
李彦宏:开源模型将会越来越落后 | 最前线
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗?谷歌 DeepMind 的一篇论文似乎得出了相反的结论。最近,DeepMind 今年 2 月份的...……更多
星火大模型v3.5发布,带来七大能力提升
...文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。此外,星火认知大模型V3.5的语言理解、数学能力号称已经超过GPT-4Turbo,代码能力达到GPT-4Turb...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...佳论文奖。大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。然而,这类模型在最基础的算术问题的表现上却不尽如人意。当遇到算术问题时,LLM 通常依赖记住特...……更多
...绍,其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5,拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力,同时能够实现单...……更多
...理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Lla...……更多
美的集团首席AI官唐剑:AI和智能机器人是家电行业巨大的机遇|新质生产力·AI Partner大会
...的问题,能够准确识别家居控制意图,大模型有非常强的逻辑推理能力,结合对用户习惯的学习以及逻辑推理能力,预测下一步用户想做什么,从而做一个简单的规划,提前为客户提供主动服务。有了美言大模型,结合美的入口...……更多
百度文心大模型4.0技术进展
...模型3.5,在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破,取得效果和效率的提升。今天发布的文心大模型4.0,相比3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和...……更多
更多关于科技的资讯:
精致餐饮品牌推抖音“年夜饭”套餐,解锁“场景营销”新思路
春节前夕,年夜饭销售紧俏,主打高品质的“精致餐饮”备受欢迎。为满足消费需求,抖音生活服务联合大董烤鸭、紫薇美力集团旗下餐饮品牌鲁采LU STYLE
2025-01-29 08:40:00
2025贺新春瓣瓣同心京津冀 欢欢喜喜过大年大年初一,天津的古文化街年味浓郁。一系列新春活动,吸引天南海北的游客前来逛街赏景
2025-01-29 09:09:00
厦门网讯(厦门日报记者 朱道衡)春节来鼓浪屿要怎么玩?一天之内能否逛完,只有两个小时该怎么玩?鼓浪屿景点众多,游客该如何串联
2025-01-29 09:37:00
阿里云首次亮相总台春晚,云技术支持全球观众看直播
1月28日晚,阿里云首次亮相中央广播电视总台蛇年春晚,云技术支持全球观众观看春晚直播。作为总台春晚云计算AI独家合作伙伴
2025-01-29 13:18:00
美国科技巨头“收割者”!国产DeepSeek干掉英伟达4.3万亿市值
快科技1月28日消息,临近春节,中国人工智能公司DeepSeek突然爆火,其发布的DeepSeek-R1大模型性能上比肩OpenAI o1
2025-01-28 09:06:00
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
快科技1月28日消息,日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元(约合人民币4.27万亿元)
2025-01-28 10:07:00
王晶监制电影《笑傲江湖》上线爱优腾:张雨绮版东方不败来了
快科技1月28日消息,今日,电影《笑傲江湖》在腾讯视频、爱奇艺、优酷三大平台上线,同时发布“春满江湖”版海报。海报中,东方不败(张雨绮饰)侧卧雪地
2025-01-28 10:07:00
7月11日上映!DC《超人》新预告发布:只身大战反派、怪兽
快科技1月28日消息,DC全新的《超人》发布了新版预告,展示了超人翱翔于冰原之上、只身大战怪兽的场景,卢瑟等反派人物也一一登场
2025-01-28 10:37:00
快来看哪个更牛!网友热捧DeepSeek创意写春联
快科技1月28日消息,据媒体综合报道,近日,随着新春佳节的临近,一股创意写春联的热潮正在网络上悄然兴起。而在这场创意盛宴中
2025-01-28 10:37:00
李子柒将首次亮相央视《春晚》:讲述服饰的非遗故事
快科技1月28日消息,据央视频官方透露,今晚李子柒将首次亮相央视《春晚》,并担任“春晚体验官”,讲述演出服饰上的非遗故事
2025-01-28 11:07:00
育碧再次大裁员!185名员工被裁 英国工作室永久关闭
据eurogamer报道,育碧近日宣布,将关闭位于英国莱明顿的工作室,并裁减公司185个职位。部分莱明顿工作的员工将通过远程合同继续留职
2025-01-28 11:07:00
全球罕见!中国这两座城市又有“雪窝子”了
快科技1月28日消息,据媒体报道,近日,山东半岛东北部的烟台和威海再次因其频繁的降雪而备受关注,被形象地称为“雪窝子”
2025-01-28 11:07:00
直角拐弯学废了:妈妈练完车回家过桥把女儿撞进水沟
快科技1月28日消息,今天,话题#妈妈练完车回家过桥把女儿撞进水沟#登上热搜。据报道,事发1月26日,一位年轻妈妈在练完车后驾车回家
2025-01-28 11:37:00
DeepSeek爆火 网友热议广东AI三杰
快科技1月28日消息,据媒体综合报道,近日,随着DeepSeek公司的崛起,其创始人梁文锋成为了公众瞩目的焦点。这位1985年出生于广东湛江的科技奇才
2025-01-28 11:37:00
斥资5个亿!迅雷将收购虎扑
快科技1月28日消息,据新浪科技报道,迅雷(XNET.US)已同意以5亿元人民币的总现金对价收购运营体育平台虎扑的上海匡慧网络科技有限公司
2025-01-28 12:07:00