• 我的订阅
  • 头条热搜
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
《科创板日报》5月31日讯(记者 朱凌)直至五月尾声,AI应用市场的火热态势依旧不减。30日,基于混元大模型的AI助手App“腾讯元宝”上线,标志着BAT终于在AI消费C端应用领域聚首。据介绍,自2023年9月首次亮相以来,腾讯混...……更多
...型,RedOne在8个主要的SNS任务上平均提升14.02%,在SNS双语评测基准上提升7.56%。同时,在线上测试中,相较于单任务微调的基线模型,RedOne将有害内容检测(Harmful Content Detection)中的曝光率降低11.23%,将浏览后搜索(Post-view Se……更多
全球权威评测榜单BIRD:蚂蚁数科超越谷歌等公司位居第一
9月26日,据全球权威评测基准BIRD-Bech官网,蚂蚁数科的数据分析智能体Agentar-SQL超越AT&T(美国电话电报公司)、谷歌云、腾讯云、阿里云等诸多国内外厂商,位居全球第一。这也是中国公司在该榜单上取得的最高成绩。BIRD-Be...……更多
自带副驾屏的腾势N7,座舱智能化体验如何?
...其智能化体验有着不小期待。本期咱们借CC-1000T智能座舱评测体系,看看自带副驾屏的腾势N7,会带来怎样的座舱智能化体验。一、什么是CC-1000T智能座舱评价体系CC-1000T是车云研究院与合作伙伴从消费者体验角度出发,共同研发...……更多
阿里QwQ-32B API接口服务上线国家超算互联网:零门槛部署 免费100万Tokens
...理模型,基于Qwen2.5-32B+强化学习构建。据官方公示的基准评测结果,在测试数学能力的 AIME24 评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini 及相同尺寸的R1蒸馏模型。QwQ-32B API调用服务具……更多
全球AI安全评估测试有了新基准
...案“蚁天鉴”,用于人工智能生成内容的安全性和真实性评测、大模型智能化风控、可解释性检测等。此次发布的《大语言模型安全测评方法》,便是基于“蚁天鉴”人工智能安全检测体系的应用实践,与全球生态伙伴交流编制...……更多
安兔兔评测PC版正式发布:电脑强不强 不服跑个分
快科技9月12日消息,安兔兔宣布,全新的安兔兔评测PC版已经正式发布。与Android版本测试流程相似,安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy(内存和存储)和UX(用户体验)四大项,通过模拟多种复杂场景最终得到电...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...n4-Air用到的高质量通用训练数据和训练技巧,都在里面!评测结果显示,在使用百川智能优质通用训练数据与企业专有数据混合微调后,模型在金融、教育、医疗等场景下的专业细分任务的平均可用率高达96%。相比不混合通用数...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和...……更多
...能交互量表,能有效地改善传统单一量表、一对一访谈等评测方法存在的人力成本高、周期跨度长、环境干扰大、标准不统一、结果不真实的弊端。”蒋贻顺说,为了提高产品的准确性,前期经过多次分析论证,之后还征集志愿...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 TeleChat 系列模型提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...源模型文本长度最长的。360表示,他们在OpenCompass的主流评测数据集上验证了模型性能,包括C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA,考察的能力包括自然语言理解、知识、数学计算和推……更多
...1.5-72)。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年,中国电信人工智能研...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的“重构未来 产业智能跃迁”2023大模型产业前沿论坛上,中关村科金正式发布了国内首个企业知识大模型、AgentGraph应用开发平台...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...中,进行开放式生成,推理过程以及各种新兴 NLP 任务的评测。 (2)对齐:对齐技术通常需要大量人工标注的成对偏好数据来训练奖励或者策略模型,通过引入 LLM-as-a-judge 技术,采用更大的模型或者策略模型本身作为评估者,...……更多
万元内的高性价比专业卡——AMD Radeon Pro W7700显卡简评
...MCD的方案,和桌面RX 7900系列产品完全一致。而我们今天评测的Radeon Pro W7700则在核心的配置上基本与消费级桌面版的Radeon RX 7700相仿。 ▲AMD Radeon Pro 7000系全家福,Radeon Pro W7700是面向中高端专业应用市场的显卡产品。在……更多
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
...置。论文还在 UCF-101 和 MSR-VTT Benchmark 上进行了 Zero-shot 的评测,在衡量生成视频丰富性的 IS 指标和文本一致性的 CLIPSIM 指标均取得了 SOTA 结果。 此外,论文还基于 FancyVideo 模型的 T2V 和 I2V 能力分别和前人方法……更多
...获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同...……更多
昆仑万维SkyReels团队正式发布并开源SkyReels-V2
...水平,无明显扭曲或损坏。在SkyReels-Bench的T2V多维度人工评测集下,SkyReels-V2在指令遵循和一致性得到最高水准,同时在视频质量和运动质量上保持第一梯队。2. VBench1.0结果在VBench1.0自动化评估中,SkyReels-V2在总分(83.9%)和质量分(8.……更多
推动“AI+工业” 山东开展行业大模型揭榜挂帅
...型产品体系。引导符合条件的大模型产品积极参与国家级评测认证,增强大模型产品行业认可度与公信力。加大行业大模型产品推广应用,深度拓展应用场景,提升产业链智能化水平。事实上,自去年以来,山东省大模型产业加...……更多
联想小新Pro14 AI超能本2024 评测:创作和娱乐全能
...,我们就为大家带来一款AI PC:联想小新Pro14 AI超能本的评测体验。作为一款针对年轻用户群体设计的笔记本,联想小新Pro14 AI超能本2024在外观设计上保持了小新系列的简约时尚风格,轻薄便携的机身使得它成为移动办公和学习...……更多
开年领跑乘云智胜 华为云开年采购季携Flexus X实例:解锁智能迁移与热变配能力最佳实践
...遥遥领先同规格友商实例根据华为云官方和第三方的对比评测,Flexus云服务器X实例基础模式GeekBench跑分1.6于业界独享型实例,性能模式跑分超友商旗舰C6/R6/G6,与C7持平。其实Flexus云服务器X实例有100+的规格组合,给企业选择实...……更多
麦芒30评测:大模型赋能,一键解锁AI能体验
...运算,智慧生活等等,新功能品目繁多,欣欣向荣。今天评测的产品,便是麦芒品牌的首款AI手机,一句话总结它的产品亮点:麦芒30内置搭载星辰大模型,拥有“6100mAh高密度海量大电池、轻薄耐摔机身、1.5K双曲臻彩屏,以及AI...……更多
CPU超越i9-14900HX、核显强于RTX 4060!ROG幻X 2025评测:独家首发锐龙AI Max + 395、唯一能跑70B大模型
...发布了搭载锐龙AI Max系列APU的ROG幻X 2025平板笔记本。本次评测采用的是系列中最强的锐龙AI Max + 395!锐龙AI Max + 395的CPU部分包含16个Zen5核心,32线程,加速频率5.1GHz,拥有64MB三级缓存,以及16MB二级缓存。规格参数与桌面版锐龙9 .……更多
补锌产品如何选择?最新评测结果公布
...品,从成分、吸收效果、适用年龄段等关键维度展开深度评测,同时详细拆解 “药字号” 与 “食字号” 补锌产品的核心差异,结合《中国居民膳食营养素参考摄入量》的剂量标准,让家长们既能选对产品,也能掌握正确的补...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...aude3.5等业界领先模型的效果表现。 表格中,其他模型的评测指标来自官方评测结果,官方评测结果中不包含部分来自混元内部评测平台。接下来,混元Turbo S模型将逐步在腾讯元宝灰度上线,很快就会全量覆盖。目前,开发者...……更多
速度是友商22倍!华为AI存储斩获中国最权威测试第一
...储测试中综合能力第一。据了解,CCF Storage Evaluation存储评测工作由清华大学、中山大学、之江实验室等顶尖大学和学术机构专家组成的CCF信息存储技术专委会存储测试工作委员会发起。它也是目前中国最权威、最专业的AI/LLM的...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...至比他们更严重,非常类似。GLM-130B唯一来自亚洲被列入评测的对象张鹏说,2022年我们在训练自己的千亿模型的时候,我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群,凌晨三点多的故障,我们可以在5分...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...测试,旨在通过明确的任务模糊性判断和用户意图理解来评测智能体的交互能力。IN3 基准数据的构造过程如上图所示,基于人类编写的种子任务为 Step 1,模型迭代生成新任务以增强数据集,同时从数据集中采样以作为下一轮生...……更多
云从科技:大模型五虎与AI智能体的领航者
...,加速了产业升级和数字化转型的步伐。 此外,在综合评测权威平台OpenCompass公布的评测结果显示,云从科技的从容大模型在该体系中的平均得分为65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v...……更多
更多关于财经的资讯:
太平洋房屋战略布局再落两子 沪南、沪中事业部同步成立
近日,沪上知名房地产服务企业太平洋房屋宣布了一项重要战略举措:于11月内相继成立沪南事业部与沪中事业部。此举标志着太平洋房屋在深化上海市场精细化运营
2025-11-22 09:21:00
51股股价较11月最高价下跌幅度逾31%
本周市场出现调整,周五个别此前跌幅较大的个股出现反弹,比如禾信仪器股价出现涨停。根据Wind数据统计,截至11月21日,51股股价较11月最高价回撤超过31%。市场人士表示,超跌
2025-11-22 09:40:00
中安科技集团董事长郑建新荣获“2025年企业家精神和优秀创业者标杆”
11月21日,2025企业改革与发展创新实践交流会暨优秀企业管理实践成果(案例)发布会在北京举行。会上,中安科技集团董事长郑建新荣获“2025年企业家精神和优秀创业者标杆”
2025-11-23 01:16:00
山海为墨跨村联建执笔 莱州画出一片乡村“五好”画卷
胶东在线11月19日讯(记者 鞠平)“金山银海和美金城”是莱州市的市级乡村振兴片区,在这一片区里,农民是一个非常“幸福”的职业
2025-11-23 02:03:00
从一村穷到一片富 成“大户”的秘诀是“三产融合”
胶东在线11月19日讯(记者 鞠平)大户这一片曾有个称谓叫“老难村”,位于招远西南部的这十几个村被调侃为兔子不拉屎的地界
2025-11-23 02:03:00
中金“三合一”整合暗藏财富密码 散户直言要盯紧投资机会
11月19日晚间,中金公司、东兴证券、信达证券发布《关于筹划重大资产重组的停牌公告》,三家公司正在筹划由中金公司通过向东兴证券全体A股换股股东发行A股股票
2025-11-22 09:40:00
边风炜:敬畏估值是投资第一性原则
本周全球股市出现震荡,各大媒体、自媒体都在分析调整的原因,无非是海外不确定性增加、科技泡沫滋生、美联储降息放缓、基金漂移风格回归等
2025-11-22 09:40:00
中汇人寿河南分公司成功举办“豫汇共舞出彩中原”健身舞大赛
大河网讯 为深入贯彻“健康中国”的国家战略,秉持国有企业的使命担当,积极探索“体育+金融” “健康+金融”的创新路径,深刻诠释“安心文化”倡导的“健康是福”精神内核
2025-11-22 07:23:00
农发行张家港市支行顺利完成2025年度辖内贷款企业信用评级工作
日前,农发行张家港市支行圆满完成了辖内贷款企业2025年度客户信用评级工作。本次评级工作旨在精准识别和评估客户信用风险
2025-11-21 23:32:00
农发行盐城市大丰区支行以同业合作赋能实体经济
近日,中国农业发展银行盐城市大丰区支行通过为同业客户开立首笔投融资账户,成功引入1亿元同业存款资金,以创新同业合作模式为实体经济高质量发展蓄能增势
2025-11-21 23:32:00
农发行无锡市分行召开2025年年中党建与业务经营分析会
近期,农发行无锡市分行召开2025年年中党建与业务经营分析会。会议传达贯彻上级行年中工作会议精神,总结回顾上半年工作,分析当前形势和存在问题
2025-11-21 23:32:00
张家港市农发行:筑牢征信合规根基 提升金融服务质效
在当前金融环境深刻变革、风险防控要求持续提升的背景下,健全的征信体系作为金融基础设施的“压舱石”,对精准识别信用风险、维护区域金融安全稳定具有不可替代的战略意义
2025-11-21 23:32:00
宝应农发行组织签署《共筑反洗钱倡议书》
为进一步提高员工对反洗钱工作的认识,强化反洗钱责任意识。近日,宝应农发行组织全体员工签署“共筑洗钱防线”倡议书,积极营造全员参与反洗钱工作的良好氛围
2025-11-21 23:32:00
农发行江阴市支行开展员工思想动态调查分析
为把握员工思想脉搏,凝聚发展合力,农发行江阴市支行于近期开展员工思想动态调查分析。通过设计问卷、全员参与、精准分析与贴心关怀
2025-11-21 23:32:00
农发行江苏省南京市雨花区支行开展公文写作培训 提升综合履职能力
为进一步提升员工公文写作水平,规范公文处理流程,近日,农发行江苏省南京市雨花区支行组织业务骨干参加了由省分行举办的公文写作专题培训
2025-11-21 23:32:00