评测,评估,体系,结果,模型,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里巴巴“AI驱动”战略提速夸克发布自研大模型

...内容生成等技术优势，夸克大模型在CMMLU权威榜单的最新评测结果中，取得优异成绩。同时，夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知识能力方面，夸克大模型拥有广泛的知识覆盖、上下文理解、创...……更多

2023-11-14 16:05:00夸克,阿里巴巴,阿里,提速,模型,驱动

科大讯飞副总裁刘聪：认知智能大模型的技术阶跃及颠覆式影响｜W

...强调发展和评估认知大模型能力，首先必须有科学系统的评测体系。第二我非常赞同刚刚韦总提到的实践是检验真理的唯一标准。仅凭几个问题测试就评价大模型的能力并不科学，如何让大家全面了解大模型的能力以及实际应用...……更多

2023-05-29 13:55:00颠覆,讯飞,峰会,产业发展,副总,认知

商汤语言大模型获评第一

...沙利文联合头豹研究院发布《2023年中国大模型行研能力评测报告》。评测结果显示，商汤语言大模型“日日新·商量”以总分7.73（满分10分）斩获总榜第一，并在报告撰写能力、模型基础能力两个子榜位居第一。 ……更多

2024-01-13 00:05:00商汤,模型,语言,模型,能力,国大

模型即服务，卓世科技MaaS平台 2.0 正式上线

...了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服务、应用部署...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

当国风遇上“太医管家” 中国太保为华服周带来健康新理念

...、血压健康评估、心脏健康评估、脑健康评估等4个健康评测服务，每个项目几分钟就能完成，并能即时出具综合健康评估报告，如有疑问，还可咨询线上医生解读报告，非常便捷。其中，智能中医脉诊通过大数据、人工智能、...……更多

2024-04-12 18:49:00华服,国风,太医,管家,中国,理念

多家车企质疑懂车帝冬测，中汽协呼吁汽车评测应专业公正

...体而言，此次懂车帝冬测引发广泛质或将成为第三方汽车评测领域的转折点，众多网友纷纷呼吁尽快出台真正科学、专业、严谨、公正的测试标准，为行业发展和用户购车用车带来真正的价值。 ……更多

2023-12-15 00:04:00多家,评测,汽车,专业,测试,汽车

腾讯混元文生图大模型升级并对外开源

...配置要求据此前报道，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、成为首批通过评测的国产大模型，首批通过的大模型还有阿里通义千问、360智脑和百度文心一言。 ……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...5T基础平台软件产品兼容国内主流芯片。一、混元Turbo之评测混元Turbo的核心技术混元Turbo的发布凝聚了腾讯团队长期以来对大模型技术的深入研究。该模型采用全新的分层异构MoE架构，创新之处在于通过合理配置专家数量与激活...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

华为WATCH 4 Pro星球系列手表评测

华为WATCH数字系列一直以来都是全能旗舰选手，独特的美学设计、领先的健康功能、完备强大的鸿蒙体验，数字系列将美学和科技相结合，每一款产品都在不断突破。2021年的华为WATCH3系列是华为首款搭载HarmonyOS的智能手表，为...……更多

2023-05-23 00:31:00华为,星球,手表,评测,华为,手表

小米14 Pro成4000元以上高端旗舰机型第一

1月17日消息，今日，中国移动发布2023年年度综合手机评测数据结果，小米14Pro成4000元以上高端旗舰机型第一，对此雷军发微博称，祝贺小米14研发团队。其中，该评测选取了“2022年11月至2023年12月”的32款热门机型，覆盖4个价...……更多

2024-01-18 05:49:00小米,旗舰,机型,高端,小米,雷军

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上，MiniCPM-2B的表现超过了Llama 2-70B-Chat。MiniCPM-2B和Mistral-7B在主流评测集上的测评结果。图源：面壁智能MiniCPM-2B和主流模型在MT-Bench上的测评结果。图源：……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

成都网络质量位居全国第四

...展论坛上，发布了“2023年度全国重点区域移动网络质量评测现场路测结果”，其中成都网络质量综合情况综合得分排名第四。据悉，本次评测范围涵盖全国102个城市，共有300多家运营商参与专项评测，测试场景包括城区快速路...……更多

2024-06-13 01:56:00成都,质量,全国,网络,评测,场景

汽车之家《新能源突破计划》锚定新能源车安全测试新基准

...拆解消费者对新能源车的需求和痛点，站在用户角度进行评测，以实车对撞、拆解分析、电池包浸水、智能辅助驾驶实际道路测试等实用测试科目，解答用户最关心的新能源用车疑问，强化用户对新能源安全的认知。而专业的测...……更多

2024-01-07 19:44:00新能源,基准,突破,测试,安全,之家

科大讯飞刘庆峰：讯飞星火大模型10月底整体赶超ChatGPT

...智能“星火”生态。一、提出通用人工智能七大维度481项评测体系赶超GPT要有科学的方法和体系自去年11月30日ChatGPT发布以来，认知大模型技术阶跃持续进化，人工智能在全球引起了广泛关注，掀起了全新的热潮。在多个领域，...……更多

2023-05-08 13:43:00讯飞,星火,模型,整体,讯飞,星火

传音发布国际标准itu-tsg16全会结项评审

...流程和元数据、图像增强技术、双摄协同技术、图像美学评测等方向的标准构建，传音将联合产业链上下游及行业专家建设实现计算摄影领域国际标准的全方位布局。▲传音TecnoPhantomX2旗舰手机IT之家从官方公告获悉，传音围绕...……更多

2023-12-07 03:13:00全会,国际标准,评审,标准,国际,标准

十一部门联合开展“信号升格”专项行动

...，缩短审批时间。（四）推动“能力升格”，促进监测评测水平提升1.完善网络质量评测体系和监测能力。中国通信标准化协会加快开展面向应用的端到端网络质量评测标准体系研制。中国信息通信研究院持续完善全国移动网...……更多

2024-01-04 15:28:00专项,信号,部门,行动,联合,网络

医疗大模型激战正酣，京东健康锋芒再露

...逐大赛也在升级。日前，面向中文医疗大语言模型的开放评测平台MedBench更新评测榜单，京东健康旗下“京医千询”大模型以综合得分92.4分的成绩位居榜单第一。“全面的模型能力评估体系会告诉我们团队，‘京医千询’的智能...……更多

2024-07-24 17:51:00京东,锋芒,模型,医疗,健康,京东

科大讯飞入局大模型混战，刘庆峰：10月底将赶超ChatGPT

...快速追赶并努力超越的过程中，首先需要一套科学系统的评测体系。为此科大讯飞和中国科技大学共同承建的认知智能全国重点实验室，牵头设计了通用认知大模型的评测体系，涵盖前述七大维度，涉及481个细分任务类型。刘庆...……更多

2023-05-07 03:00:00模型,讯飞,模型,星火,能力,认知

ColorOS 14评测：让用户更省心的智慧手机系统

在旗舰手机处理器性能普遍过剩的今天，一款手机的日常体验如何更多地是由系统体验决定的，因此手机系统的体验升级也已经成为了当下用户与手机厂商所共同关心的焦点。在众多的手机系统当中，OPPO手机所搭载的ColorOS系统...……更多

2023-11-16 16:24:00评测,智慧,用户,系统,手机,用户

忆恒创源PBlaze7 7946 6.4TB评测

...0又分为1DWPD的PBlaze77940和3DWPD的PBlaze77946两个子系列，本文评测的正是后者，形态U.2，容量6.4TB。作为应用PCIe5.0接口的全新一代SSD，性能无疑是我们最为关注的看点。根据忆恒创源官方介绍，PBlaze77940拥有14GB/s的顺序读取速度和10G……更多

2023-12-22 19:39:00恒创,评测,恒创,企业,数据,性能