评测报告,清华,模型,评测,能力,报告头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

清华发布2024年3月版《SuperBench大模型综合能力

...框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型，结果显示：文心一言4.0表现亮眼。例如在人类对齐能力评测中，文心一言4.0表现优异，位居国内第一，其中在中...……更多

2024-04-22 09:46:00评测报告,清华,模型,评测,能力,报告

“整活”保险业务，AI大模型哪家强？

...险行业？10月10日发布的《人工智能大模型保险行业应用评测报告》（以下简称《报告》）便揭晓了答案。根据《报告》，10个主流大模型在知识问答领域表现普遍较好，在智能核保、智能理赔、话术优化上表现不尽如人意，在营...……更多

2023-10-10 17:56:00模型,业务,模型,报告,应用,能力

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

...上技术迭代的步伐，月狐数据发布《2023 AIGC应用app智能化评测报告》，该报告为中国市场首份围绕AIGC应用app的智能化水平以及智能体能力的专业测评报告，旨在通过多维度量化指标帮助用户更直观地评估现有主流AIGC应用产品的...……更多

2024-03-14 17:06:00数据发布,评测报告,中国,评测,智能,报告

清华郑纬民院士：AI for Science的出现，让高性能

...机遇共存交织的当下，这一领域泰斗中国工程院院士、清华大学计算机科学与技术系郑纬民，在 MEET2023智能未来大会上，分享了自己的见解和思考。估计未来两年到四年， HPC （高性能计算）+AI+BigData融合的服务器就会出现。AI ...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...本文转自：中国新闻网近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)，结果显示，三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

智慧芽AI助手“芽仔”：你的智能研发专家，开启创新新范式

...新能源汽车、半导体等50多个高科技行业。国内客户包括清华大学、北京大学、中科院、中国石化、海尔、美的、小米、宁德时代、小鹏汽车、大疆、药明康德、商汤科技、华大等；国际客户包括麻省理工学院、牛津大学、陶氏...……更多

2024-03-21 16:15:00新新,范式,助手,智慧,智能,专家

“AI考生”闯关高考，谁是最会做题大模型？

...报记者赵广立2024年全国高考的“硝烟”刚刚散去，“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱，围绕“大模型技术哪家强”的讨论不绝于耳，各色名目的大模型评测应运而生。作为国...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...治理框架、合规治理、赋能治理展开，安全组主要开展大模型安全、合规等研究及基准测试。今年6月，中国信通院依托该委员会发起“人工智能安全守护计划”，包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

12月22日，国内首个官方“大模型标准符合性评测”结果公布，百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

商汤语言大模型获评第一

...沙利文联合头豹研究院发布《2023年中国大模型行研能力评测报告》。评测结果显示，商汤语言大模型“日日新·商量”以总分7.73（满分10分）斩获总榜第一，并在报告撰写能力、模型基础能力两个子榜位居第一。 ……更多

2024-01-13 00:05:00商汤,模型,语言,模型,能力,国大

AI科研风暴来袭，中科院北大复旦大咖齐聚！海淀解锁千万算力补

...直大模型中选择一类进行申报，并提交模型自评或第三方评测报告（包括但不限于模型理解、推理、生成能力及智能性、鲁棒性、效率等）。对于通用模型的申报，还将交由统一组织的第三方机构进行评测，最终根据专家评审...……更多

2024-11-08 09:43:00复旦,海淀,中科院,补贴,北大,科研

智谱AI CEO张鹏：智谱AI的GLM-130B是达到世界靠

...、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告，报告的名称缩写叫HEOM，对全球的几十个开源和闭源的模型进行了深入的评测，有幸我们的GLM-130B作为一个唯一来自中国，甚至唯一一个来自亚洲的这样一个模型...……更多

2024-03-15 09:40:00张鹏,自主研发,水平,世界,产品,模型

2023中国移动智能硬件质量评测报告出炉

...，中国移动终端公司发布了《2023中国移动智能硬件质量评测报告》（以下简称“报告”），对市场上各类智能硬件，包括但不限于5G手机整机、5G折叠屏手机、Wi-Fi 6路由器等展开了全面评测。尤其在5G智能手机领域，手机摄像头...……更多

2024-01-17 19:10:00评测报告,中国,中国移动,评测,质量,硬件

AMD跑大模型终于Yes！MI300X对比NVIDIA H1

...出了与NVIDIA H100/200相媲美的实力。根据The Information发布的评测报告，AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当，显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据，在……更多

2024-09-05 11:09:00逊色,模型,测试,评测报告,戈麦斯,领域

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Mat……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

多家券商最新研判：海螺AI爆火，MiniMax商业化进展迅速

...。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后，海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计，海螺AI网页版在9月的访问增速超8倍，海外用户纷纷在社交平台分享使用体验，普遍认为海...……更多

2024-11-15 09:59:00海螺,券商,多家,进展,商业,海螺

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据