评测结果,研究院,评测,结果,研究,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

容联云容信通过中国信通院“办公即时通信软件安全能力”评测

...023年1月13日，容联云旗下“容信”顺利通过中国信息通信研究院（以下简称“中国信通院”）“铸基计划-办公即时通信软件安全能力”完备级评测。随着数字化转型的全面提速，场景复杂、边界模糊等问题给移动办公、远程办...……更多

2023-02-14 14:00:00信通,通信软件,中国,评测,能力,通信

首个AI高考全卷评测结果发布：数学全都不及格

6月19日，上海人工智能实验室发布首个AI高考全卷评测结果，月初开源的阿里通义千问大模型Qwen2-72B排名第一，在语数外三科420分的满分中获得303分，OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星（InternLM2-20B-WQX）排...……更多

2024-06-20 11:10:00评测结果,全都,评测,数学,高考,结果

当技术越来越智能，我们如何守护安全？

...可能会在对抗攻击的情况下被误导。”清华大学人工智能研究院副院长、计算机系教授朱军在论坛的主旨演讲中举例，监控摄像头的人脸识别验证的安全，其实在之前应用之前，就已经开始做很多的学术研究和应用，“一方面去...……更多

2023-11-09 23:33:00越来,越来越,智能,安全,技术,人工智能

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...言医疗语料库 MMedC。2. 开发了一个全新的多语言医疗问答评测标准 MMedBench, 覆盖了 6 种语言，21 种医学子课题。3. 推出了一款名为 MMed-Llama 3 的全新基座模型，以 8B 的尺寸在多项基准测试中超越了现有的开源模型，更加适合通过...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

国产ai大模型首批评估名单公布

...表现优秀，获得4+评级。以阿里云通义灵码为例，信通院评测结果显示：在通用能力方面，通义灵码在代码转换、代码检查及修复、代码优化等方面表现突出；在专用场景方面，通义灵码提供网站开发、数据库开发、大数据开发...……更多

2024-06-12 09:54:00模型,评估,国产,名单,模型,能力

上海人工智能实验室公布首个ai高考全卷评测结果

...20日消息，上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍，2024年全国高考甫一结束，该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷，参...……更多

2024-06-20 10:19:00评测结果,人工智能,上海,人工,实验室,评测

下载次数破39万！CMU、Meta联合发布VQAScore文

...界和工业界的广泛认可。Pengchuan Zhang是Meta AI（原Facebook AI研究院）的人工智能研究科学家，曾在微软研究院担任高级研究科学家。他的研究领域主要集中在深度学习、计算机视觉和多模态模型等方向，曾发表多项具有深远影响力...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

中关村科金1+N新品系列亮相，为企业打造大模型强人工智能应用

...的强劲动力。11月23日，在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的“重构未来产业智能跃迁”2023大模型产业前沿论坛上，中关村科金正式发布...……更多

2023-11-24 09:56:00中关,中关村,人工智能,人工,模型,新品

百度与优必选合作，人形机器人“大脑”有了AI大模型

...首个商业化双足真人尺寸人形机器人。根据2023年人民网研究院发布的《人形机器人技术专利分析报告》统计，优必选在人形机器人有效专利数量上全球第一。优必选表示，AI大模型与人形机器人的结合，不仅能有效推动人形机器...……更多

2024-04-02 11:23:00人形,机器人,大脑,模型,机器,合作

安兔兔评测pc版正式发布，欢迎大家下载体验

兔友们，全新的安兔兔评测PC版已经正式发布了，目前已经在安兔兔官网以及各大渠道上线，欢迎大家下载体验。与Android版本测试流程相似，安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy（内存和存储）和UX（用户体验）四...……更多

2024-10-04 00:33:00评测,体验,测试,模型,处理,电脑

Bengio团队提出多模态新基准，直指Claude 3.5和

...一致时，就会推翻 “假设”，重新尝试新的假设。人类评测结果人类在 VCR 任务下的水平如何呢？下图中展示了母语者或各语言的流利使用者在英 / 中两种语言的简单 / 困难设定下的准确度：如果考虑包含时间、地名、人名的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

多样任务真实数据，大模型在线购物基准Shopping MML

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

科大讯飞：打造自主创新的大模型底座，为全球产业链提供更多选择

...于大模型的评测报告——《人工智能大模型体验报告3.0》评测结果显示，由科大讯飞研发的讯飞星火认知大模型获得1775最高分蝉联冠军，并获得基础能力指数、智商指数、工具提效指数三项评测指标第一。在通用人工智能全球...……更多

2023-11-29 10:23:00讯飞,底座,产业链,模型,选择,产业

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品｜搜狐科技作者｜郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走？近日，清华大学计算机系讲席教授、人工智能研究院基础模...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

2023 CCF国际AIOps挑战赛决赛成功举办

...办；华为技术有限公司、国网宁夏电力有限公司电力科学研究院、软通动力信息技术（集团）股份有限公司特别赞助支持。CCF国际AIOps挑战赛由CCF、清华大学和南开大学自2018年联合发起，旨在借助社区力量，运用人工智能算法解...……更多

2023-12-20 13:45:00挑战赛,决赛,成功,国际,模型,南开大学

人工智能也能“察言观色”

...到位于合肥市高新区的合肥综合性国家科学中心人工智能研究院，在这里人工智能不仅“能听会说”，还能“察言观色”。“当目标人物从镜头前经过，智能心理监护系统V3.0就能通过无感智能情绪识别、生理信号识别、行为动...……更多

2024-01-16 02:05:00人工智能,人工,智能,人工智能,智能,人工

从AI搜索到语音陪练，腾讯元宝全面评测来了！大模型C端玩家谁

《科创板日报》5月31日讯（记者朱凌）直至五月尾声，AI应用市场的火热态势依旧不减。30日，基于混元大模型的AI助手App“腾讯元宝”上线，标志着BAT终于在AI消费C端应用领域聚首。据介绍，自2023年9月首次亮相以来，腾讯混...……更多

2024-05-31 18:07:00腾讯,陪练,元宝,语音,模型,评测

字节开源全栈AI编程基准，不小心曝光豆包代码大模型

...即可轻松部署SandboxFusion，也可直接在GitHub上进行体验。评测结果：解决难题，闭源模型仍优于开源模型发布评测基准及沙盒的同时，研究团队也基于FullStack Bench测评了全球20余款代码大模型及语言大模型的编程表现。模型包括Qwe...……更多

2024-12-06 09:50:00豆包,基准,字节,模型,编程,代码

家电院评测：海尔智家APP获评“数字孪生3D智慧家庭”

...逻辑、界面直观性及创新场景预演能力进行了全面评估。评测结果表明，海尔智家APP不仅在用户体验层面表现出色，更在动态仿真、全生命周期映射、双向数据流动三个核心技术层面实现突破。具体而言，在动态仿真方面，系统...……更多

2025-11-05 21:24:00海尔,评测,智慧,数字,家庭,海尔

科学家建立新评价基准，助力评估大模型数据分析能力

...集。虽然这类数据的生成成本较低、人力需求不高，但是评测方法的开发却需要他们逐一校验，因为数据分析的结果并不仅仅依赖于执行的一致性。例如，在生成分类器的问题上，即便参考代码的执行结果和预测代码的结果不一...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

垂类大模型竞争白热化，微医医疗大模型拿下“双料”冠军

AI浪潮下，围绕大模型的角力还在精彩上演，权威大模型评测平台成为各大科技公司比拼AI成色的必争之地。日前，知名中文医疗大模型开放评测平台MedBench新一轮榜单揭晓，在其自测榜单中，三家杭州企业霸榜前三甲：微医控...……更多

2025-03-04 10:34:00模型,冠军,竞争,医疗,模型,医疗

海信电视U8公开评测，这才是高端Mini LED电视该有的画

...细腻。（图片来源：杰夫视点）经中国电子技术标准化研究院赛西实验室评测，海信电视U8系列产品在模拟用户真实的环境光条件下，对比度、峰值亮度、色彩等维度，皆展现了无惧各类光线的出色表现，是目前Mini LED高端电视...……更多

2023-11-29 11:44:00海信,电视,画质,高端,评测,海信

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...OpenAI表示， o1模型在推理能力上相比GPT-4o显著进步。综合评测显示，在绝大多数需要深入思考和复杂推理的任务中，新模型都展现出了明显优于GPT-4o的表现，并在多个细分测试上超过90%。在启用视觉感知能力的情况下，o1模型在M...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，仅次于 GPT-4o（69.9）和 Clau...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

享老新举措四川首创省级银发经济产品服务联盟

...，推动银发经济创新发展。同时，西南交大国际老龄科学研究院代表专委会向社会各界发布了《四川省银发经济蓝皮书暨全省适老化产品需求调查结果》，该蓝皮书是全国首个省级银发经济蓝皮书。华西医疗机器人研究院项目总...……更多

2024-07-25 15:12:00银发,四川,产品服务,举措,省级,经济

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

...，另一方面能够直观体现国产大模型的最新发展进程。评测结果显示，文心一言app在智能体能力方面表现突出。在用户创建智能体功能方面，文心一言app支持用户通过上传图片或拍照的方式制作智能体形象，同时支持用户通过...……更多

2024-03-14 17:06:00数据发布,评测报告,中国,评测,智能,报告

AI潮起共筑数智之基

...0+项评测指标、200+项评测场景、100多万专属评测数据集，评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体，支持评测数据自学习、用例自编排、执行自适应，同比评测周期缩短90%以上，已服务政府部委...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

...克健康大模型成功通过中国12门核心学科的主任医师笔试评测，成为国内首个完成这一挑战的大模型。目前，“主任级AI医生”能力已全面集成至夸克的AI搜索中，用户在查询健康问题时，选择深度搜索即可调用。这是继5月通过...……更多

2025-07-23 15:07:00夸克,主任医师,医师,模型,评测,主任

阿维塔11荣获IVISTA中国智能汽车指数五星智能评价

...智能星级评价。阿维塔科技供图华龙网发中国汽车工程研究院股份有限公司（简称“中国汽研”）IVISTA中国智能汽车指数评价涵盖智能行车、智能安全、智能泊车、智能交互、智能能效五大评测项目，围绕用户日常用车场景及...……更多

2023-10-26 21:05:00五星,阿维,智能,中国,指数,评价

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...视角视频，时长在20到120分钟之间，涉及77种日常活动。评测结果表示，人类专家水平显著优于目前长上下文多模态模型中最厉害的Gemini Pro 1.5（85.0%对37.3%）。在多模态能力上，大模型们还任重而道远。HourVideo如何炼成？之所以...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

page 2/3000 首页上一页 123 4 5 6 7 下一页末页

更多关于科技的资讯：

葵花药业×淘宝闪购签署战略合作：共探“AI+超级入口”下的医

11月28日，在2025淘宝闪购“聚势共赢”医药即时电商峰会现场，葵花药业集团与淘宝闪购正式签署战略合作协议，成为淘宝闪购医药健康领域首批战略级合作伙伴之一

2025-12-03 10:11:00

解码三一重能：风电龙头的突围与出海

十月的北京，三一重能南口产业园区内，一座数十米高的风力发电机静静运转，园区内却是一派繁忙景象。作为三一集团在京重要产业集群

2025-12-03 10:11:00

不同地区互联网企业中统计学专业毕业生薪资对比分析

摘要：本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析，探讨薪资分布的现状及其影响因素。研究发现，一线城市和二线城市在薪资水平上存在显著差异

2025-12-03 06:16:00

中信银行石家庄分行以温情服务筑金融消费者幸福驿站

“张叔叔，这银行卡的密码可不能随便告诉别人，就连短信验证码也得藏好，那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水

2025-12-02 10:21:00

中国移动成功举办“AI赋能医院后勤管理新发展”论坛

2025年11月27至29日，由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛

2025-12-02 11:03:00

腾讯云姚一兆：用全栈AI助力具身智能赛道加速发展

“具身智能是AI赛道中的焦点，其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力，助力具身智能赛道与广大企业共同发展

2025-12-02 11:03:00

2025年国内外麦角硫因补充剂深度测评：合成生物浪潮下的精选

在大健康消费升级与抗衰需求爆发的今天，麦角硫因作为“线粒体级”超级抗氧化剂，已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示

2025-12-02 11:31:00

企业级云服务器如何选？从可靠性到成本治理，看 AWS 的企业

企业数字化转型不断深化，业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座

2025-12-02 11:42:00

全维健康守护创造美好生活——富德生命人寿保险股份有限公司举

11月21日，富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护创造美好生活”为主题的健康险产品矩阵暨服务升级发布会

2025-12-02 12:11:00

深度解析GeneIII仅三麦角硫因胶囊：以合成生物技术，树立

GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书，成为兼具安全性

2025-12-02 14:27:00

从梅酒到书籍：梅见的文化升维之路

步入繁华的商业街区，不难发现一个耐人寻味的现象：店铺橱窗中的传统文化元素，正以近乎重复的方式不断上演。印着汉字 logo 的T恤

2025-12-02 14:35:00

丝玫瑰携手首玺丽格科创驱动美力升级

2025年12月2日，由键凯科技旗下医美产品线品牌——丝玫瑰®（SILKROSE）与北京首玺丽格联合举办的“中国‘智’造

2025-12-02 15:35:00

白酒+体育IP重构行业营销新范式，五粮液世界杯联名款京东首发

鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日，五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市

2025-12-02 15:36:00

从“车间老师傅”到“门店销冠”：飞书AI正在重塑吉利汽车研究

当AI逐渐褪去神秘面纱，谁是这场技术变革真正的操盘手？答案是：一线业务人。近日，首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官

2025-12-02 15:58:00

江瀚：即时零售不再打“补贴战”了

中新经纬12月2日电题：即时零售不再打“补贴战”了作者江瀚盘古智库高级研究员随着资本耐心减弱，单纯依赖补贴拉动的增长已难以为继

2025-12-02 16:09:00

头条订阅服务