• 我的订阅
  • 头条热搜
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
...上技术迭代的步伐,月狐数据发布《2023 AIGC应用app智能化评测报告》,该报告为中国市场首份围绕AIGC应用app的智能化水平以及智能体能力的专业测评报告,旨在通过多维度量化指标帮助用户更直观地评估现有主流AIGC应用产品的...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,他们又针对现有数据集,提出了一种改造方法。实验证明,这种方法能有效区分不同模型的能力差异。同时,他们还揭示了这种全新评测范...……更多
国内首个官方“大模型标准符合性评测”公布
...分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电子技术标准化研...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力,为大模型研发和落地保驾护航。此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行,此次测试数...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。凭借在搜索业务和智能技术上的长期积累,夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。在医疗健康领域,夸克大模型已经可以...……更多
...,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“...……更多
东方财富董事长其实:建议进一步推动股权投资支持科技创新
...动高质量垂类语料数据开放共享,进一步完善垂直大模型评测标准体系,并积极打造垂直大模型创新应用场景。支持链主企业开展早期风险投资其实表示,科技创新作为引领现代化产业体系建设的关键力量,是发展新质生产力的...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...“智越计划”,对国产人工智能芯片(AI芯片)开展全面评测,为后续算力建设提供依据。此次全面评测将助推国产芯片面向更多应用场景加快升级迭代。面对越来越严苛的AI芯片领域封锁,我国正在加速相关芯片的自主研发和...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI...……更多
...私保护、文明健康、人工智能自主意识等27个维度的中文评测数据集,为行业提供全面、细致的安全性能测试指标。作为信息通信行业的重要研究机构,中国信通院在人工智能和大数据领域具有深厚的研究底蕴和丰富的行业经验...……更多
AI潮起 共筑数智之基
...链条产业生态中国移动宣布开放大模型训练基地、大模型评测基地及大模型产业创新基地,面向全社会提供大模型从训到推、AI+原生应用孵化等一站式产业融通带动服务。大模型训练基地是中国移动为大模型提供训练所需智算资...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
12月23日,国内首个官方“大模型标准符合性评测”结果公布,首批360集团、百度、腾讯、阿里四家企业大模型产品通过。该测试由工信部中国电子技术标准化研究院(简称“工信部电子标准院”)发起,评测围绕多领域多维度...……更多
2023移动网络质量“百城”专项评测:打造高质量的5G服务
2023年全国重点区域移动网络质量“百城”专项评测活动11月7日正式开启,来自中国信息通信研究院泰尔系统实验室5支专业的网络质量评测团队奔赴全国百余个城市,对重点和热点区域开展移动网络测试。其实“移动网络质量专...……更多
...脸识别安全合规专家观点及实践分享。发布“护脸计划”评测结果和评估规范解读成为本次大会焦点。会上,中国信通院云大所副所长闵栋公布了通过“人脸识别安全专项评测”“金融APP人脸识别安全能力评测”“人脸识别系统...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...型与其他大模型考试成绩图:智慧芽垂直领域大模型能力评测决定一个垂直领域大模型表现的,除了模型本身外,训练数据集同样起到关键性作用。而这恰恰是智慧芽的优势所在。智慧芽垂直领域大模型的预训练数据达到了千亿...……更多
清华发布2024年3月版《SuperBench大模型综合能力评测报告》
...究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼。例如在人类对齐能...……更多
字节扣子模型广场,给AI大模型搭了一座擂台
...选择什么模型,市面上也没有类似于豆瓣电影评分这样的评测体系。举个例子,小雷这样的科技爱好者想在扣子上创建一个帮助编辑检查文章配图版权、错别字的Bot,但缺乏大模型开发经验的我并不知道扣子上的哪些模型、哪些...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...集。虽然这类数据的生成成本较低、人力需求不高,但是评测方法的开发却需要他们逐一校验,因为数据分析的结果并不仅仅依赖于执行的一致性。例如,在生成分类器的问题上,即便参考代码的执行结果和预测代码的结果不一...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。除模型开源外,Skywork-13B系列大模...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...一个分数、可变的问题规模、具有实际的人工智能意义、评测程序包含必要的多机通信;现在要获HPC领域的戈登贝尔奖,必须要有AI的算法,你没有AI的算法,否则奖都得不了。这是开玩笑的说法,但实际上也是一个趋势;AI for S...……更多
新能源车评测,懂车帝算是玩明白了
...新能源汽车的基础上,懂车帝正式推出了“6+2新能源汽车评测体系”。该体系共分续航、充电、辅助驾驶等6大维度和冬夏季极限评测2大场景,基于客观真实的实测数据,对新能源车进行综合评分,为消费者提供选买参考。...……更多
2022-12-15 18:40新能源,评测
“整活”保险业务,AI大模型哪家强?
...险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理赔、话术优化上表现不尽如人意,在营...……更多
选机指南:你的5G手机在ToP榜吗?
...中国移动2023年智能硬件质量报告快来围观No.15G手机综合评测TOP排行榜5G手机到底有多快?“手机下载APP,来不及看进度条就已经下完了;各个平台看视频,进度条随便拖,就跟已经缓存的视频一样。”这是现在5G手机用户的真实...……更多
拥有三块A6000的性能猛兽 惠普Z6 G5工作站评测
...配置:惠普Z6 G5核心硬件可根据用户需求进行定制,本次评测样机搭载36核72线程的Intel Xeon W9-3475X处理器,插入了8条32GB ECC DDR5内存,内存总容量高达256GB,显卡配满了3块NVIDIA RTX A6000专业独显,硬盘配置了2块2TB SSD和2块12T……更多
...民网北京10月23日电 (记者申佳平)《智能制造效能通用评测方法》标准编制工作组成立暨第一次工作组会议日前在京举行。来自机械工业仪器仪表综合技术经济研究所(以下简称仪综所)、中国信息通信研究院、中国电子技术...……更多
国产ai大模型首批评估名单公布
...表现优秀,获得4+评级。以阿里云通义灵码为例,信通院评测结果显示:在通用能力方面,通义灵码在代码转换、代码检查及修复、代码优化等方面表现突出;在专用场景方面,通义灵码提供网站开发、数据库开发、大数据开发...……更多
正式签约!合肥首家科创数字化融资平台中科星元平台成立
...下跑金融机构,仅需在平台上提交测评资料,随后5秒出评测结果,3秒匹配金融产品的高效融资服务;其次是成本低,费用透明无任何传统中介融资的种种附加费用,同时后台全流程清晰,融资进程一目了然。在该模式下,平台...……更多
更多关于科技的资讯:
国际纺织服装供应链博览会在宁举行
昨天,为期3天的2024南京国际纺织服装供应链博览会在南京国际展览中心举行,展会涵盖面料、辅料、纱线、服饰、家纺、缝制设备等行业范畴
2024-07-26 07:53:00
《死侍与金刚狼》今日上映口碑大爆!网友:近年来漫威最佳
快科技7月28日消息,今日,漫威新作《死侍与金刚狼》在中国内地、北美等地上映,这是《死侍》系列回归漫威电影宇宙的第一部电影
2024-07-26 07:58:00
曝谷歌Pixel 9全球首发三星M14 OLED面板:iPhone 16 Pro也会用
快科技7月26日消息,谷歌将在8月份发布Pixel 9系列,据媒体报道,该系列全球首发三星M14 OLED面板,这是三星迄今为止最好的显示屏
2024-07-26 07:58:00
年入600亿,这个宁波人,不止要做“非洲之王”
要说中国哪里的商人最懂“闷声大发财”,恐怕非浙商这个群体莫属了。而在浙商群体中,宁波人更是把这个特质发挥得淋漓尽致。今天咱们就来聊聊一个宁波人
2024-07-26 08:23:00
谷歌 Pixel Watch 3 智能手表认证曝光:支持超带宽、Wi-Fi 6
IT之家 7 月 26 日消息,科技媒体 The Tech Outlook 昨日(7 月 25 日)发布博文,发现谷歌 Pixel Watch 3 智能手表已经现身新加坡 IMDA 和美国 FCC 机构认证
2024-07-26 09:02:00
正面硬刚谷歌!OpenAI测试AI搜索功能SearchGPT,携手传媒巨头
不止是背后的大“金主”微软,OpenAI也要正面挑战谷歌的搜索引擎一哥地位。美东时间7月25日周四,OpenAI在官方网站公布
2024-07-26 09:02:00
完全自主研发!我国冷坩埚玻璃固化技术具备工程应用条件
IT之家 7 月 26 日消息,中核集团公众号昨日(7 月 25 日)发布博文,表示旗下单位中国原子能科学研究院自主研发的两步法 φ650mm 冷坩埚玻璃固化工程样机顺利完成 90 天连续运行试验
2024-07-26 09:17:00
打破认知局限,我国科学家在高性能有机热电材料领域取得重要进展
IT之家 7 月 26 日消息,中国科学院化学研究所于 7 月 24 日发布新闻稿,宣布我国科学家在高性能有机热电材料研究方面取得重要进展
2024-07-26 09:18:00
挑战谷歌,OpenAI搜索引擎SearchGPT登场:基于GPT-4系列AI 模型
IT之家 7 月 26 日消息,OpenAI 公司昨日(7 月 25 日)发布博文,邀请部分用户测试 AI 搜索引擎 SearchGPT
2024-07-26 09:18:00
索尼PS VR2的Steam应用下月推出,可用头显畅玩Steam VR应用
IT之家 7 月 25 日消息,索尼 PS VR2 PC 应用将于 8 月在 Steam 上推出,届时玩家可以使用 PSVR2 头显和 Sense 手柄畅玩 Steam 上的 VR 游戏和应用
2024-07-26 09:19:00
达墨预告新品第一代拓展坞:硬盘盒八合一设计,首发价预计 69 元
IT之家 7 月 25 日消息,达墨官方今晚在官方B站账号发文,透露了旗下新品 —— 达墨第一代拓展坞的最新进展,已经“调整得差不多了”
2024-07-26 09:19:00
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
IT之家 7 月 25 日消息,IT之家从上海市第六人民医院官方公众号获悉,上海交通大学医学院附属第六人民医院贾伟平教授和李华婷教授团队与上海交通大学电院计算机系 / 教育部人工智能重点实验室盛斌教授团队
2024-07-26 09:27:00
Canalys:Q2 中国本土厂商首次包揽中国大陆智能手机市场前五席
IT之家 7 月 25 日消息,Canalys 报告显示,2024 年第二季度,中国大陆智能手机市场在经历上一季度的回暖拐点后实现进一步复苏
2024-07-26 09:27:00
行业首款厨下制冷净水器,352 B425HC 首发价 7799 元
IT之家 7 月 25 日消息,北京三五二环保科技有限公司日前推出“行业首款厨下制冷净水器”,型号为352 B425HC
2024-07-26 09:28:00
小米 MIX Flip 折叠屏手机外屏微博已更改为信息流模式
IT之家 7 月 25 日消息,小米手机产品经理 @Cici_老魏 今日透露,小米 MIX Flip 外屏微博适配已更改为信息流模式
2024-07-26 09:28:00