• 我的订阅
  • 头条热搜
国内首个官方“大模型标准符合性评测”公布
...工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电子技术标...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
12月23日,国内首个官方“大模型标准符合性评测”结果公布,首批360集团、百度、腾讯、阿里四家企业大模型产品通过。该测试由工信部中国电子技术标准化研究院(简称“工信部电子标准院”)发起,评测围绕多领域多维度...……更多
百度文心大模型调用量居国内首位
...工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布。百度智能云官方今日宣布,百度文心大模型首批通过大模型标准符合性测试。除此之外,首批通过测试的产品还包括腾讯混元大模型、阿里通义千...……更多
360智脑成全国首个原生安全的大模型产品之一
...有限公司今天宣布,12月22日国内首个官方“大模型标准符合性测试”结果公布,360智脑成为首批通过的大模型产品之一。据介绍,360智脑是全国首个原生安全的大模型,官方声称其拥有自研千亿参数规模,核心能力位居国内第...……更多
腾讯混元文生图大模型升级并对外开源
...GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、成为首批通过评测的国产大模型,首批通过的大模型还有阿里通义千问、360智脑和百度文心一言。 ……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...了解,作为首批通过中国信通院组织的可信AI大模型标准符合性验证的对话式AI企业,中关村科金企业知识大模型在模块验证获得4+级评分。该模型具备全面的语义、语音、视觉等基础能力,在5个能力域、46个能力项评测中准确度...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...精细化偏好标注:基于标注指令跟随、美学性、客观原则符合性、清晰度等多个细粒度原则进行标注,提供复杂精细化偏好标注。 自然语言语言反馈:提供细粒度批评和润色反馈,可利用此自然语言反馈开发算法及提升模型性...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
...托系列标准,为多家技术厂商提供医疗健康大模型的能力符合性验证,持续完善评价细则,提升标准实用性和适用性,助力行业大模型规范化、集约化发展。2024年6月起,中国信通院选取GPT4、GPT-4O等国外通用大模型,文心一言、...……更多
全球几十种大模型评测,如何甄别可信度?
...觉中国蓝鲸新闻12月20日讯(记者 武静静)要衡量一个大模型能力是否够强,评测是最直接的维度。大模型评测就是为大模型的一场“考试”,从不同大模型的表现中,不仅可以衡量现有技术水平,还能帮助识别大模型存在的问...……更多
《金融大模型应用评测指南》发布,系全国首个以金融业务能力...
...发布全国首个以金融业务能力为核心的团体标准《金融大模型应用评测指南》,上海库帕思科技有限公司发布多维度金融大模型评测数据集(2024版)。 《金融大模型应用评测指南》,以金融业务为核心,以金融机构模型应用为...……更多
大模型下场,360智慧生活智助三百六十行
...?答案是肯定的。12月22日,全国首个官方“大模型标准符合性测试”结果公布,包括360、百度、阿里和腾讯4家大厂的自研大模型首批通过国家大模型标准测试,拿到了“国家认证”。360智慧生活集团是国内诸多安防企业中率先...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...和顶尖的技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多
2024年下半年可信开源最新评估结果公布
...件产品通过开源合规能力评估;2个系统平台通过SOSS标准符合性测试;2个平台工具通过可信开源治理工具(SCA)评估;1个工具通过了开源代码库能力评估;2个社区通过了可信开源社区评估;1个社区完成了可信开源社区-OpenChain...……更多
2024快手磁力大会在重庆召开
...转化、更佳的体验和更长效的经营价值,快手还运用AI大模型等智能化技术重塑生意经营全链路,在素材的生产、理解、分发和承接上,提供全链路解决方案,助力企业提升经营效率。快手高级副总裁、电商事业部兼商业化事业...……更多
发展新质生产力:新动作看杭州“聚焦点”
...州技术转移转化中心共同发布了国内首个成果转化领域大模型——“智者大模型1.0”。“‘智者大模型1.0’主要功能包括企业的智能画像、成果的智能化评价、供需的智能化匹配等。”杭州技术转移转化中心相关负责人介绍,其...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
...果、微软,苹果推出Apple Intelligence AI系统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中...……更多
快手可灵 1.6 模型发布
...家 12 月 19 日消息,快手今日宣布视频生成推出可灵 1.6 模型,文本响应度、画面美感及运动合理性,均有明显提升,画面更稳定更生动,同时支持标准和高品质模式。特别是 1.6 图生视频的高品质模式,官方宣称“内部评测比 1....……更多
...试场。围绕人工智能伦理风险、数据安全风险、教学场景符合性、教育科学性和严谨性等方面,模拟真实场景开展测评,形成符合教育教学规律的智能教育通用评价标准,加快推动全市教育领域人工智能大模型的合规准入。在人...……更多
《openharmony设备统一互联技术标准》发布
...模型,新标准还包括接入与控制接口、投屏、文件分享、符合性测试规范等系列标准,为跨行业、跨厂商设备的互联提供统一的技术规范。这将有助于构建OpenHarmony物联网生态,实现设备间的无缝连接,并提供更流畅、更安全的...……更多
大模型用于采购评标,专业“证据链”驱动专家精准决策
...的客观信息(企业规模、资质、信誉、财务状况等)进行符合性比对,筛出“硬件”不符的投标方;资料缺失、内容前后不一致、不满足评标要求等,系统也都会“高亮”提示;此外,系统还能自动生成评标分析报告,标书合格...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
东方财富董事长其实:建议进一步推动股权投资支持科技创新
...推动股权投资支持科技创新的建议》和《关于支持垂直大模型开发与应用的建议》。推动股权投资支持科技创新方面,其实提出了三方面建议:一是进一步健全政府引导基金容错机制,二是支持链主企业开展早期风险投资,三是...……更多
上海人工智能实验室公布首个ai高考全卷评测结果
...一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评...……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
更多关于科技的资讯:
红树林AI艺术万人展于春节启幕,探讨AI时代下的多元表达
大众网记者 潘超 青岛报道1月29日,三亚湾红树林度假世界迎来了一场隆重的艺术盛典——首届红树林AI艺术万人展暨今日未来馆AI艺术特展开幕式暨颁奖典礼举行
2025-02-01 16:01:00
长虹家纺签约奥运冠军,品质与荣耀同辉
长虹集团旗下长虹家纺荣幸地迎来了奥运冠军作为品牌代言人!这是一个令人骄傲的时刻,也是长虹家纺品牌发展历程中的重要一步。奥运冠军代表着拼搏
2025-02-01 10:03:00
信家家居集团董事长谭健民先生推动家居装饰环保理念的深度剖析
谭健民,作为信家家居集团的董事长,不仅是一位杰出的企业家,更是一位对家居装饰环保理念有着深刻理解和积极推动的行业领袖。在他的引领下
2025-01-31 20:40:00
新春家电以旧换新选购指南(上篇):空调、洗衣机均价下降;电视、油烟机涨价
新春家电行情持续,消费者如何用好家电购新补贴? 2025年家电购新补贴延续,对于家电消费市场而言可谓喜闻乐见。一方面,消费者能够用更优惠的价格添置高品质的新家电
2025-01-31 22:04:00
乙巳新春,杭州钱江新城商圈年味萦绕。31日中午11时,杭州万象城六楼“醉玖兰亭”餐厅响起了排队叫号声。餐厅品牌市场部负责人胡秋云和同事们忙得脚不着地
2025-02-01 08:52:00
华为重磅新品曝光!比三折叠手机还更科幻...
近日,华为终端BG CEO余承东在直播中主动爆料,透露了一款即将发布的重磅新品。这款神秘的产品将打破常规,足以引发全国人民的抢购热潮
2025-01-31 20:09:00
余承东晒智界R7硕大后备箱:从家乡回深圳带了两大箱子鸡蛋
快科技1月31日消息,大年初三,余承东已经从安徽老家返程回深圳,这次他开上了智界R7,想要测试一下这款汽车的能耗。路上
2025-01-31 20:09:00
春节档电影相关互撕引战频发 600余个账号被禁言
快科技1月31日消息,微博管理员发布社区公告称,站方发现,在春节档电影相关讨论中,有个别用户偏离理性讨论方向,发布拉踩引战
2025-01-31 20:09:00
智慧灯光秀为春晚舞台注入科技感
本文转自:人民网-重庆频道人民网重庆1月31日电 (记者胡虹)28日,万众期待的2025年央视蛇年春晚如期而至。在今年的春晚舞台上
2025-01-31 11:01:00
库克:我看好DeepSeek 这种颠覆性的新模式对苹果影响大
快科技1月31日消息,今天苹果发布了财报,而会后库克接受了媒体和分析师们的采访,自然也谈到了DeepSeek。面对DeepSeek的异军突起
2025-01-31 11:08:00
突破性进展!我国成功研制出新型光子毫米波雷达芯片
快科技1月31日消息,据报道,南开大学携手香港城市大学,成功研制出薄膜铌酸锂光子毫米波雷达芯片,在毫米波雷达领域取得重大突破
2025-01-31 11:08:00
财务状况仍未达标:曝大众汽车正计划进一步加大裁员力度
快科技1月31日消息,据德国《商报》报道,大众汽车的财务状况仍未达标,知情人士透露,公司必须加大裁员力度。大众原计划在2026年底实现6
2025-01-31 11:38:00
惨!客机与黑鹰直升机空中相撞 67人全遇难:这是美国24年来最严重空难
1月31日消息,当地时间1月30日,一匿名花样滑冰业内人士透露,29日晚与军用直升机相撞后坠河的美国客机上有约20名花样滑冰选手和教练
2025-01-31 11:38:00
比亚迪Shark 6皮卡澳大利亚订单破6000台 现已正式开启交付
快科技1月31日消息,自2024年10月公布定价并开放订单以来,比亚迪Shark 6在澳大利亚已累计收获超6000台订单
2025-01-31 12:08:00
DeepSeek创始人回家过年 家乡拉横幅:欢迎文锋荣归故里 家乡因你而骄傲
快科技1月31日消息,DeepSeek创始人梁文锋回到家乡湛江米历岭村过年,家乡人也把他当荣归故里的英雄来迎接。一条条横幅挂起
2025-01-31 12:08:00