• 我的订阅
  • 头条热搜
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...AI应用场景的契合度。这一点,也是全球唯一的AI/ML存储基准测试——MLPerf所关注的本质。MLPerf存储基准测试面向AI/ML用户的痛点,即存储和计算的平衡及两者的有效利用。然而测试中存储架构的多样与存算节点的非标准化,导致...……更多
全球AI安全评估测试有了新基准
...型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者 崔 爽第27届联合国科技...……更多
2024可信云大会成功召开,天翼云携手产业各界共绘AI未来!
...标准化协会主办,中国信息通信研究院(以下简称“中国信通院”)承办的2024可信云大会在北京成功召开。大会主论坛上,中国信通院携手天翼云共同发布《央国企云上数智实践指南(2024)》,天翼云科技有限公司助理总经理...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...,执行这些数据集的全面评估变得非常耗时。此外,这些基准在训练期间也容易受到污染的影响。为此, LMMs-Eval 提出了 LMMs-Eval-Lite 来兼顾广覆盖和低成本。他们也设计了 LiveBench 来做到低成本和零数据泄露。LMMs-Eval-Lite: 广覆盖...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...指领先水平的大模型)。 图源:谷歌技术报告在权威MMMU基准测试中,Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力,而推理过程本身,需...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的经济价值,其中我国将突破30万亿元,占比超过四成。信通院启动《大模型数据开发管理能力评价方法总体要求》编制工作12月12日,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...量低于 Llama 3.1 的 4050 亿,但两者性能接近。并且在多个基准测试中与 GPT-4o、Anthropic 的 Claude 3.5 Sonnet 媲美。今年 2 月,Mistral AI 推出了最初的 Large 模型,其上下文窗口包含 32,000 个 token,新版模型在此……更多
AI+隐私计算助力保险创新,“隐语”入选信通院大数据优秀案例
AI+隐私计算助力保险创新,“隐语”入选信通院大数据优秀案例近日,中国信通院发布了2023 大数据“星河”案例榜单,蚂蚁集团“基于‘隐语联合定价方案’实现新能源车险精算定价”项目获得数据要素流通优秀案例。(图:...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商量多模态大模型...……更多
钉钉入选信通院首批“企业级数智化AI融合推进计划”成员单位
...0发布暨企业级数智化AI应用研讨会”在京召开。会上中国信通院发布企业数智化成熟度IOMM3.0标准、《央国企数智化转型发展研究报告(2024)》,正式启动“企业级数智化AI融合推进计划”,钉钉作为首批成员单位入选该计划,...……更多
AMD跑大模型终于Yes!MI300X对比NVIDIA H100/200毫不逊色
...The Information发布的评测报告,AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当,显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据,在测试中,AMD的MI300X GPU以及NVIDIA的……更多
GPT-4劲敌,谷歌进入高能+高产模式
....5 Pro官方测试数据Gemini 1.5 Pro大大超过Gemini 1.0 Pro,在27项基准(共31项)上表现更好,特别是在数学、科学和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。即使是对比Gemini 系列的高端产品Gemini……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提升,例如GPT-4o在大学水平...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...比评测报告,声称是首个直接对比 AMD 和英伟达 AI 集群的基准评测。该报告的数据来自 MLCommons,这是一个由供应商主导的评测机构。他们构建了一套 MLPerf AI 训练和推理基准。AMD Instinct 「Antares」 MI300X GPU 以及英伟达的「Hopper」H.……更多
本文转自:中国工业报行业 资讯中国信通院发布信息通信业(ICT)十大趋势 ■ 中国工业报记者 曹雅丽近日,中国信息通信研究院 (以下简称中国信通院)主办的2023中国信通院ICT+深度观察报告会主论坛在京举办,中国信...……更多
国产ai大模型首批评估名单公布
...IA/PG0110-2023)标准于2024年1月25日正式发布,该标准由中国信通院与中国工商银行联合牵头发起,涵盖通用能力、专用场景能力和应用成熟度三大部分,包括100多个能力要求。此次验证,依据标准开展,评价指标覆盖6大通用能力...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说了,但是依旧算...……更多
微软发布旗下最小语言模型phi-2
...代码等等场景。该模型完全基于高质量数据进行训练,在基准测试中的表现比同类模型高出10倍。微软今年9月更新发布了Phi-1.5版本,同样为13亿参数,可以写诗、写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基...……更多
谷歌 AI 推出 CardBench 评估框架
...之家 9 月 3 日消息,谷歌 AI 研究人员最新推出了 CardBench 基准,主要为学习型基数估计(cardinality estimation)满足系统评估框架需求。CardBench 基准是个综合评估框架,包含 20 个不同真实数据库中的数千次查询,大大超过了以往的...……更多
智慧芽垂直领域大模型通过国家网信办“双备案”
...、C-Eval,以及智慧芽面向业内首次提出的专利大模型测试基准(Patent-bench)的测评结果显示,智慧芽垂直领域大模型在问答、总结、写作、翻译、分类等方面能力整体优于商业通用大模型。图:智慧芽垂直领域大模型专业考试成...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...了不到十分钟。GPT-4 Turbo 具有创纪录的准确率,在 PyLLM 基准上,GPT-4 Turbo 的准确率是 87%,而 GPT-4 的准确率是 52%,这是在速度几乎快了四倍多的情况下(每秒 48 token)实现的。至此,生成式 AI 的竞争似乎进入了新的阶段。很多...……更多
首批!蔚领时代完成大模型数字人基础能力分级测试
...。近日,蔚领时代的蔚领AI互动数字人系统顺利完成中国信通院人工智能研究所组织的大模型数字人基础能力分级测试。蔚领时代也成为首批完成相关测试的元宇宙企业。数字人是通过人工智能技术生成的虚拟人物,具有人类的...……更多
...北京首都在线科技股份有限公司负责提供性能测试与测评基准设计和执行不同大模型在不同硬件平台的性能测试,输出性能测试评估报告;建立性能测评基准,成为行业通用参考标准。庆阳市政府根据《庆阳市“东数西算”算力...……更多
Databricks推出目前最强开源 AI
...大语言模型DBRX,号称是“目前最强开源AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。从官方新闻稿中得知,DBRX是一个基于Transformer的大语言模型,采用MoE(MixtureofExperts)架构,具备1320亿个参数,并在12TToke...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...-4o开刀,去解决动物过河难题。在此,他给出了一个新的基准——废话比率(crapness ratio),即LLM给出的总答案与正确答案之间的比率。经过测试,Gowers发现大模型的废话比率可以达到5倍。一开始,他先给出了一个农民带2只鸡...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...价比。根据xAI公布的数据,在GSM8K、HumanEval和MMLU等一系列基准测试中,Grok-1的表现超过了Llama-2-70B和GPT-3.5,不过与第一梯队的GPT-4差距还很明显。图源:xAI来到Grok-1.5,情况已大为改观。Grok-1.5不仅具有改进的推理能力和128k的……更多
英伟达h100gpu在mlperf基准测试创造6项新记录
...消息,英伟达今天发布新闻稿,表示旗下的H100GPU在MLPerf基准测试中创造了6项新记录。IT之家今年6月报道,3584 个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...。由此产生的混合模型包含四分之一的注意力层,在聊天基准测试中实现了与原始 Transformer 相当的性能,并且在聊天基准测试和一般基准测试中优于使用数万亿 token 从头开始训练的开源混合 Mamba 模型。此外,该研究还提出了一...……更多
...字化转型,各行各业对数字人才的需求正大幅增长。中国信通院企业数智人才标准特聘专家、帆软数据应用研究院院长梅杰在接受中新网采访时提到,如何让具备数字化能力的人能应用数字工具进行产出,是当前企业培养数字人...……更多
更多关于科技的资讯:
冰火两重天 美国南部遭冬季风暴侵袭:多地进入紧急状态 超3000架次航班延误
快科技1月12日消息,据央视财经报道,当地时间10日,美国南部大部分地区继续遭冬季风暴侵袭,约8000万人的生产和生活受到影响
2025-01-12 07:51:00
快告诉父母:真的别再把肉泡水里解冻了!
你家冰箱里是不是冷冻了很多肉?吃之前通常会怎么解冻呢?很多人,尤其是家里的爸妈习惯把肉提前泡在水里解冻,有的泡温水,有的泡凉水
2025-01-12 07:51:00
央视辟谣车厘子吃多会中毒:一次吃333公斤才会有事
快科技1月12日消息,据央视报道,临近春节,车厘子大量上市。有网友说,车厘子吃多了会导致铁中毒和氰化物中毒。据了解,铁中毒是由于摄入铁过量引起的
2025-01-12 07:51:00
15分钟美味上桌懒人必备:大厨保罗意面6.9元探底狂促
天猫【CHEFPAUL 大厨保罗旗舰店】大厨保罗速食意面单人份(264g)日常售价 25.9 元,今日大促限时直降至 12
2025-01-12 07:51:00
必成爆款 问界M8续航信息曝光:纯电最远可跑240公里
快科技1月12日消息,在工信部最新一批次新车申报名录中,问界今年最为重磅的车型M8正式亮相,该车定位于中大型SUV,按照问界当前的势能
2025-01-12 07:51:00
光影交织、千变万化,原来玻璃还可以这样玩
真实与虚幻:2025杭州国际当代玻璃艺术展玻璃,这种用二氧化硅人工合成的材质,在当代艺术家的视角里,可以幻化成千变万化的形态
2025-01-12 08:15:00
《射雕英雄传:侠之大者》获最受期待春节档电影 肖战版郭靖你期待吗
快科技1月12日消息,日前,2024微博之夜盛典在北京举行,《射雕英雄传:侠之大者》获得最受期待春节档电影。在微博之夜上
2025-01-12 08:21:00
100%纯果汁!森方向NFC桑葚汁大促:10袋仅13.9元
森方向NFC桑葚汁180ml*10袋平时要卖49.9元,今日下单可领36元优惠券,到手价13.9元。产品规格:官方宣传每袋约70颗桑葚(每颗桑葚>
2025-01-12 08:21:00
控油不干涩 京东京造专研洗发水500ml便宜了 到手27.9元
京东京造专研洗发水500ml平时要卖48.9元,今日下单立减10元,还能领取11元限时优惠券,到手27.9元。PLUS会员包邮
2025-01-12 08:21:00
浙江日报讯 记者近日从省经信厅获悉,2024年全省认定首台(套)装备327项,数量创历年新高。其中国际首台(套)3项
2025-01-12 08:45:00
“图灵宇宙”系列新书预告会在第37届北京图书订货会举行
本文转自:人民网-北京频道人民网北京1月12日电 (记者鲍聪颖)1月11日,由北京出版集团京版若晴公司、中国科学院软件研究所联合主办的有趣的计算机科学暨“图灵宇宙”系列新书预告会在第37届北京图书订货会举行
2025-01-12 08:57:00
近日,胜利油田孤东采油管理三区GO7-31-5334井示功图显示,峰值功率由原来的15千瓦下降至9千瓦,功率平衡度由86
2025-01-12 09:12:00
本文转自:人民网-北京频道人民网北京1月12日电 (记者李博)在日前举行的京津冀产业协同暨先进制造业集群发展新闻发布会上
2025-01-12 09:12:00
本文转自:人民网-北京频道人民网北京1月12日电 (记者李博)京津冀产业协同暨先进制造业集群发展新闻发布会日前在北京举行
2025-01-12 09:12:00
小米YU7冬测!雷军、卢伟冰现身黑河:一起放加特林烟花
快科技1月12日消息,今日,抖音网友“不会开车的杨桃”发布视频作品,称在生日这天最牛的活动是和雷总一起放烟花。作品显示
2025-01-12 09:22:00