• 我的订阅
  • 头条热搜
清华发布2024年3月版《SuperBench大模型综合能力评测报告》
...框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼。例如在人类对齐能力评测中,文心一言4.0表现优异,位居国内第一,其中在中...……更多
“整活”保险业务,AI大模型哪家强?
...险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理赔、话术优化上表现不尽如人意,在营...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
...上技术迭代的步伐,月狐数据发布《2023 AIGC应用app智能化评测报告》,该报告为中国市场首份围绕AIGC应用app的智能化水平以及智能体能力的专业测评报告,旨在通过多维度量化指标帮助用户更直观地评估现有主流AIGC应用产品的...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...机遇共存交织的当下,这一领域泰斗 中国工程院院士、清华大学计算机科学与技术系郑纬民,在 MEET2023智能未来大会上,分享了自己的见解和思考。估计未来两年到四年, HPC (高性能计算)+AI+BigData融合 的服务器就会出现。AI ...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...新能源汽车、半导体等50多个高科技行业。国内客户包括清华大学、北京大学、中科院、中国石化、海尔、美的、小米、宁德时代、小鹏汽车、大疆、药明康德、商汤科技、华大等;国际客户包括麻省理工学院、牛津大学、陶氏...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...沙利文联合头豹研究院发布《2023年中国大模型行研能力评测报告》。评测结果显示,商汤语言大模型“日日新·商量”以总分7.73(满分10分)斩获总榜第一,并在报告撰写能力、模型基础能力两个子榜位居第一。 ……更多
AI科研风暴来袭,中科院北大复旦大咖齐聚!海淀解锁千万算力补贴
...直大模型中选择一类进行申报,并提交模型自评或第三方评测报告(包括但不限于模型理解、推理、生成能力及智能性、鲁棒性、效率等)。 对于通用模型的申报,还将交由统一组织的第三方机构进行评测,最终根据专家评审...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告,报告的名称缩写叫HEOM,对全球的几十个开源和闭源的模型进行了深入的评测,有幸我们的GLM-130B作为一个唯一来自中国,甚至唯一一个来自亚洲的这样一个模型...……更多
...,中国移动终端公司发布了《2023中国移动智能硬件质量评测报告》(以下简称“报告”),对市场上各类智能硬件,包括但不限于5G手机整机、5G折叠屏手机、Wi-Fi 6路由器等展开了全面评测。尤其在5G智能手机领域,手机摄像头...……更多
AMD跑大模型终于Yes!MI300X对比NVIDIA H100/200毫不逊色
...出了与NVIDIA H100/200相媲美的实力。根据The Information发布的评测报告,AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当,显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据,在……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
多家券商最新研判:海螺AI爆火,MiniMax商业化进展迅速
...。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后,海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计,海螺AI网页版在9月的访问增速超8倍,海外用户纷纷在社交平台分享使用体验,普遍认为海...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
位列第一梯队,腾讯混元再度领跑国内大模型
5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是...……更多
...周年,内容科技为媒体融合发展注入了强大动力,大语言模型变革内容行业基础设施,平台升级推动内容产业发展新质生产力,应用范式创新催生内容新形态新模式新体验。内容行业进一步认识到:舆论影响力持续提升,市场竞...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0,暨“方升”大模型基准测试体系。据介绍,测试指标重点强化行业和场景导向的能力考查,提出了自适应动态测试方法,测试数据超过百万条,并首次推...……更多
IDC报告:京东云稳居专属云服务市场TOP5
...火热,专属智算云可能成为市场的新增长极。基于支持大模型训练、调优的能力积累,以及对行业需求的理解,京东云发布了数智算力矩阵,助力客户构建专属智算云基础设施,塑造全新增长空间。京东云言犀AI开发计算平台,...……更多
...院联合发布Tele-FLM——520亿参数规模高性能开源多语言大模型。据悉,Tele-FLM通过损失预测等技术,提高了基础模型的能力,BPB loss(损失值)指标在英文上优于Llama2-70B(Meta公司大语言模型2-700亿参数版本)和Llama3-8B(Meta公司大...……更多
云从科技从容大模型荣登中国大模型第一梯队
...展,中国本土企业云从科技凭借其卓越的技术实力,在大模型领域取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分7...……更多
...获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同...……更多
附下载 | 国内首本《模糊测试技术白皮书》正式发布
...前,由数说安全和北京云起无垠科技有限公司联合主编,清华大学、北京邮电大学、电子科技大学、北京中关村实验室、公安部第三研究所、中国信息通信研究院稳定性保障实验室、和长安通信科技有限责任公司参编的《模糊测...……更多
...的AI芯片进行详细调研和评测。评测将涵盖内容科技、大模型、金融、医疗、智能驾驶、云计算、智能工业、智慧城市等多个主流AI应用领域。团队将采取一系列的严格测试和应用场景模拟,从技术规格、功能、通信性能、技术...……更多
4月大模型排行榜出炉,文心一言大模型居首
...理增强等多个方面升级明显。同时在IDC等多个机构发布的评测报告中,文心一言大模型的综合能力评测得分都位列国内主流大模型第一,是业内当之无愧的头部大模型应用。除了榜首的大模型产品外,排行榜中还有其他多款优秀...……更多
更多关于科技的资讯:
中国什么时候可以100%用自动驾驶 李想:给我三年的时间!
快科技12月26日消息,今晚,在2024理想AI Talk对话节目中,当主持人问及“什么时候可以100%用自动驾驶”时
2024-12-26 21:07:00
郎咸朋:理想有希望在2025年实现L3
快科技12月26日消息,在理想今天的直播中,理想智驾负责人郎咸朋表示:“按照现在的端到端+VLM这套体系,能力继续迭代的话
2024-12-26 21:07:00
李想:理想造出L4级自动驾驶车辆 还需要三年时间
快科技12月26日消息,理想汽车今日晚间举办“2024理想AI Talk”。主持人问道,端到端是自动驾驶的大杀器吗?对此
2024-12-26 21:07:00
《真三国无双:起源》武器介绍:护手、剑、枪、飞圈、朴刀
在介绍完曹操、孙坚和刘备阵营随行武将后,《真三国无双:起源》官推开始新介绍该作的武器系统。【武器种类介绍:护手】按重攻击键后
2024-12-26 21:37:00
全系标配天神之眼!2025款腾势D9上市:33.98万元起
快科技12月26日消息,今日晚间,2025款腾势D9正式上市,共推出8款配置,其中插电混动版共5款车型,售价区间为33
2024-12-26 21:37:00
理想解答自动驾驶、辅助驾驶的区别:一个是能力 一个是功能
快科技12月26日消息,理想智能驾驶负责人郎咸朋表示,自动驾驶是能力、辅助驾驶是功能。具体说,功能是预设条件,能力是应对所有条件
2024-12-26 21:37:00
李想:我开车80%用智能驾驶 剩下的20%因为赶时间
快科技12月26日消息,在今晚的直播中,理想汽车创始人李想分享了他个人使用自家智能驾驶系统的经验。他表示,自己80%的驾驶时间都在使用理想汽车的智驾功能
2024-12-26 21:37:00
理想:升级版端到端+VLM、AI推理可视化交互系统 将于月底全量推送
快科技12月26日消息,理想汽车今日晚间举办“2024理想AI Talk”。主持人张小珺问道:在有监督智能驾驶阶段,理想交付给用户的产品长什么样
2024-12-26 21:37:00
《黑色沙漠》Steam海外版免费领!手游版国服将停服
由Pearl Abyss开发与发行的大型多人在线游戏《黑色沙漠》现已正式在Steam平台里开启了限时免费领取活动,活动截止日期为2025年1月7日
2024-12-26 22:07:00
“百镜大战”全面打响 AR眼镜销量暴涨40%
快科技12月26日消息,根据洛图科技(RUNTO)的线上监测数据,2023年10月和11月,AR眼镜的线上销量分别达到1
2024-12-26 22:07:00
莫言年终总结太逗了:收获很多“互联网孙子孙女”
快科技12月26日消息,在个人微信公众号上,著名作家莫言分享了他今年的年终总结,重点提到了三件重要的事情。第一件令他感到非常温馨的事是收获了许多“互联网孙子孙女”
2024-12-26 22:07:00
中国充电桩数量激增50% 高速服务区已超3.3万台
快科技12月26日消息,国家能源局近日在深圳组织了一场关键会议,聚焦于推动高质量充电基础设施体系的建设与发展。会上披露的最新数据显示
2024-12-26 22:37:00
鸿蒙智行上新!问界M8实车曝光:和大哥M9用上同款前脸
快科技12月26日消息,今日晚间,有博主分享照片显示,鸿蒙智行问界M8实车突然曝光。从曝光照片来看,这辆问界M8全车没有任何伪装
2024-12-26 22:37:00
大众网记者 李晓燕 通讯员 张平 日照报道为推动银发经济持续健康发展,探索挖掘适老化金融服务,打造有温度的客户服务品牌
2024-12-26 22:47:00
大疆发布DJI Fly App重磅更新:一键抖音直播
快科技12月26日消息,大疆发布DJI Fly App新版本1.15.8,更新多项重磅功能,现已支持抖音直播、微信登录和DJ Neo全屏操控等多个重磅功能
2024-12-26 23:37:00