• 我的订阅
  • 头条热搜
清华发布2024年3月版《SuperBench大模型综合能力评测报告》
...框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼。例如在人类对齐能力评测中,文心一言4.0表现优异,位居国内第一,其中在中...……更多
“整活”保险业务,AI大模型哪家强?
...险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理赔、话术优化上表现不尽如人意,在营...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
...上技术迭代的步伐,月狐数据发布《2023 AIGC应用app智能化评测报告》,该报告为中国市场首份围绕AIGC应用app的智能化水平以及智能体能力的专业测评报告,旨在通过多维度量化指标帮助用户更直观地评估现有主流AIGC应用产品的...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...机遇共存交织的当下,这一领域泰斗 中国工程院院士、清华大学计算机科学与技术系郑纬民,在 MEET2023智能未来大会上,分享了自己的见解和思考。估计未来两年到四年, HPC (高性能计算)+AI+BigData融合 的服务器就会出现。AI ...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...新能源汽车、半导体等50多个高科技行业。国内客户包括清华大学、北京大学、中科院、中国石化、海尔、美的、小米、宁德时代、小鹏汽车、大疆、药明康德、商汤科技、华大等;国际客户包括麻省理工学院、牛津大学、陶氏...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...沙利文联合头豹研究院发布《2023年中国大模型行研能力评测报告》。评测结果显示,商汤语言大模型“日日新·商量”以总分7.73(满分10分)斩获总榜第一,并在报告撰写能力、模型基础能力两个子榜位居第一。 ……更多
AI科研风暴来袭,中科院北大复旦大咖齐聚!海淀解锁千万算力补贴
...直大模型中选择一类进行申报,并提交模型自评或第三方评测报告(包括但不限于模型理解、推理、生成能力及智能性、鲁棒性、效率等)。 对于通用模型的申报,还将交由统一组织的第三方机构进行评测,最终根据专家评审...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告,报告的名称缩写叫HEOM,对全球的几十个开源和闭源的模型进行了深入的评测,有幸我们的GLM-130B作为一个唯一来自中国,甚至唯一一个来自亚洲的这样一个模型...……更多
...,中国移动终端公司发布了《2023中国移动智能硬件质量评测报告》(以下简称“报告”),对市场上各类智能硬件,包括但不限于5G手机整机、5G折叠屏手机、Wi-Fi 6路由器等展开了全面评测。尤其在5G智能手机领域,手机摄像头...……更多
AMD跑大模型终于Yes!MI300X对比NVIDIA H100/200毫不逊色
...出了与NVIDIA H100/200相媲美的实力。根据The Information发布的评测报告,AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当,显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据,在……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
多家券商最新研判:海螺AI爆火,MiniMax商业化进展迅速
...。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后,海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计,海螺AI网页版在9月的访问增速超8倍,海外用户纷纷在社交平台分享使用体验,普遍认为海...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
位列第一梯队,腾讯混元再度领跑国内大模型
5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是...……更多
...周年,内容科技为媒体融合发展注入了强大动力,大语言模型变革内容行业基础设施,平台升级推动内容产业发展新质生产力,应用范式创新催生内容新形态新模式新体验。内容行业进一步认识到:舆论影响力持续提升,市场竞...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0,暨“方升”大模型基准测试体系。据介绍,测试指标重点强化行业和场景导向的能力考查,提出了自适应动态测试方法,测试数据超过百万条,并首次推...……更多
IDC报告:京东云稳居专属云服务市场TOP5
...火热,专属智算云可能成为市场的新增长极。基于支持大模型训练、调优的能力积累,以及对行业需求的理解,京东云发布了数智算力矩阵,助力客户构建专属智算云基础设施,塑造全新增长空间。京东云言犀AI开发计算平台,...……更多
...院联合发布Tele-FLM——520亿参数规模高性能开源多语言大模型。据悉,Tele-FLM通过损失预测等技术,提高了基础模型的能力,BPB loss(损失值)指标在英文上优于Llama2-70B(Meta公司大语言模型2-700亿参数版本)和Llama3-8B(Meta公司大...……更多
云从科技从容大模型荣登中国大模型第一梯队
...展,中国本土企业云从科技凭借其卓越的技术实力,在大模型领域取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分7...……更多
...获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同...……更多
附下载 | 国内首本《模糊测试技术白皮书》正式发布
...前,由数说安全和北京云起无垠科技有限公司联合主编,清华大学、北京邮电大学、电子科技大学、北京中关村实验室、公安部第三研究所、中国信息通信研究院稳定性保障实验室、和长安通信科技有限责任公司参编的《模糊测...……更多
...的AI芯片进行详细调研和评测。评测将涵盖内容科技、大模型、金融、医疗、智能驾驶、云计算、智能工业、智慧城市等多个主流AI应用领域。团队将采取一系列的严格测试和应用场景模拟,从技术规格、功能、通信性能、技术...……更多
4月大模型排行榜出炉,文心一言大模型居首
...理增强等多个方面升级明显。同时在IDC等多个机构发布的评测报告中,文心一言大模型的综合能力评测得分都位列国内主流大模型第一,是业内当之无愧的头部大模型应用。除了榜首的大模型产品外,排行榜中还有其他多款优秀...……更多
更多关于科技的资讯:
微软砍刀部发声:弃用Win11/10功能并不是终点
快科技2月3日消息,微软时不时会在其官方网站上宣布停用某项Windows功能或服务,而这些被弃用的功能通常是使用率太低
2025-02-03 22:41:00
印度、日本双双发射区域导航卫星:都是2025年的第一次
快科技2月3日消息,北京时间1月29日8点23分,印度使用GSLV-F15火箭成功发射了NVS-02区域导航卫星,而在4天后的2月2日16点30分
2025-02-03 17:40:00
《哪吒2》百万条锁链有多难做:特效老师电脑开机开了2个小时
快科技2月3日消息,《哪吒之魔童闹海》毫无意外拿下春节档票房冠军,影片爆火背后,是制作团队的用心。据悉,比起前作《哪吒之魔童闹海》整个故事更宏大
2025-02-03 18:10:00
D8888次动车出发!吉祥又霸气
快科技2月3日消息,对于国人来说,8、6都是吉利数字,连续出现更是吉利翻倍,今天就来看看超级吉祥、超级霸气的D8888次动车列车
2025-02-03 18:10:00
1nm工艺!曝台积电将建设全球最先进晶圆厂
快科技2月3日消息,最新报道称,全球最大晶圆代工厂台积电正计划在中国台湾台南建设一座拥有最先进1nm工艺节点制程技术产线的晶圆厂
2025-02-03 18:10:00
全网最低价!百度智能云上线DeepSeek-R1/V3:还有限时免费
快科技2月3日消息,今天百度智能云正式宣布DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架
2025-02-03 19:10:00
活久见!美国超市冷藏柜拉出一只活狼:现场群众无不吃惊
快科技2月3日消息,世界之大,无奇不有,近日,美国芝加哥Aldi超市发布公告称,超市冷藏柜中有只狼,当警方赶到现场后用工具将狼抓住
2025-02-03 19:40:00
阿里云支持一键部署DeepSeek-V3/R1!仅需3步、0代码
快科技2月3日消息,今天阿里云宣布,阿里云PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1
2025-02-03 19:40:00
中国红客联盟就DeepSeek事件再发声:系营销牟利、切勿上当受骗
快科技2月3日消息,近日DeepSeek遭到境外网络攻击后,在网络上流传不少关于中国红客联盟“反击”的传闻。对此中国红客联盟今天再次发声
2025-02-03 20:10:00
雷军解锁新技能滑野雪:滑了6天、非常容易上瘾
快科技2月3日消息,刚刚,小米公司董事长雷军发布微博称自己解锁了新技能——滑野雪。其表示,自己以前虽然也滑过几次野雪,但有些吃力
2025-02-03 21:10:00
真的急了!美国提出新法案:下载DeepSeek最高判20年监禁
快科技2月3日消息,据媒体报道,美国国会近日提出了一项名为《2025年美国人工智能能力与中国脱钩法案》的新法案。根据新的法案
2025-02-03 21:11:00
苹果有望本周推出iCloud新服务!可邀请用户参加活动
快科技2月3日消息,据Mark Gurman最新透露,苹果计划最快于本周推出一项基于iCloud的新活动邀请服务。Gurman表示
2025-02-03 21:41:00
日本流感到底有多严重:累计病例超950万占总人口1/13 过度囤购致药品短缺
快科技2月3日消息,据央视报道,日本自去年12月下旬流感患者人数创下新高之后,一些医院和药店受部分医疗机构过度囤购药品造成库存分布不均等因素影响
2025-02-03 15:10:00
NVIDIA新款入门显卡RTX 5060/5060 Ti三月登场 媒体:定价400美元以内比较实际
快科技2月3日消息,RTX 5090、5080价格高不可攀,官价根本买不到。对于普通玩家来说,入门款RTX 5060 Ti和 RTX 5060才更切实际
2025-02-03 16:40:00
AMD下下代AI加速卡Instinct MI400大变!多了一个Die
快科技2月3日消息,AMD已官宣将在今年下半年发布新一代Instinct MI350系列AI加速卡的首款产品MI355X
2025-02-03 17:10:00