• 我的订阅
  • 头条热搜
清华发布2024年3月版《SuperBench大模型综合能力评测报告》
...框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼。例如在人类对齐能力评测中,文心一言4.0表现优异,位居国内第一,其中在中...……更多
“整活”保险业务,AI大模型哪家强?
...险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理赔、话术优化上表现不尽如人意,在营...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
...上技术迭代的步伐,月狐数据发布《2023 AIGC应用app智能化评测报告》,该报告为中国市场首份围绕AIGC应用app的智能化水平以及智能体能力的专业测评报告,旨在通过多维度量化指标帮助用户更直观地评估现有主流AIGC应用产品的...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...机遇共存交织的当下,这一领域泰斗 中国工程院院士、清华大学计算机科学与技术系郑纬民,在 MEET2023智能未来大会上,分享了自己的见解和思考。估计未来两年到四年, HPC (高性能计算)+AI+BigData融合 的服务器就会出现。AI ...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...新能源汽车、半导体等50多个高科技行业。国内客户包括清华大学、北京大学、中科院、中国石化、海尔、美的、小米、宁德时代、小鹏汽车、大疆、药明康德、商汤科技、华大等;国际客户包括麻省理工学院、牛津大学、陶氏...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...沙利文联合头豹研究院发布《2023年中国大模型行研能力评测报告》。评测结果显示,商汤语言大模型“日日新·商量”以总分7.73(满分10分)斩获总榜第一,并在报告撰写能力、模型基础能力两个子榜位居第一。 ……更多
AI科研风暴来袭,中科院北大复旦大咖齐聚!海淀解锁千万算力补贴
...直大模型中选择一类进行申报,并提交模型自评或第三方评测报告(包括但不限于模型理解、推理、生成能力及智能性、鲁棒性、效率等)。 对于通用模型的申报,还将交由统一组织的第三方机构进行评测,最终根据专家评审...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告,报告的名称缩写叫HEOM,对全球的几十个开源和闭源的模型进行了深入的评测,有幸我们的GLM-130B作为一个唯一来自中国,甚至唯一一个来自亚洲的这样一个模型...……更多
...,中国移动终端公司发布了《2023中国移动智能硬件质量评测报告》(以下简称“报告”),对市场上各类智能硬件,包括但不限于5G手机整机、5G折叠屏手机、Wi-Fi 6路由器等展开了全面评测。尤其在5G智能手机领域,手机摄像头...……更多
AMD跑大模型终于Yes!MI300X对比NVIDIA H100/200毫不逊色
...出了与NVIDIA H100/200相媲美的实力。根据The Information发布的评测报告,AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当,显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据,在……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
多家券商最新研判:海螺AI爆火,MiniMax商业化进展迅速
...。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后,海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计,海螺AI网页版在9月的访问增速超8倍,海外用户纷纷在社交平台分享使用体验,普遍认为海...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
位列第一梯队,腾讯混元再度领跑国内大模型
5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是...……更多
...周年,内容科技为媒体融合发展注入了强大动力,大语言模型变革内容行业基础设施,平台升级推动内容产业发展新质生产力,应用范式创新催生内容新形态新模式新体验。内容行业进一步认识到:舆论影响力持续提升,市场竞...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0,暨“方升”大模型基准测试体系。据介绍,测试指标重点强化行业和场景导向的能力考查,提出了自适应动态测试方法,测试数据超过百万条,并首次推...……更多
IDC报告:京东云稳居专属云服务市场TOP5
...火热,专属智算云可能成为市场的新增长极。基于支持大模型训练、调优的能力积累,以及对行业需求的理解,京东云发布了数智算力矩阵,助力客户构建专属智算云基础设施,塑造全新增长空间。京东云言犀AI开发计算平台,...……更多
...院联合发布Tele-FLM——520亿参数规模高性能开源多语言大模型。据悉,Tele-FLM通过损失预测等技术,提高了基础模型的能力,BPB loss(损失值)指标在英文上优于Llama2-70B(Meta公司大语言模型2-700亿参数版本)和Llama3-8B(Meta公司大...……更多
云从科技从容大模型荣登中国大模型第一梯队
...展,中国本土企业云从科技凭借其卓越的技术实力,在大模型领域取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分7...……更多
...获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同...……更多
附下载 | 国内首本《模糊测试技术白皮书》正式发布
...前,由数说安全和北京云起无垠科技有限公司联合主编,清华大学、北京邮电大学、电子科技大学、北京中关村实验室、公安部第三研究所、中国信息通信研究院稳定性保障实验室、和长安通信科技有限责任公司参编的《模糊测...……更多
...的AI芯片进行详细调研和评测。评测将涵盖内容科技、大模型、金融、医疗、智能驾驶、云计算、智能工业、智慧城市等多个主流AI应用领域。团队将采取一系列的严格测试和应用场景模拟,从技术规格、功能、通信性能、技术...……更多
4月大模型排行榜出炉,文心一言大模型居首
...理增强等多个方面升级明显。同时在IDC等多个机构发布的评测报告中,文心一言大模型的综合能力评测得分都位列国内主流大模型第一,是业内当之无愧的头部大模型应用。除了榜首的大模型产品外,排行榜中还有其他多款优秀...……更多
更多关于科技的资讯:
突发!法国奢侈品巨头迪奥中国客户信息遭泄露 官方回应
快科技5月13日消息,5月12日深夜,多位网友在社交平台发帖,称收到法国奢侈品巨头迪奥(Dior)的短信。据了解,迪奥向中国客户发送短信表示
2025-05-13 08:14:00
最近,有不少杭州人突然发现,手机屏幕右上角的网络信号标识,不知不觉从“5G”变成了“5G-A”,甚至有人担心:是我欠费了吗
2025-05-13 08:18:00
聚焦儿童龋齿防治难题,央视网探访兔头妈妈研发中心
2025 年 5 月 8 日世界微笑日,央视网《健康能量站》推出了一档主题为 “科学护齿 守护健康微笑” 的科普节目,并邀请北大口腔医生
2025-05-13 08:35:00
官方通报百万粉网红疑遭勒索后“自杀”:自导自演 编造虚假消息
快科技5月13日消息,日前,在抖音拥有百万粉丝的网红“是小念噢”疑似遭到勒索后自杀去世的消息引发网络关注,今天凌晨,成都锦江公安公众号发布通报进行回应
2025-05-13 08:44:00
医生建议每次上厕所别超过10分钟:超过你患痔疮风险激增46%
快科技5月13日消息,先来做个调查,你平常上厕所玩手机能有多长时间呢?据国外媒体报道称,在2025年美国消化疾病周大会上
2025-05-13 08:44:00
取消91%关税又如何!美国欲追踪显卡和CPU位置:防止流向中国 全力限制AI发展
快科技5月13日消息,同意取消对我国加征的91%关税只是烟雾弹,因为美国的打击一点都没有想要停止的意思。据国外媒体报道称
2025-05-13 08:44:00
无任何门槛!美团骑手养老保险试点结果公布:首批补贴已到账
快科技5月13日消息,日前,美团官方公众号发文宣布,江苏南通和福建泉州,首批参与美团养老保险试点的骑手补贴已到账。同时
2025-05-13 08:44:00
智浴新境 智启未来 AXENT恩仕全球首家智慧浴室旗舰店于北京盛大启幕
2025年5月10日,高端智慧卫浴品牌AXENT恩仕于北京盛大揭幕其全球首家智慧浴室旗舰店。恩仕集团董事长李飞宇、恩仕集团高级副总裁方奕敏
2025-05-13 09:06:00
人生最艰难的时间过去了!雷军恢复健身房打卡:网友喊话小米加油
快科技5月13日消息,雷军又开始了自己身的健身打卡了,不少网友也是纷纷现身给他打气。“5月13日,周二。健身房打卡,2025年第43次
2025-05-13 09:14:00
中国成年人平均23时15分入睡、睡眠时长超7小时:你达标了吗
快科技5月13日消息,最新的调查显示,中国成年人平均23时15分入睡,你超过这个时间了吗?《2025年中国睡眠健康调查报告》显示
2025-05-13 09:14:00
719元一把 智界车主愤怒:钥匙搞双标、月销已腰斩
最近,鸿蒙智行App上线了智界车型的蓝牙遥控钥匙售卖链接,原价719元,限时团购价498元。虽然有优惠,但还是引发了大量智界车主的吐槽
2025-05-13 09:44:00
浩思动力推Gemini微型增程器,首搭氮化镓模块引关注
在新能源汽车市场竞争愈发激烈的当下,创新技术无疑是车企率先破局的利刃。日前,在混动、纯电领域均占据行业领先优势‌的浩思动力HorsePowertrain
2025-05-13 09:45:00
初见苏然,利落的短发,知性的气质,果断的性格,让“刚柔并济”一词在她身上展现的淋漓尽致。她说她喜欢竹子,竹子那种坚韧向上的品格是她不断追寻的目标
2025-05-13 09:58:00
中新经纬5月13日电 国家安全部微信公众号13日发布《守护“随身而行”的安全》一文称,在数字化时代的今天,智能手表、智能手环
2025-05-13 10:07:00
有钱人的真实生活日常,他们的成功,竟然离不开这些习惯!
在我们的印象中,有钱人的生活总是遥不可及:豪车、别墅、名表……似乎每一天都在尽情享受奢华。但是,如果你真正走近这些成功人士的生活
2025-05-13 10:14:00