• 我的订阅
  • 头条热搜
上海人工智能实验室公布首个ai高考全卷评测结果
...一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评...……更多
清华发布2024年3月版《SuperBench大模型综合能力评测报告》
本文转自:新华网最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...和顶尖的技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0 同样...……更多
6月24日,在某科技媒体发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o 以562分排名文科总分第一。国内产品中,豆包等三款国产AI考上文科一本线。字节跳动旗下的豆包拔得头筹,成绩是542.5分,其后依次是百度文心、百川智能...……更多
多家券商最新研判:海螺AI爆火,MiniMax商业化进展迅速
...。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后,海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计,海螺AI网页版在9月的访问增速超8倍,海外用户纷纷在社交平台分享使用体验,普遍认为海...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多
teleai星辰语音大模型:多方言能力再次突破
...?你听得懂各地方言吗?时隔不到半年,TeleAI星辰语音大模型的多方言能力再次突破,不仅攻克了湛江话、宜宾话、洛阳话、烟台话等,将方言种类从30种提升至40种的同时,还引入对英文的识别,构建起AI时代的沟通桥梁。当前...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此...……更多
AI手机没有独家大模型供应商
...活跃用户的苹果市场,将成为大模型厂商最激烈的AI性能竞技场。 吃百家饭的AI手机手机品牌与大模型公司合作,苹果不算开先河。1月,荣耀、三星就与百度展开合作,三星将文心一言集成进了Galaxy AI,荣耀通过YOYO接入文心一...……更多
三大股指高开,人工智能AIETF涨超2%,三六零领涨超5%
...涨超8%。消息面上,近期商汤发布“日日新SenseNova5.0”大模型,该模型在多个客观评测指标上达到或超越了GPT-4Turbo。日日新5.0在知识、数学、推理及代码能力上显著提升,多模态能力达到全球领先水平;科大讯飞星火V3.5春季上...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?
...智能体框架模拟人的思维过程。如果向 Perplexity.ai 提问「王者荣耀当前赛季哪个射手最强?」它会直接搜索这个问题,并总结网上已有的回复。把这个问题交给 MindSearch,它会把这个问题拆解成一个逻辑链:「当前赛季是哪个赛...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...估,小到简单的数学运算,大到复杂的逻辑推理和大语言模型问答等多个方面,更加全面地展现CPU在不同AI应用中的表现。由于CPU属于计算机的核心部件,所以在AI处理中起着至关重要的作用。GPU测试部分,与CPU的测试基本相同...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯(首席记者 董进)1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪,正式发布基于首个全国产算力训练的讯飞...……更多
AI赛道集体回调,资金加速流入,多个赛道有望受到催化
...催化:1)人工智能AIETF(515070):多模态大模型大爆发,AI王者归来2)云计算50ETF(516630):AI崛起,算力先行,国产算力扛大旗!3)数据ETF(516000):大模型狂飙,数据要素助力AI新格局4)机器人ETF(562500):AI赋能,具身智能浪潮来袭5...……更多
...人大代表刘庆峰详解我国人工智能产业发展——“通用大模型底座上不会出现代差”本报记者 王菡娟《&nbsp人民政协报 》 (&nbsp2024年03月14日 &nbsp第&nbsp07&nbsp版)无论是ChatGPT的诞生还是Sora引发的全球关注,大模……更多
全国技能大赛:不仅是竞技场还是“风向标”
...专业发展建设 提升人才培养标准全国技能大赛:不仅是竞技场还是“风向标”第二届职业技能大赛选手正在进行木工项目比赛。新华社记者 赵子硕摄◎本报记者 孙明源 陈 曦第二届全国技能大赛近日在天津闭幕。与首届大赛相...……更多
2023首届腾讯开悟人工智能全国公开赛在成都凤凰山体育公园收官
...0日,2023首届腾讯开悟人工智能全国公开赛颁奖典礼与2023王者荣耀世界冠军杯总决赛在成都凤凰山体育公园携手落幕,向社会呈现一场从游戏到科技,从科技到人才的赛事新样本。颁奖现场作为国内最具影响力的游戏AI竞技赛事...……更多
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的里程碑,标志着云知声正式踏...……更多
厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?
厦大纪荣嵘教授团队自主研发的思源大模型“霸榜”权威榜单,团队技术已服务数百家政企机构和上亿用户国产大模型“优等生”是怎样炼成的?纪荣嵘教授(右二)指导学生开展科研活动。(受访者 供图)厦门网讯(厦门日...……更多
更多关于科技的资讯:
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
来自卡内基梅隆大学、马里兰大学、哥伦比亚大学、斯坦福大学、麻省理工学院、清华、北大、港大等全球 AI 顶尖高校和 Nvdia 等研究机构的华人团队
2024-12-20 09:22:00
送礼物,微信电商的关键一枪
微信开放“送礼物”,会改变电商行业格局吗?这或许是近些年来,微信最大胆的一步。12月17日,微信小店运营团队发布公告称
2024-12-20 09:24:00
豆包再降价,字节“饱和式”进攻仍在继续
大模型应用大战即将一年整,竞争依然激烈。12月18日的火山引擎Force冬季大会上,字节跳动“豆包全家桶”又迎来了新成员
2024-12-20 09:25:00
三星和世嘉合作推出索尼克主题 PRO Plus microSD 卡
IT之家 12 月 20 日消息,科技媒体 thefpsreview 昨日(12 月 19 日)发布博文,报道称三星和世嘉合作
2024-12-20 09:26:00
第六代联想ThinkBook Plus卷轴屏笔电渲染图曝光,或CES 2025发布
IT之家 12 月 20 日消息,北京时间今天凌晨,爆料人 Evan Blass 发布了其所称的“第六代联想 ThinkBook Plus”笔记本的图片
2024-12-20 09:27:00
八位堂海外推出 Ultimate Mini 有线游戏手柄,紧凑 Xbox 布局
IT之家 12 月 20 日消息,八位堂现已在海外推出一款型号为 Ultimate Mini 的游戏手柄,号称专门为青少年或小手玩家打造
2024-12-20 09:27:00
OnexPlayer G1壹号mini游戏本预热:搭载AMD锐龙AI9 HX 370处理器
IT之家 12 月 19 日消息,除 OnexPlayer X1 Pro 外,壹号本科技还预热了另一款搭载 AMD 锐龙 AI 9 HX 370 处理器的新机 ——OnexPlayer G1
2024-12-20 09:28:00
谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3
2024-12-20 09:28:00
闪极 S4 唱片充电器 65W 发布:透明设计、自带伸缩线,249 元
IT之家 12 月 19 日消息,在今晚举行的 AI 眼镜发布会上,闪极还公布了一款 S4 唱片充电器 65W ,现已在京东平台上架并开售
2024-12-20 09:29:00
闪极 AI“拍拍镜”智能眼镜发布:接入数十家大模型,售 999 元起
IT之家 12 月 19 日消息,闪极今晚正式发布新款 AI 智能眼镜 —— 闪极 AI「拍拍镜」,零售价 1499 元
2024-12-20 09:29:00
中国大陆首条 TFT 基 Micro LED 量产线及首台量产产品点亮
IT之家 12 月 19 日消息,成都辰显光电有限公司今日发文宣布,在四川省成都市今日举行的 2024 世界显示产业创新发展大会开幕式上
2024-12-20 09:30:00
全球首款遇冷变色手机 realme 14 Pro 外观公布
IT之家 12 月 19 日消息,realme 14 Pro 率先在印度官宣,同时该系列机型外观设计也正式公布,该系列机型将于明年 1 月正式发布
2024-12-20 09:30:00
快手可灵 1.6 模型发布
IT之家 12 月 19 日消息,快手今日宣布视频生成推出可灵 1.6 模型,文本响应度、画面美感及运动合理性,均有明显提升
2024-12-20 09:30:00
xMEMS Labs 预告 CES 2025 首度公开展示扬声器、芯片上风扇新品
IT之家 12 月 19 日消息,MEMS 微电子机械系统设备制造商 xMEMS Labs 表示,将于明年 1 月初的 CES 2025 消费电子展上首度公开展示其基于 MEMS
2024-12-20 09:32:00
微星首款 DP 2.1 显示器 MPG 322URX QD-OLED 亮相
IT之家 12 月 19 日消息,微星首款搭载 DP 2.1 接口的显示器 MPG 322URX QD-OLED即将上市
2024-12-20 09:32:00