• 我的订阅
  • 头条热搜
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6,数学分榜并列第3,代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-20...……更多
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的结果,无法通过“刷题”来走捷径,因此更为...……更多
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。Gemini团队的关键人物Simon Tokumine发文庆祝称:(这一新模...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
(id:SouthReviews)原标题 | 他们抄袭,作弊,做假,却宣称超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世...……更多
...,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
字节扣子模型广场,给AI大模型搭了一座擂台
...移动App工场。在小雷看来,字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发,让开发者可以更高效地开发Bot,同时帮助所有大模型更快进化,字节扣子正在邀请更多大模型对其开放 API,加入到其评测范...……更多
...巡展”首站落地成都。巡展首站活动中透露了字节豆包大模型的最新进展——截至今年7月,豆包大模型日均Tokens使用量已突破5000亿次,平均每个企业客户Tokens日均使用量较5月15日模型发布时增长22倍。国产大模型越来越受到认...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...最强大模型。历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。奋力追赶一年,成就最强中文大模型大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...人工智能实验室(GAIR Lab)推出的OlympicArena[1] (奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡...……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
本文转自:新华每日电讯“百模大战”以来,AI大模型的部分榜单上出现了一个奇怪现象:长期盘踞在榜单前列的,经常是一些名不见经传的国产大模型,它们竟然以接近满分的优势碾压了ChatGPT、Gemini和其他知名的AI大模型。之...……更多
王者荣耀:国际版开测三天,预约人数激增,安卓用户终于可以登录
...究此前,很多玩家都以为《ArenaofValor》(中文译名:勇士竞技场),是王者荣耀的国际版。事实上,《ArenaofValor》这款游戏,是新加坡Garena游戏公司,和腾讯天美工作室共同开发,主要发行在欧美地区的一款Moba游戏。发行在港澳台...……更多
...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...务的版本。还是在360AI浏览器中,AI助手还上线了“模型竞技场”(bot.360.com),支持54款大模型产品的“同台竞技”,最新版本中还上线了“组队较量”、“匿名比拼”、“随机对战”等功能。总的来说,360AI搜索还是360AI浏览器...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...至还能与其两倍大的模型竞争。目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:而Gemma 2 9B的排名甚至比肩Qwen 2 72B:该结果也让网友纷纷表示难以置信。 此外,VentureBeat表示,两种……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
openaigpt-4o登顶竞技场排行榜
...工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
10月15日深夜,零一万物的Yi-Lighting大模型在LMSYS盲测竞技场的投票数超过1万次,拿到了这个国际权威测试榜单的入场券,\"出来的结果是,我们排在全球第六\",10月16日上午,零一万物CEO李开复向媒体宣布时一字一顿。为了强调...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...媒体近日举办了一项“另类高考”,让近两年大火的AI大模型来模拟考生作答高考试题,看它们的表现究竟如何。从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳...……更多
国产ai大模型首批评估名单公布
6月11日消息,中国信息通信研究院公布了可信AI代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱codegeex等国产AI大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求第1部分:代码...……更多
更多关于科技的资讯:
比亚迪腾势n8OTA升级,更新将分批次逐步推送
10月18日消息,比亚迪旗下腾势N8迎来OTA升级,此次更新将分批次逐步推送。IT之家附更新主要内容如下:新增红灯倒计时功能新增绿波车速功能新增全场景智能语音智慧问答新增开通手机
2024-10-19 01:41:00
未来视野rv100q开售:支持100hz高刷
10月17日消息,未来视野27英寸2K显示器RV100Q今日正式开售,该款显示器支持100Hz高刷、覆盖100%sRGB色域
2024-10-19 01:42:00
小米SU7将在本月全力冲刺2万辆的交付量
10月17日消息,“2024世界智能网联汽车大会”已于今日在北京亦庄北人亦创国际会展中心开幕,小米董事长、CEO雷军出席大会并发布主题演讲
2024-10-19 01:45:00
云米ai燃气热水器super2开售,支持无极变频燃烧
10月17日消息,云米AI燃气热水器Super2今日开售,该款燃气热水器配备全封闭燃烧舱+直流变频风机,同时接入米家和云米App
2024-10-19 01:46:00
《深海迷航 2》首发加入微软 Xbox Game Pass
10月18日消息,在微软今日凌晨举行的新一轮Xbox合作伙伴发布会上,微软联合UnknownWorldsEntertainment公布了开放世界沙盒游戏《深海迷航(Subnautica)》(IT之家注
2024-10-19 01:51:00
这些手机使用习惯会对个人隐私产生威胁
手机是我们生活中高频使用的工具,但一些不当的使用习惯,其实会对个人隐私产生威胁。近日,有媒体盘点了会偷偷泄露你隐私的5个手机使用习惯
2024-10-19 01:55:00
小马智行正式公开向sec提交ipo招股书
10月18日消息,小马智行(Pony.ai)于美东时间10月17日周四,正式公开向美国证券交易委员会(SEC)提交IPO招股书
2024-10-19 01:57:00
三星exynos2500基准测试平台揭示关键配置细节
三星对于在其即将推出的S25系列中是否采用Exynos2500处理器表现出了犹豫态度。早在今年4月,该公司就已确认,这款新的系统级芯片(SoC)将应用于其下一代旗舰产品中
2024-10-19 02:03:00
长安启源e07将于10月21日上市,基于SDA架构打造
10月18日消息,长安启源官方昨日宣布,长安启源E07将于10月21日上市。据IT之家报道,9月22日,长安启源E07开启预售
2024-10-19 02:07:00
blackmagic相机1.4版更新:兼容更多安卓机型
10月18日消息,安卓版BlackmagicCamera相机应用于今年6月推出,首批兼容三星GalaxyS21-S24a
2024-10-19 02:08:00
智能网联汽车大会,宝马v2x助力智慧出行
10月17至19日,2024年世界智能网联汽车大会(WICV)在北京隆重召开。本届大会以“协同并进智行未来——共享智能网联汽车发展新机遇”为主题
2024-10-19 02:09:00
魅族20系列手机内测升级,新增拖拽分享、户外工作模式等功能
10月18日消息,魅族20系列手机于昨日获推 Flyme11.24.10.16daily内测版本升级,新增拖拽分享、户外工作模式等功能
2024-10-19 02:13:00
华为matepad2023款平板今年迭代新品发布
10月18日消息,博主@看山的叔叔昨日发文透露华为MatePad2023款平板今年迭代新品叫“MatePad11.5”
2024-10-19 02:14:00
郭明錤:骁龙8至尊版或登上soc史上价格巅峰
面对成本的急剧攀升,新一代骁龙旗舰处理器——骁龙8至尊版,或将登上手机系统级芯片(SoC)史上的价格巅峰,进而导致众多国产旗舰机型的售价相应上调
2024-10-19 02:16:00
铁威马d8hybrid硬盘柜,轻松搞定冷热数据存储问题
随着数字化时代的到来,数据量呈指数级增长,无论是个人用户还是企业机构,都在寻找更加高效的数据存储方案。对于存储数据的选择
2024-10-19 02:21:00