• 我的订阅
  • 头条热搜
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...至还能与其两倍大的模型竞争。目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:而Gemma 2 9B的排名甚至比肩Qwen 2 72B:该结果也让网友纷纷表示难以置信。 此外,VentureBeat表示,两种……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
逆水寒“ai竞技场”将于11月22日正式上线
...日,国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能,这一创新举措旨在通过游戏平台,汇聚广大玩家力量,对当下热门的AI大模型进行客观评估。据悉,逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与,包...……更多
openaigpt-4o登顶竞技场排行榜
...工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
10月15日深夜,零一万物的Yi-Lighting大模型在LMSYS盲测竞技场的投票数超过1万次,拿到了这个国际权威测试榜单的入场券,"出来的结果是,我们排在全球第六",10月16日上午,零一万物CEO李开复向媒体宣布时一字一顿。为了强调...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...媒体近日举办了一项“另类高考”,让近两年大火的AI大模型来模拟考生作答高考试题,看它们的表现究竟如何。从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳...……更多
...文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等...……更多
国产ai大模型首批评估名单公布
6月11日消息,中国信息通信研究院公布了可信AI代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱codegeex等国产AI大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求第1部分:代码...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...新模型,真的藏不住了!先是有匿名聊天机器人现身lmsys竞技场,声称自己是GPT-4系列模型一部分,吊足了大家的胃口。随后奥特曼又发了一个浮想联翩的推文,正是他花园里的草莓照片,并配文:i love summer in the garden。上个月Op...……更多
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
...(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。IT之家援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同...……更多
国产低价显卡坞评测:能让轻薄本用上本地大模型
...情况,需要AMD的驱动进一步完善。轻薄本也能玩转本地大模型 接下来老规矩,现在怎么说也算是AI大模型的应用期,这有张显卡不拿去跑大模型,就跟矿潮的时候买了张显卡却没试过挖矿一样,那肯定就是不行的。不过,目前...……更多
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
为啥GPT-4o mini能登顶大模型竞技场??原来是OpenAI会刷分呀。这两天,lmsys竞技场公布了一份充满争议的榜单。其中才面世不久的GPT-4o mini和满血版并列第一,把Claude 3.5 Sonnet甩在身后。结果网友炸锅了,大家凭体感觉得这不可能...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
零一万物新模型盲测国产首超GPT-4o!李开复透露:一次训练成本超2000万
...息,日前李开复的零一万物公司,正式对外发布了新旗舰模型Yi-Lightning。在盲测榜单LMSYS中,Yi-Lightning位列第六,仅次于OpenAI的GPT-4o、o1系列,Google的Gemini 1.5 pro系列,与马斯克xAI旗下Grok-2打平。值得一提的是,此次盲测中Li……更多
东方财富董事长其实:建议进一步推动股权投资支持科技创新
...推动股权投资支持科技创新的建议》和《关于支持垂直大模型开发与应用的建议》。推动股权投资支持科技创新方面,其实提出了三方面建议:一是进一步健全政府引导基金容错机制,二是支持链主企业开展早期风险投资,三是...……更多
OpenAI 再成“榜一大哥”:o1-preview AI 模型驾驭数学等任务
... Decoder 昨日(9 月 19 日)发布博文,报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...模态核心能力全面超越 GPT-4V,单图理解越级比肩多模态王者 Gemini 1.5 Pro 和新晋顶流 GPT-4o mini 。多项功能首次上端:实时视频理解、多图联合理解、多图 ICL 视觉类比学习、多图 OCR 等功能,第一次让端侧模型睁开观察、理解真...……更多
AI时代发电厂在京浮出水面!国产芯片集结,智能算力开箱即用
人工智能毫无疑问是当今一项重要议题,通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而,服务AI的基础设施——算力和数据,是限制人工智能发展的瓶颈,也成了进一步讨论的话题。为什么到现在仍然...……更多
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
...”(小熊猫)的神秘文生图模型狠狠火了!!登顶文生图竞技场,直接将Flux、Midjourney等一众顶尖模型踩在脚下——其ELO得分比Flux 1.1 Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果be like:啥概念呢?按网友的话...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...的偏见,并且不容易通过过拟合评委模型进行操控。参与竞技场的 LLM 越多,评估越稳健(图 4)。此外,Decentralized Arena 在 50 多个模型的 “整体” 维度上与 Chatbot Arena 达到了非常高的相关性(95%,图 2)。 自动化、易于扩展且...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...据集上的表现甚至胜于GPT-4V,成为了开源模型中的“性能王者“。图片来源:LLaVA-1.6官网的标准评测数据在不拘泥于单一模态的内容生成,具有Text-to-Text和Image-to-Text两种模式的同时,LLaVa-1.6的过人之处还在于更低的训练数据成...……更多
厦门软件园:人工智能企业在这里“拔节生长”
...借技术积累和对应用场景的理解,在巨头林立的人工智能竞技场中,走出了一条差异化、专业化的发展之路。 在厦门软件园,像美图这样以专注“铸专长”的企业还有许多。园区积极引导企业发挥细分领域优势,持续推动技术...……更多
腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15
...,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15。Chatbot Arena 发起方 LMSYS Org (加州大学伯克利分校等机构支持的非营利组织)通过官方X账号对腾讯混元的加入表示欢迎。跟其...……更多
阿里QwQ-32B API接口服务上线国家超算互联网:零门槛部署 免费100万Tokens
...官微获悉,本周,超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。据了解,基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
近年来,国内AI大模型行业蓬勃发展,市场上AIGC产品如雨后春笋般涌现,产品功能、体验和玩法日趋丰富,同时用户对于AIGC产品的使用兴趣度不断提升,生成式AI普及范围持续扩大,截止2023年12月,生成式AI移动应用全网安装渗...……更多
...网高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国...……更多
...的AI芯片进行详细调研和评测。评测将涵盖内容科技、大模型、金融、医疗、智能驾驶、云计算、智能工业、智慧城市等多个主流AI应用领域。团队将采取一系列的严格测试和应用场景模拟,从技术规格、功能、通信性能、技术...……更多
刘庆峰透露“星火X1”7月份再升级
...星火X1在高考和世博会表现不俗今年高考期间,各家AI大模型也迎来“大考”。据第三方权威媒体评测显示,讯飞星火X1在语文作文综合得分、英语作文盲评、数学测评中,均名列前茅。另外,作为日本大阪世博会中国馆唯一大模...……更多
更多关于科技的资讯:
聚焦服务品质 福州千名经纪人共赴贝壳福州站搏学大考
贝壳福州站搏学大考考场11月19日,贝壳找房福州站第26届新经纪品牌搏学大考正式拉开序幕,福州数千名房产经纪人通过线下机考的形式完成了本届搏学大考
2025-11-20 13:38:00
当输入一句简单指令,AI就能在几秒内给新鲜水果添上霉斑、给完好衣物制造破洞,这样的技术能力如今却成了少数人薅商家羊毛的利器
2025-11-20 11:16:00
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00