• 我的订阅
  • 头条热搜
中文大模型最新评测出炉:腾讯混元国内第一!
...,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态理解要求模型能够...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...评测结果显示,OpenAI Sora、Runway、爱诗科技PixVerse、Pika、腾讯VideoCrafter-V2位列前五。 文生图模型的客观评测指标与主观感受差异巨大,有失效的迹象,因此排名以主观评测为准;Mdjourney基本无法理解中文提示词,因此排名靠后...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...型和多模态大模型超过150个,已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一,总排名第二,GLM-4尤为值得关注。今年一月,智谱AI在2024年度技术...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。虽然这次都还是被GPT-4o压……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...,负责前沿技术的研究。9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。今天,天工Skywork-13B系列大模型的开...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-4V在奋力追平GPT-4V的同时,LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力,其在中文多模态场景下表现优异,使得用户不必学习复杂的“prompt”便可以轻松上手,这对于执行“...……更多
云从科技从容大模型荣登中国大模型第一梯队
...取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分70.35分的优异成绩稳居国内大模型综合测评第六位,正式步入国内...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达...……更多
...国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组...……更多
BAT等互联网大厂,如何入局人形机器人?
...退出机器人方向。阿里达摩院裁撤机器人部门并入菜鸟,腾讯RobticsX机器人实验室找不到太好的产品落地渠道,一号员工离开自主创业,小米的人形机器人迭代速度放缓。在人形机器人的风口再一次起来后,面对前景广阔的人形...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA,这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...任单位由中国信通院牵头,副主任单位包括vivo、百度、腾讯、360、华为、中国移动、阿里、浙江大学以及蚂蚁集团。专家委负责对AIIA安全治理委员会的总体工作进行把关,两个工作组及伙伴计划则负责开展AI相关研究,推动产...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...MiniCPM的性能也能做到基本无损耗。在性能上,MiniCPM-2B的中文知识能力、代码能力、数学能力已经超过Mistral-7B,而英文知识能力、逻辑能力和常识问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上,MiniCPM...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
不要小看「实而不华」的腾讯 AI
「早早开始拿 AI 赚钱的腾讯,是怎么做AI的?」作者 | 连冉编辑| 郑玄上周 AI 领域最热闹的莫过于大洋彼岸 OpenAI 与谷歌的「掐架」,前者前脚刚发新一代旗舰模型 GPT-4o,把语音助手带到了新高度,后者就也在提到 121 次 AI 的...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...大模型标准符合性评测”结果公布,首批360集团、百度、腾讯、阿里四家企业大模型产品通过。该测试由工信部中国电子技术标准化研究院(简称“工信部电子标准院”)发起,评测围绕多领域多维度模型评测框架与指标体系,...……更多
腾讯自研大模型助力长三角打造世界级产业集群
东方网5月24日消息:5月24日,腾讯作为科技企业代表,受邀参加《深入推进长三角G60科创走廊科创生态建设大会》。现场,腾讯集团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础...……更多
...十余款人工智能大模型全部面向公众开放服务。另外包括腾讯在内的一些公司的大模型也通过备案,将择机面向公众开放。人工智能大模型是指使用大规模数据和强大的计算能力训练出来的“大参数”模型,这些模型通常具有高...……更多
百川智能发布baichuan3稳定语言模型
...U、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan3在自然语言处理和代码生成领域的强大实力。不仅如此,其在对...……更多
腾讯云公布多项大模型产品进展
本文转自:人民日报客户端施芳腾讯云生成式AI产业应用峰会日前在北京召开,公布大模型研发、应用产品的系列进展。以“产业实用”作为发展大模型的核心战略,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示...……更多
...较自研模型与GPT-4 等海外模型时,会强调自己的模型更懂中文。记者就在现场测试了商汤“商量”大语言模型的中文理解能力。根据现场工作人员提示,记者“调取”了资料库里《道德经》《论语》《易经》这三本古籍的文档,...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...模型产品安全测试A级。此外,积极探索对主流开源模型的中文能力提升和安全合规性改造,研发并开源了全球首个Llama3 8B中文版模型。这一系列成果充分展现了中国联通在人工智能尤其是大模型领域积极布局取得的成绩。在打造生...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
更多关于科技的资讯:
手机放胸口2分钟就能发现致命心脏病 准确率89%
心力衰竭(心衰)是各种心脏疾病的严重表现或晚期阶段,一旦被诊断心衰,可能需要反复住院治疗,5 年内死亡的风险高达 51
2024-12-24 00:04:00
小鹏汽车2025年产品规划曝光:3款全新车型 4款改款
12月23日晚,有汽车博主披露了小鹏汽车针对2025年的产品部署,计划推出3款全新车型及4款重大改款车型,阵容相当强大
2024-12-24 00:04:00
人类身上明显的缺陷:吃饭时发出声音会杀死自己
任何动物都有一些不够完美生理结构,即便是人类也不例外。我们可以找到很多人类的“缺陷”,比如人类的奇怪的智齿和阑尾、人类对垃圾食品的偏爱
2024-12-24 00:04:00
撒钱折磨网友的转转 其实自己也不好过
前排声明,差评君的旧手机没放转转上回收,这篇文章也不是转转广告,大伙们可以放心食用。今年小红书,不是把年度词颁布给了抽象嘛
2024-12-24 00:34:00
我屏幕里的二次元萌妹们 开始教高数、打冷兵器、做电焊
虚拟主播大家应该不陌生,指的就是以虚拟形象在视频网站上进行内容创作的主播,通常被称为 Vtuber 、 VUP 。先说个大家肯定熟悉的
2024-12-24 00:34:00
中国电视迎来近年来最好时代
快科技12月23日消息,根据商务部最新数据,截至12月19日24时,已有超过3330万名消费者积极参与了家电以旧换新的活动
2024-12-24 00:34:00
滴滴就用户打到臭车致歉:上线拉黑异味车功能 多地推出“香香车”
快科技12月24日消息,滴滴“臭车”一直以来都是个老大难问题,尤其进入冬季,不少司机减少开窗次数,车内空气质量更是雪上加霜
2024-12-24 00:34:00
天玑8400赋能高阶智能手机市场
2024年12月23日–MediaTek发布天玑84005G全大核智能体AI芯片。天玑8400承袭了天玑旗舰芯片的诸多先进技术
2024-12-24 00:52:00
小米15ultra准备好进军印度市场了吗?
小米15Ultra的全球发布日益临近,最新动态显示其已准备好进军印度市场。新机型号为“25010PN30I”,近日已成功获得印度标准局(BIS)的认证
2024-12-24 01:26:00
华为平板推出智选hi版本,售价1399元起
12月23日,据博主@定焦数码爆料,华为平板也要推出智选Hi版本。实际上,华为智选HiMatePad11.5英寸已经悄然在电商平台上架
2024-12-24 01:40:00
more体验more消息,小米手环10和nfc版入网
据博主@体验more消息,目前有多款国产手环手表入网,其中小米(红米)有两款,型号分别是M2456B1和M2457B1
2024-12-24 01:43:00
小米汽车精英驾驶培训首期课程圆满结束
12月23日,CNMO了解到,小米汽车精英驾驶培训的首期课程圆满结束,官方发布了一段视频,回顾了培训现场令人血脉喷张的体验
2024-12-24 02:18:00
小米hyperos1.4.5上线,新增13项新功能
12月23日,小米汽车推送新版系统XiaomiHyperOS1.4.5,正式引入VLM视觉语言大模型,一口气带来了13项新功能和26项优化
2024-12-24 02:21:00
aocu32u3d,为设计创作人士带来新质生产力
就在双11期间,苹果正式推出了新款Macmini,其采用最新的M4和M4Pro芯片,尺寸仅为手掌大小,尽管厚度略有增加
2024-12-24 03:03:00
免费合规“神器”来袭!企元数智如何引领企业合规新潮?
企业合规之殇,谁来“救赎”?在当今复杂多变的商业环境中,企业合规经营已成为不可逾越的底线与实现长远发展的重要保障。随着法律法规的日益完善和监管力度的不断加强
2024-12-24 03:13:00