• 我的订阅
  • 头条热搜
中文大模型最新评测出炉:腾讯混元国内第一!
...,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态理解要求模型能够...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...评测结果显示,OpenAI Sora、Runway、爱诗科技PixVerse、Pika、腾讯VideoCrafter-V2位列前五。 文生图模型的客观评测指标与主观感受差异巨大,有失效的迹象,因此排名以主观评测为准;Mdjourney基本无法理解中文提示词,因此排名靠后...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...型和多模态大模型超过150个,已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一,总排名第二,GLM-4尤为值得关注。今年一月,智谱AI在2024年度技术...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。虽然这次都还是被GPT-4o压……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...,负责前沿技术的研究。9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。今天,天工Skywork-13B系列大模型的开...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-4V在奋力追平GPT-4V的同时,LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力,其在中文多模态场景下表现优异,使得用户不必学习复杂的“prompt”便可以轻松上手,这对于执行“...……更多
云从科技从容大模型荣登中国大模型第一梯队
...取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分70.35分的优异成绩稳居国内大模型综合测评第六位,正式步入国内...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达...……更多
...国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组...……更多
BAT等互联网大厂,如何入局人形机器人?
...退出机器人方向。阿里达摩院裁撤机器人部门并入菜鸟,腾讯RobticsX机器人实验室找不到太好的产品落地渠道,一号员工离开自主创业,小米的人形机器人迭代速度放缓。在人形机器人的风口再一次起来后,面对前景广阔的人形...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA,这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...任单位由中国信通院牵头,副主任单位包括vivo、百度、腾讯、360、华为、中国移动、阿里、浙江大学以及蚂蚁集团。专家委负责对AIIA安全治理委员会的总体工作进行把关,两个工作组及伙伴计划则负责开展AI相关研究,推动产...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...MiniCPM的性能也能做到基本无损耗。在性能上,MiniCPM-2B的中文知识能力、代码能力、数学能力已经超过Mistral-7B,而英文知识能力、逻辑能力和常识问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上,MiniCPM...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
不要小看「实而不华」的腾讯 AI
「早早开始拿 AI 赚钱的腾讯,是怎么做AI的?」作者 | 连冉编辑| 郑玄上周 AI 领域最热闹的莫过于大洋彼岸 OpenAI 与谷歌的「掐架」,前者前脚刚发新一代旗舰模型 GPT-4o,把语音助手带到了新高度,后者就也在提到 121 次 AI 的...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...大模型标准符合性评测”结果公布,首批360集团、百度、腾讯、阿里四家企业大模型产品通过。该测试由工信部中国电子技术标准化研究院(简称“工信部电子标准院”)发起,评测围绕多领域多维度模型评测框架与指标体系,...……更多
腾讯自研大模型助力长三角打造世界级产业集群
东方网5月24日消息:5月24日,腾讯作为科技企业代表,受邀参加《深入推进长三角G60科创走廊科创生态建设大会》。现场,腾讯集团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础...……更多
...十余款人工智能大模型全部面向公众开放服务。另外包括腾讯在内的一些公司的大模型也通过备案,将择机面向公众开放。人工智能大模型是指使用大规模数据和强大的计算能力训练出来的“大参数”模型,这些模型通常具有高...……更多
百川智能发布baichuan3稳定语言模型
...U、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan3在自然语言处理和代码生成领域的强大实力。不仅如此,其在对...……更多
腾讯云公布多项大模型产品进展
本文转自:人民日报客户端施芳腾讯云生成式AI产业应用峰会日前在北京召开,公布大模型研发、应用产品的系列进展。以“产业实用”作为发展大模型的核心战略,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示...……更多
...较自研模型与GPT-4 等海外模型时,会强调自己的模型更懂中文。记者就在现场测试了商汤“商量”大语言模型的中文理解能力。根据现场工作人员提示,记者“调取”了资料库里《道德经》《论语》《易经》这三本古籍的文档,...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...模型产品安全测试A级。此外,积极探索对主流开源模型的中文能力提升和安全合规性改造,研发并开源了全球首个Llama3 8B中文版模型。这一系列成果充分展现了中国联通在人工智能尤其是大模型领域积极布局取得的成绩。在打造生...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
更多关于科技的资讯:
苹果史诗级大升级!iPhone 17系列关键信息汇总
2025年刚刚开始,今年旗舰手机的爆料消息就已经满天飞,其中最受关注的就是全新的iPhone 17系列了,毕竟近三代的苹果手机改变实在是太小
2025-02-10 07:46:00
三头六臂殷郊法相特效被吐槽 《封神第二部》辟谣找外包公司4500元制作
快科技2月10日消息,《封神第二部:战火西岐》上映后,网友吐槽最多的就是影片特效,槽点最密集的就是殷郊法相,三头六臂蓝色身体的殷郊
2025-02-10 07:46:00
“9”字辈家族再添新成员!深蓝S09首发亮相:超5米豪华6座SUV
快科技2月10日消息,2月9日,深蓝汽车全新中大型豪华SUV——深蓝S09正式发布,这是继该车型在2025年央视春晚亮相后的首次正式发布
2025-02-10 07:47:00
15.19万元起!深蓝S07/L07新增车型上市:搭载华为乾崑智驾
快科技2月10日消息,深蓝汽车宣布深蓝S07深蓝智驾AD PRO版和深蓝S07华为乾崑智驾ADS SE版正式上市。共推出7款车型
2025-02-10 07:47:00
南京数字货运平台企业做法入选“全国典型案例”——全社会物流成本,这样降下来□南京日报/紫金山新闻记者张甜甜周容璇中国物流与采购联合会日前公布首批有效降低全社会物流成本22个典型案例和38个优秀案例
2025-02-10 07:59:00
新春走基层 | 看超强“大脑”算向全国
本文转自:人民网-贵州频道人民网记者 高华“哪吒炼成肉身前,千万个碎片汇集在一起,那画面太震撼了!”“申公豹纵身一跃开启战斗时
2025-02-10 08:11:00
为什么抢购它?2025性价比超高的2款智能手表,用户高度推荐
随着科技的迅猛发展,智能手表已经成为现代生活中不可或缺的伴侣。它们不仅可以显示时间,更是健康监测、通讯、娱乐和生活助手的多功能设备
2025-02-10 10:53:00
小孩哥拿儿童手表认真拍摄小米SU7 Ultra 网友:小米潜在客户已经排到20年后了
快科技2月10日消息,有博主在小米体验店内看到,一名小孩哥透过围栏,用儿童手表认真拍摄小米SU7 Ultra漂亮的碳纤维尾翼
2025-02-10 08:17:00
中国监控摄像头2024年销量超5300万套 小米夺双第一
快科技2月10日消息,今日,研究机构洛图科技发布最新数据显示,2024年,中国监控摄像头消费级市场销量为5349万套,同比微增0
2025-02-10 08:17:00
40多万新车方程豹豹8被小孩引燃 车主又订了一辆:我就喜欢这车
快科技2月10日消息,近日,山东菏泽一网友发视频称,自己刚买不到一个月的新车,被一小孩放烟花引燃。按照这位车主的说法,自己刚买车不要一个月
2025-02-10 08:17:00
“你相信光吗?”随着近些年奥特曼IP风靡海内外,这个网络热梗同时众所周知。相信光的力量究竟有多大?春节假期前,一家成立于2014年的拼搭角色类玩具企业登陆港交所
2025-02-10 08:18:00
大模型赋能迁安钢铁“智变”全市精品钢材比重提高至45%河北日报讯(记者师源、汤润清)电脑“加料”,工人们从“炉前炼钢”变为“一键炼钢”
2025-02-10 08:43:00
刚上市就翻车 黑屏、变砖后!用户称RTX 5090运行中有烧焦味 英伟达虚惊一场
快科技2月10日消息,这RTX 5090才上市没多久,问题已经多到令人无语,什么黑屏、变砖、系统无法识别等....据外媒Tom's Hardware报道称
2025-02-10 09:17:00
男子微信用40万转账表情包套走8000元:官方呼吁警惕任何转账交易
2月10日消息,据国内媒体报道称,近日河南开封发生了一起诈骗案件,受害者牛女士在自家店内遭遇了一男一女两名嫌疑人的诈骗行为
2025-02-10 09:17:00
距全球影史票房榜1还差百亿!《哪吒2》北美区一票难求:海外博主看后强烈推荐
快科技2月10日消息,中国文化开始输出海外,并且越来越受老外的认可。《哪吒2》即将在海外上映,目前北美区真的一票难求(纽约
2025-02-10 09:17:00