腾讯,中文,模型,评测,模型,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

中文大模型最新评测出炉：腾讯混元国内第一！

...，在最新发布的中文多模态大模型SuperCLUE-V基准评测中，腾讯混元大模型获国内排名第一，稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力，即多模态理解，俗称“图生文”。多模态理解要求模型能够...……更多

2024-08-05 08:07:00腾讯,中文,模型,评测,模型,模态

智源评测体系发布国内外“百模”评估结果出炉

...评测结果显示，OpenAI Sora、Runway、爱诗科技PixVerse、Pika、腾讯VideoCrafter-V2位列前五。文生图模型的客观评测指标与主观感受差异巨大，有失效的迹象，因此排名以主观评测为准；Mdjourney基本无法理解中文提示词，因此排名靠后...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

智源研究院发布FlagEval“百模”评测结果

...理解的场景对于模型而言是不小的挑战。评测结果显示，腾讯Hunyuan Image位列第一，字节跳动Doubao image v2.1、Ideogram 2.0分居第二、第三，OpenAI DALL·E 3、快手可图次之。文生视频多模态模型，画质进一步提升，动态性更强，镜头语...……更多

2024-12-20 11:22:00评测结果,研究院,评测,结果,研究,模型

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

智东西11月5日报道，今日，腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源，并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

智谱AI新一代基座大模型GLM-4在司南评测中跻身前列，位居

...型和多模态大模型超过150个，已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一，总排名第二，GLM-4尤为值得关注。今年一月，智谱AI在2024年度技术...……更多

2024-02-04 14:00:00司南,基座,前列,新一代,模型,评测

腾讯混元文生图大模型升级并对外开源

5月14日消息，腾讯宣布旗下的混元文生图大模型升级并对外开源，目前已经在HuggingFace及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

...中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。虽然这次都还是被GPT-4o压……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...，负责前沿技术的研究。9月5日，昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中，综合得分排名第一。9月25日，昆仑万维正式控股艾捷科芯，布局AI芯片。今天，天工Skywork-13B系列大模型的开...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

Bengio团队提出多模态新基准，直指Claude 3.5和

...实验更高效、更便宜，即使它有炉灶那么大。）对大多数中文母语者而言，这个任务应该不难，相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程：当代神经科学研究表明...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...-4V在奋力追平GPT-4V的同时，LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力，其在中文多模态场景下表现优异，使得用户不必学习复杂的“prompt”便可以轻松上手，这对于执行“...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

透视2025丨中国AI模型厂商已在特定领域形成一定优势

...力。”具体来看，语言模型主观评测显示，目前针对一般中文场景的开放式生成任务，各大模型表现已趋于饱和。字节跳动、百度等国产模型表现优异。不过，在逻辑推理、观点表达等维度，国内厂商仍需进一步与国际巨头看齐...……更多

2024-12-26 21:56:00中国,模型,厂商,优势,领域,模型

云从科技从容大模型荣登中国大模型第一梯队

...取得了新的突破。据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》，云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】，更以总分70.35分的优异成绩稳居国内大模型综合测评第六位，正式步入国内...……更多

2024-08-09 15:00:00模型,梯队,中国,从容,科技,模型

位列第一梯队，腾讯混元再度领跑国内大模型

...发布了《中文大模型基准测评2024年度4月报告》。其中，腾讯混元大模型位列国内大模型第一梯队，在基础和场景应用上均处于领先位置，位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准，其前身是知名的...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

20款国产大模型角逐“最强王者”

...国内主流大模型全阵容，阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战，角逐中国大模型“最强王者”。当下，“百模大战”厮杀正酣，各类榜单也层出不穷，其中国际开放研究组...……更多

2024-06-02 05:34:00王者,模型,国产,模型,竞技场,评测

BAT等互联网大厂，如何入局人形机器人？

...退出机器人方向。阿里达摩院裁撤机器人部门并入菜鸟，腾讯RobticsX机器人实验室找不到太好的产品落地渠道，一号员工离开自主创业，小米的人形机器人迭代速度放缓。在人形机器人的风口再一次起来后，面对前景广阔的人形...……更多

2024-06-12 11:54:00大厂,人形,机器人,机器,互联网,互联

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究，淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA，这是第一个系统性地全面评估模型回答简短事实性问题能力的中文评测...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...任单位由中国信通院牵头，副主任单位包括vivo、百度、腾讯、360、华为、中国移动、阿里、浙江大学以及蚂蚁集团。专家委负责对AIIA安全治理委员会的总体工作进行把关，两个工作组及伙伴计划则负责开展AI相关研究，推动产...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

云知声荣登甲子光年榜单，彰显AI大模型商业潜力

...层面：山海大模型已相继在OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测、SuperBench、MMMU等多个权威评测中屡创佳绩，稳居国内大模型第一梯队；在专业能力层面：其基于山海大模型孵化的医...……更多

2024-12-13 16:22:00甲子,潜力,模型,商业,模型,山海

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

想要体验文生视频的小伙伴又多了一个选择！今日，腾讯宣布旗下的混元视频生成大模型（HunYuan-Video ）对外开源，模型参数量 130 亿，可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP，用户可在 AI 应用中的「AI...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...MiniCPM的性能也能做到基本无损耗。在性能上，MiniCPM-2B的中文知识能力、代码能力、数学能力已经超过Mistral-7B，而英文知识能力、逻辑能力和常识问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上，MiniCPM...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

机器之心报道机器之心编辑部近日，云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据