• 我的订阅
  • 头条热搜
中文大模型最新评测出炉:腾讯混元国内第一!
...,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态理解要求模型能够...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...评测结果显示,OpenAI Sora、Runway、爱诗科技PixVerse、Pika、腾讯VideoCrafter-V2位列前五。 文生图模型的客观评测指标与主观感受差异巨大,有失效的迹象,因此排名以主观评测为准;Mdjourney基本无法理解中文提示词,因此排名靠后...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...型和多模态大模型超过150个,已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一,总排名第二,GLM-4尤为值得关注。今年一月,智谱AI在2024年度技术...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。虽然这次都还是被GPT-4o压……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...,负责前沿技术的研究。9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。今天,天工Skywork-13B系列大模型的开...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...实验更高效、更便宜,即使它有炉灶那么大。)对大多数中文母语者而言,这个任务应该不难,相信大家不需要几秒钟就可以得到答案。但想从露出的部分文字推断完整文字仍然需要十分复杂的推理过程:当代神经科学研究表明...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-4V在奋力追平GPT-4V的同时,LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力,其在中文多模态场景下表现优异,使得用户不必学习复杂的“prompt”便可以轻松上手,这对于执行“...……更多
云从科技从容大模型荣登中国大模型第一梯队
...取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分70.35分的优异成绩稳居国内大模型综合测评第六位,正式步入国内...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达...……更多
...国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。当下,“百模大战”厮杀正酣,各类榜单也层出不穷,其中国际开放研究组...……更多
BAT等互联网大厂,如何入局人形机器人?
...退出机器人方向。阿里达摩院裁撤机器人部门并入菜鸟,腾讯RobticsX机器人实验室找不到太好的产品落地渠道,一号员工离开自主创业,小米的人形机器人迭代速度放缓。在人形机器人的风口再一次起来后,面对前景广阔的人形...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...任单位由中国信通院牵头,副主任单位包括vivo、百度、腾讯、360、华为、中国移动、阿里、浙江大学以及蚂蚁集团。专家委负责对AIIA安全治理委员会的总体工作进行把关,两个工作组及伙伴计划则负责开展AI相关研究,推动产...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...MiniCPM的性能也能做到基本无损耗。在性能上,MiniCPM-2B的中文知识能力、代码能力、数学能力已经超过Mistral-7B,而英文知识能力、逻辑能力和常识问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上,MiniCPM...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
不要小看「实而不华」的腾讯 AI
「早早开始拿 AI 赚钱的腾讯,是怎么做AI的?」作者 | 连冉编辑| 郑玄上周 AI 领域最热闹的莫过于大洋彼岸 OpenAI 与谷歌的「掐架」,前者前脚刚发新一代旗舰模型 GPT-4o,把语音助手带到了新高度,后者就也在提到 121 次 AI 的...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...大模型标准符合性评测”结果公布,首批360集团、百度、腾讯、阿里四家企业大模型产品通过。该测试由工信部中国电子技术标准化研究院(简称“工信部电子标准院”)发起,评测围绕多领域多维度模型评测框架与指标体系,...……更多
腾讯自研大模型助力长三角打造世界级产业集群
东方网5月24日消息:5月24日,腾讯作为科技企业代表,受邀参加《深入推进长三角G60科创走廊科创生态建设大会》。现场,腾讯集团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础...……更多
...十余款人工智能大模型全部面向公众开放服务。另外包括腾讯在内的一些公司的大模型也通过备案,将择机面向公众开放。人工智能大模型是指使用大规模数据和强大的计算能力训练出来的“大参数”模型,这些模型通常具有高...……更多
百川智能发布baichuan3稳定语言模型
...U、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan3在自然语言处理和代码生成领域的强大实力。不仅如此,其在对...……更多
腾讯云公布多项大模型产品进展
本文转自:人民日报客户端施芳腾讯云生成式AI产业应用峰会日前在北京召开,公布大模型研发、应用产品的系列进展。以“产业实用”作为发展大模型的核心战略,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示...……更多
...较自研模型与GPT-4 等海外模型时,会强调自己的模型更懂中文。记者就在现场测试了商汤“商量”大语言模型的中文理解能力。根据现场工作人员提示,记者“调取”了资料库里《道德经》《论语》《易经》这三本古籍的文档,...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...模型产品安全测试A级。此外,积极探索对主流开源模型的中文能力提升和安全合规性改造,研发并开源了全球首个Llama3 8B中文版模型。这一系列成果充分展现了中国联通在人工智能尤其是大模型领域积极布局取得的成绩。在打造生...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...性能表现。研究团队发现大多数模型在英语上的准确度比中文要高,这种差距在排名靠前的模型中尤为显著。推测可能有以下几个原因: 尽管这些模型包含了大量中文训练数据并且具有跨语言泛化能力,但它们的训练数据主要...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...段子手孵化地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是还有更多宝藏数据资源值得深挖?近日,由中科院深圳先进技术研究院、中科院自动化研究...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型再次升级,并...……更多
OpenAI“断供”,谁才是最大赢家
...:“国内大模型能力已经有接替上的实力。”此背景下,腾讯、百度、阿里巴巴等互联网巨头第一时间动了起来,推出迁移服务,欢迎OpenAI用户“搬家”到自家大模型。譬如,腾讯云宣布,2024年6月25日至2024年7月31日,将为新迁...……更多
更多关于科技的资讯:
雷军回应小米SU7 Ultra车标是金的:花80万买车 满足下虚荣感不过分
快科技2月6日消息,近日,有网友发现,小米SU7 Ultra量产版的车标变成了碳纤维+金色,对此雷军表示,车标是金的,随后引发网友热议
2025-02-06 12:43:00
河南老板拿170万的玛莎拉蒂当套圈奖品 有人半小时花300元
快科技2月6日消息,日前,“河南商丘一老板用170万元的玛莎拉蒂当套圈奖品”的话题,引起网友关注。网友发布的视频中,一处套圈摊位中间摆放了一台玛莎拉蒂总裁
2025-02-06 12:43:00
GaaS陷入低潮 大锤创始人遭辞退
潜水教练出身的迈克尔·康德雷(Michael Condrey,图左)以EA Visceral工作室首席运营官身份与格伦·斯科菲尔德(Glen Schofield
2025-02-06 12:43:00
奔驰:30年前我们发布了ESP 彻底改写了汽车安全史
快科技2月6日消息,梅赛德斯-奔驰今日发文纪念ESP(电控车辆稳定行驶系统)全球首次亮相30周年。1995年2月6日,奔驰与博世合作研发的ESP在第7代S级车(W140系列)上首次应用
2025-02-06 13:43:00
《哪吒2》成中国影史票房新冠军 手办爆火售罄 泡泡玛特回应
快科技2月6日消息,今日,电影《哪吒之魔童闹海》总票房(含点映及预售)超越《长津湖》,位列中国电影票房总榜榜首,影片也带火了盲盒手办的销售
2025-02-06 13:43:00
油车最后一口气要断了!李书福:发展绿色甲醇是全球能源大势所趋
快科技2月6日消息,据媒体报道,今日,吉利控股集团董事长李书福受邀出席中国石化战略研讨会,并发表了主题为《跨越油气时代
2025-02-06 13:43:00
RTX 5080/5090系列显卡玩《绝地求生》崩溃!开发商:建议安装英伟达最新驱动
快科技2月6日消息,日前,《绝地求生》贴吧有网友反馈,称使用RTX 5090D显卡玩“吃鸡”崩溃,重新下载、重装系统都没有解决问题
2025-02-06 14:13:00
华为手机回归全球:2月18马来西亚发新品 上来就是三折Mate XT
快科技2月6日消息,在中国市场站稳后,华为手机开始重回全球,官方已宣布2月18日将马来西亚吉隆坡举行产品发布会。从口号中的“extraordinary(非凡)”“ultimate”等字样来看
2025-02-06 14:13:00
一家人高速上停车在后备箱支摊做饭 孩子饿没办法:罚款200元扣9分
2月6日消息,居国内媒体报道称,一家4口高速路上停车支摊做饭的行为,引来了网友的吐槽,不顾自己安全就算了,也不考虑别人吗
2025-02-06 14:13:00
向Ultra看齐!曝华为Pura 80 Pro升级1英寸主摄
快科技2月6日消息,博主数码闲聊站爆料了华为Pura 80系列的参数细节,该系列的Ultra版本独家首发国产1英寸主摄
2025-02-06 14:13:00
收购铃空游戏股权并推出$SHOWA代币,Oneness想用Web3重塑《昭和米国物语》的价值
‍‍文 | 刘士武 自《黑神话:悟空》引爆2024年中国主机游戏市场后,部分在研游戏大作也纷纷走到了台前。其中,由中国厂商铃空游戏开发的开放世界冒险游戏《昭和米国物语》便是最受期待的作品之一
2025-02-06 14:30:00
苍老师还记得吗!苍井空问候国人春节过得好吗 网友喊话快换苹果华为最新款
快科技2月6日消息,农历春节都基本过完了,“德艺双馨”的苍井空老师也更新了自己的微博,询问国内粉丝春节过的如何。苍井空在微博上喊话
2025-02-06 14:43:00
没有“5年分期0利息”:都跟不上车圈蛇年价格战
开年就开卷,今年车圈卷什么?新春开工第一天,车圈新一轮“价格战”正式打响,特斯拉率先推出优惠组合套餐,小鹏、智己等多家车企同日发布优惠政策
2025-02-06 14:43:00
奥之心重现经典,OM-3震撼登场!三镜齐发,锦上添花!
复古的经典设计和创意性的摄影表现能够激发情感共鸣无反相机“OMSYSTEMOM-3”正式发布配备“色彩/单色配置控制”功能
2025-02-06 14:45:00
微步获评国家网络威胁信息汇聚共享技术平台“突出贡献支撑单位”
近日,国家网络威胁信息汇聚共享技术平台(CNTISP)试运行总结表彰会在中国信息安全测评中心成功举办,对2024年度为平台试运行工作发挥重要作用的单位和个人进行了表彰和现场颁奖
2025-02-06 14:49:00