• 我的订阅
  • 科技

Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首

类别:科技 发布时间:2023-08-09 09:55:00 来源:36氪

36氪获悉,哈尔滨工业大学(深圳)计算与智能研究院团队,依托学校的哈深资产经营有限公司进行成果转化,成立了多模态大模型研发企业--深圳若愚科技有限公司(以下简称“若愚科技”)。

若愚科技旗下首款多模态大模型“若愚-九天”首次参评即登顶OpenCompass多模态大模型榜单。

Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首

多模态大模型MMBench test榜单

01 “若愚-九天”

“123亿参数”、“1亿2千万图文对”、“550万条中英双语种语料样本”、“120万微调数据样本”、“50万条强化数据样本”……核心参数的提升带来的是模型能力的质变,若愚-九天多模态大模型在逻辑推理、关系推理和感知能力等方面均取得令人瞩目的表现。

凭借超百亿参数,若愚-九天实现了文本、图像、音频和视频的多模态融合。其智能理解和响应能力,不仅涵盖了自然语言处理、计算机视觉和语音识别等领域,更有效地打破了各模态间的信息壁垒,使它们在“九天”中融为一体。

Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首

多模态大模型MMBench dev榜单

“九天寓意着中国古代神话中的最高天界,象征着我们对技术进步的无限追求和对智能未来的向往。这款模型以其强大的理解和响应能力,跨越了文本、图像、音频和视频等多种模式的界限,实现了真正的多模态融合。”若愚科技CEO孙腾博士向36氪介绍介绍:“从一个无序的、分散的信息世界中找到连接各个领域的桥梁,将自然语言处理、计算机视觉和语音识别等各个领域的信息融为一体,打破了模态间的信息孤岛,真正实现了信息的有序流动和互通。”

02 组建大模型顶尖团队

哈工大深圳校区成立了资产股份有限公司,鼓励教职员工成果转化与落地。哈工大(深圳)在产学研落地有政策支持,若愚科技成立之初学校就作为初创股东参与进来,为公司的发展提供坚强的支撑。

近期,“人工智能领域著名杂志IEEE Intelligent Systems公布了2022年度「人工智能十大新星」(AI's 10 to Watch)名单,聂礼强教授因在多模态领域的贡献,位列其中。聂教授是达摩院青橙奖获得者,TR35中国获得者。他表示:哈工大(深圳)在人工智能领域的成果不能仅存在于实验室中,要成果转化,服务国防航天,服务社会。

若愚科技另一位人工智能技术大牛是联合创始人张民教授。张教授是哈工大(深圳)特聘校长助理,国内NLP方向首位杰青,国家“百千万人才”,国家有突出贡献中青年专家,享受国务院特殊津贴。哈工大在计算机科学权威榜单CSRankings(2022-2023)NLP方向中国研究机构中排名第一,张老师是哈工大在此方向贡献度最大的人员。

CSRankings NLP方向 中国大陆地区机构中哈工大排名第一

Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首

张民老师学术贡献榜单中排名第一

若愚科技联合创始人兼CEO孙腾博士也是公司研发团队的核心专家,孙博士的研究方向一直聚焦多媒体计算,相关成果发表在CCF A类会议和IEEE/ACM Trans,孙博士此前有成功的创业经验,针对人工智能技术在垂直领域落地应用具有全流程经验和公司管理经验。若愚科技另一位联合创始人耿琛担任公司的战略顾问,其多次获评新财富最佳科技分析师,并在多年的研究生涯中积累了丰富的产业资源,负责公司投融资和产业资源对接落地。

03 若愚科技的核心能力

“若愚科技在这个时间点成立,是有其历史使命和理想的,作为前沿研发人员,我们能深刻感受到人工智能对未来社会的变革,生成式人工智能带来的生产力爆发将重新定义各行各业的生产关系,有机会参与其中是我们的荣幸和使命。”

算力、数据和人才,是大模型入局的三大门槛,若愚科技在创立之处就集齐了这些核心要素。领军人才培养的内生研发团队已形成自主迭代能力,未来“若愚-九天”将在技术大牛的带领下持续迭代。

凭借顶级创业团队、自研多模态大模型的核心能力,以及成功的落地经验,若愚科技表示:将为“百模大战”带来一抹异彩。

以“若愚”命名公司体现了若愚科技对创新和人工智能“大智若愚”的态度。若愚科技认为,真正的智慧往往来自于对知识的深度理解和对世界的真诚好奇,而若愚的使命就是通过新一代人工智能技术,帮助人们更好地理解和应对复杂的世界,在未来人工智能的辅助下,人类可以更好地理解、探索和创造。

04 打造通用AI大模型基座

以大模型能力为基座,重塑每个赛道,已经成为行业共识。根据OpenAI的发展道路,模型大到一定程度时,会涌现新的能力,尤其是会迸发出一些从未见到过的能力。

若愚-九天未来也将不断迭代,孙腾博士表示:“若愚-九天”还在向更大和更小两个相反的方向迭代,一方面在加大参数量级,探索支持通用多模态大模型涌现的节点;另一方面为满足行业用户的应用需求,用最小的算力实现最大的效果,势必要做的就是大模型的轻量化压缩,最后和边缘计算设备相结合。”

基于“若愚-九天”的多模态大模型基座,若愚的商业模式与AI 1.0时代有本质区别。过去的商业模型要针对每一个需求重新研发算法,是完全的项目制。“若愚-九天”作为统一的多模态大模型基础,不需要重新设计基座,只需要根据行业的不同数据进行微调,就可以得到对应行业模型,客户甚至可以根据细分领域的需求,自己用数据做二次微调。

多模态大模型的难点在于多模态信息融合,常见的融合方法包括线性叠加、级联等相对粗暴的手段,但最终的效果往往还不如单一模态表现出色。这是因为一些技术团队缺乏对多模态数据调教、多模态特征融合与对齐的经验和能力。

若愚-九天具有自主研发的多模态特征提取、对齐、融合、推理的全链条模型训练框架与全面细致的多模态数据收集清洗流程。该模型登顶多模态大模型榜单证明了此团队在多模态大模型方面领先的实力。

机器人是工业领域系统级应用产品,是“若愚-九天”多模态大模型基座赋能的重点落地方向。哈工大目前在机器人领域有着深厚的产学研积累,未来具身机器人更需要语音、视觉、决策、控制等多模态信息融合形成闭环。“若愚-九天”多模态大模型基座将在哈工大机器人研究积累上进行进一步的研究融合,目前已和多家大型消费电子/汽车领域上市公司展开深度合作。

以“若愚-九天”多模态大模型基座,若愚科技有能力通过现有多模态大模型基座进行微调为不同领域的用户提供个性化、定制化服务,提供语言预训练大模型、多模态预训练大模型、垂直领域预训练大模型等能力,着手于建设未来AI通用型平台和基础设施。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-09 11:45:36

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研
2024-03-21 05:19:00
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、
2023-12-26 09:36:00
哈工大(深圳)成功举办第八届全国青年人工智能创新创业大会
...域的广泛应用,着重讲解了点云配准的难点和多视角、多模态情景下的处理方法,并提出了将演化计算应用于点云配准的创新性解决方案。武越老师进行报告分享17日下午,本次大会正式进入各团
2023-12-20 16:02:00
AI潮起 共筑数智之基
...大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数
2024-05-25 07:21:00
2月十大牛股出炉:克来机电超207%涨幅问鼎榜首
...。维海德在回复深交所关注函中表示,公司自主研发的多模态白平衡算法,并非是当前市场关注的与OpenAI相关的多模态AI大模型,多模态白平衡算法与多模态AI大模型存在本质区别。资
2024-03-02 19:59:00
云知声荣登甲子光年榜单,彰显AI大模型商业潜力
...现出色,行业领先。2024年8月,云知声正式推出了山海多模态大模型,该模型通过整合跨模态信息,能够接收文本、音频、图像等多种形式的输入,并实时生成文本、音频和图像的任意组合输
2024-12-13 16:22:00
工业新篇,智能领航——中国移动九天·工业行业大模型正式发布
...是面向工业安全生产监测场景打造的智能体应用,通过多模态大模型,实现安监场景的高泛化理解,现已覆盖超50大类的工业安监场景,提升企业安全监管效率,为工业安全生产保驾护航。AI+
2024-06-11 17:16:00
赋能高质量发展,江苏移动竞逐大模型赛道
...、视觉、文本等方面能力,可为不同行业针对性提供所需模态能力。在今年10月举办的2024中国移动全球合作伙伴大会上,中国移动发布九天善智多模态基座大模型,并推出了30款自研行业
2024-12-04 15:13:00
...台AI定制内容平台:根据企业的个性化需求,批量生成多模态、高质量、富有吸引力的定制化内容,有效提升企业在市场中的品牌形象与传播效果,如有效助力某家电品牌咨询量增长350%。-
2025-08-01 18:40:00
更多关于科技的资讯:
智推时代:用GEO打造品牌增长新引擎
在生成式AI重塑流量格局的当下,如何将前沿技术转化为可持续的商业增长,已成为品牌面临的核心挑战。智推时代精准切入这一赛道
2025-11-07 08:03:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》指出,截至2025年6月,国内生成式引擎月活用户已突破8
2025-11-07 08:05:00
一、旅游出行安全保险尚无权威排名,选择需聚焦三大核心指标目前旅游出行安全保险市场不存在公认的统一排名标准,产品选择应重点考察保险公司服务能力(偿付能力充足率
2025-11-07 08:06:00
当生成式AI技术以迅猛势头重构搜索生态时,如何为企业精准挑选高度契合需求的GEO(生成式引擎优化)服务供应商,已成为抢占下一代流量入口的核心战略动作
2025-11-07 08:06:00
科学实力获市场验证:任我行液体钙获全球销量第一认证
2025年11月初,德国Moms Garden任我行旗下成人液体钙产品确认获得尚普咨询集团授予的“成人液体钙全球销量第一”与“骨骼健康领导品牌”双重市场地位认证证书
2025-11-07 08:07:00
磷虾油产品对比 磷虾油品牌深度测评与科学选购指南
近年来随着健康意识的不断提升,富含Omega-3、磷脂和虾青素的磷虾油逐渐成为大众关注的营养补充剂。然而在市场快速扩张的背后
2025-11-07 08:07:00
道路“会思考” 出行更美好!数字道路建设赋能未来之城
数字道路建设赋能未来之城道路“会思考” 出行更美好雄安新区的街道上,看似普通的路灯杆集合了多种智能设备,成为智慧交通的“眼睛”
2025-11-07 08:20:00
今年9月27日,雄安图书馆正式向公众开放。一个多月来,已迎来访客20余万人次。这座形如书卷徐徐展开的建筑,不仅是新区一座崭新的文化地标
2025-11-07 08:20:00
关注进博会丨河北再赴进博之约(二):把全球好物装进“购物车”
把全球好物装进“购物车”——河北再赴进博之约(二)11月6日,在第八届中国国际进口博览会河北省主题展区,河北参展商正在进行路演活动
2025-11-07 08:21:00
南报网讯(通讯员王亚洲朱丽纯记者王婷婷)日前,“智云经开”品牌发布暨创新中心签约仪式在兴智科技园举行。南京经开区与省数据局
2025-11-07 08:23:00
今年以来,肥乡联社在省联社及邯郸审计中心的精准指导下,锚定代理保险业务作为中间业务增长的核心抓手,深挖县域保险市场潜力
2025-11-07 10:22:00
为全面提升金融服务安全性,切实保障广大客户的资金与信息安全,近期,行唐联社市仝信用社积极行动,开展了一系列网络安全宣传与防护活动
2025-11-07 10:24:00
产业规模超百亿!崂山区:全力打造海洋生物医药产业高地
鲁网11月7日讯11月5日下午,“产业链上的崂山好品牌”现场媒体见面会第3场—海洋生物医药产业链专场活动在青岛琛蓝健康产业园举行
2025-11-07 10:27:00
曾经,面对琳琅满目的药品,不少消费者心中都存有一丝疑虑:这盒药来自哪里?是否经过严格检验?是不是正规厂家生产?这种对药品“身份”的不确定
2025-11-07 11:02:00
吉林“智”造打破季节壁垒 室内滑雪模拟机让滑雪更有趣
初冬伊始,滑雪便如约成为大众热议的休闲选择。面对季节限制、初学畏惧等问题,难免让“雪上飞驰”的快乐打了折扣。源自吉林的“黑科技”正打破这些壁垒
2025-11-07 11:09:00