• 我的订阅
  • 科技

厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?

类别:科技 发布时间:2024-08-30 08:36:00 来源:厦门日报

厦大纪荣嵘教授团队自主研发的思源大模型“霸榜”权威榜单,团队技术已服务数百家政企机构和上亿用户

国产大模型“优等生”是怎样炼成的?

厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?

纪荣嵘教授(右二)指导学生开展科研活动。(受访者 供图)

厦门网讯(厦门日报记者 林露虹 见习记者 钟艾)多份大模型领域的权威榜单,让低调的厦门产大模型——思源大模型浮出水面。

去年以来,厦门大学自主研发的思源大模型频频在大模型比拼中胜出,跻身权威榜单榜首,如在科技部主导的“智源FlagEval”7B模型榜单客观能力评测中排名第一(2024年1月);在腾讯多模态大模型榜单中排名第一(2023年11月)。

事实上,在过去十年里,许多AI头部企业的主打产品都有思源大模型团队的技术加持。目前,思源大模型团队已与华为、腾讯等建立了深度合作,多个技术产品广泛应用于智慧安防、边缘计算、社交媒体等领域,服务了数百家政企机构和上亿用户。

回到思源大模型本身,它是如何在竞争激烈的大模型赛道上跑出领先身位?又将如何服务厦门本土企业,赋能千行百业?

近日,记者采访了思源大模型研发团队负责人——厦门大学南强特聘教授、多媒体可信感知与高效计算教育部重点实验室主任纪荣嵘,揭秘国产大模型“优等生”背后的故事。

前瞻布局抢先机

“早在ChatGPT-3发布前,我们就着手AI大模型的研究。”2022年年底,ChatGPT-3的横空出世,引发人们对AI大模型的关注。而在此之前,纪荣嵘已带领团队投身大模型研究工作。这位人工智能领域的知名学者,深感自主研发大模型的重要性和紧迫性,“大模型之战很大程度上决定谁将在人工智能技术领域占据主导地位,中国必须要开发自己的基础大模型。”

2023年年初,由纪荣嵘牵头承担的“紧致化多模态大模型构建关键技术研究”入选科技部科技创新2030-“新一代人工智能”重大项目。一同入选的还有清华大学、浙江大学、中国科学院自动化所等7家单位。

纪荣嵘说,团队的初心很明确,要做自主可控、拥有全国产化知识产权的基础大模型,力争实现“从0到1”的突破。他为大模型取名“思源”,“这个名字取自厦门大学的‘思源谷’,一是代表大模型的厦大‘血统’,二则寓意思想的源头。”

打一开始,纪荣嵘团队就坚持高起点、高站位,以“紧致化多模态”为目标开发大模型——这一理念在现在看来依然极具前瞻性。

什么是紧致化多模态?用大白话说,思源大模型是个“多才多艺”的大模型,它不仅能理解文本,还擅长处理图像、音频等不同类型的数据。而对于大模型的使用者而言,无需专门购买高大上的设备,可以通过轻量化、本地化部署,轻松上手。

稳扎稳打十年磨一剑

思源大模型是怎么训练出来的?纪荣嵘说,训练大模型有点像教一个孩子学习和理解语言。首先是预训练环节,通过学习海量的文本来积累知识。思源大模型的预训练的语料达1万亿token,也就是说,它阅读并记住了1万亿字的信息。对于一个普通人而言,一辈子不断阅读,所积累的阅读量也仅有3亿—5亿字。大模型的预训练语料基本覆盖了人类能够获取的大部分知识。

光记忆还不够,还得会用。纪荣嵘教授团队收集了2500万条开源领域的高质量垂直数据,通过一问一答的形式,对思源大模型持续训练,激发其所学习到的知识能力,直到其达到令人满意的技能水平。

与此同时,大模型每一次“思考”和“回答”,都离不开大量算力的支撑。在这一关键基础设施上,纪荣嵘教授团队早有准备——2022年年底,在教育部的支持下,实验室建设了价值不菲的超算中心。

在纪荣嵘看来,科研从来都不是一蹴而就的事。过去十年间,他带领的厦门大学多媒体可信感知与高效计算教育部重点实验室,结合人工智能发展趋势和东南沿海地区的重大需求,开展了多空间感知、跨空间可信传输与计算、人工智能可信高效平台等方面的基础理论与应用研究,累计承担二十多项国家级科研重大项目,已获授权、申请的专利近300项。也正是十年如一日的稳扎稳打,成就了思源大模型今日的累累硕果。

【对话】

扎根行业 扎根厦门

为中小企业创新发展赋能

记者:在您看来,思源大模型的优势主要在哪里?如何在大模型之战中“突围”?

纪荣嵘:现在有所谓“千模大战”的说法,但我反对这个说法,如果按“从0到1”全自主研发的标准来评判,真正能做大模型的企业数量其实并不多,所以从这个角度来说,我们要警惕对大模型的“过度宣传”。

大模型真正的落地使用,需要渗透到垂直领域中。对于厦门来说,发展人工智能产业,需要选好垂直赛道,做完全自主可控的 AI大模型。而这恰恰是思源大模型在应用层面上的特色,我们概括为“扎根行业,扎根厦门,面向专业需求,做全自主知识产权”。再者,我们厦门大学建设了超算中心,如果没有这个超算中心,大模型就无从谈起,所以硬件设施上来说我们的优势也很明显。

记者:您刚也提到思源大模型在应用方面的特色,可否围绕一个例子具体展开?

纪荣嵘:典型的像我们在智慧政务便民服务上的应用,比如政务窗口。我们正通过思源大模型赋能智慧政务的办理流程。它本身具有很强的交互能力,能听得懂普通话甚至方言,可以作为AI助手,为市民提供业务咨询服务,比如指导市民如何填表格,并帮助审核表格,看哪里填得不对,哪里有信息缺漏等。

思源大模型是多模态的,它可以胜任许多工作,包括处理专业文献、画作赏析、提取票务信息、编写代码等。未来人工智能将重塑很多行业,这必将带来许多需求,我们的思源大模型都可以发挥自身优势提供相应的服务。

记者:作为厦门本土大模型代表,“思源”将如何发挥自身优势,为厦门产业发展贡献力量?

纪荣嵘:与许多AI技术一样,大模型落地的“最后一公里”常受限于价格因素,而思源大模型有一个突出的特色在于,我们的边端计算是部署在低成本的服务器上,价格足够低。由于我们对大模型的结构做了大量优化,在保持功能不变或者基本不变的情况下把大模型的价格“打下来”。同时,我们做了大量边缘端的补充,只要一个键盘、一台显示器、一张卡就可以使用大模型。

关于思源大模型具体如何服务厦门本土企业,我们与政府部门做了许多探讨,大概有以下几个方向,一是推动思源大模型面向厦门企业开放,使企业可以用近乎免费的成本来使用大模型;二是把AI技术服务作为厦门的一张名片,增添厦门招商引资的吸引力;三是助力厦门构建人工智能创业孵化生态圈,通过大模型来服务、孵化创业企业。

厦门的软件和信息服务产业绝大多数都是中小企业,长尾效应明显,所以我们期待发挥优势为中小企业创新赋能。我们也相信在人工智能时代,以大模型为代表的AI技术将成为产业链、创新链中最核心的环节。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-30 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

新闻分析|上榜“优等生”强在哪?
...一。一批代表性企业在关键领域取得突破。唐山百川智能自主研发多款智能检修机器人,累计填补234项国内空白;石药控股借助AI技术将新药早期发现时间缩短超30%,早筛整体研发成功率
2025-11-14 07:52:00
...组成一辆完整汽车形态的塑料配件,原材料均由这家公司自主研发生产。“今年1到2月,我们的订单量较去年同期增长了20%以上,预计整个第一季度将保持同样的增长趋势。”浙江普利特新材
2024-03-26 07:04:00
全彩优等生爱普生EF-15投影机 用松弛感唤醒多巴胺
...是爱普生投影机的优势。爱普生EF-15投影机应用了爱普生自主研发的五大核心科技之一——3LCD显示技术。它可以保证色彩亮度=白色亮度,使投影画面能够呈现更加清透明亮的色彩,保
2023-09-20 18:01:00
聚“新”、聚“变”、聚“质” “优等生”的“进阶密码”
...者一线行”系列报道聚“新”、聚“变”、聚“质” “优等生”的“进阶密码”智能制造赋能千禾味业高质量发展。工人们正在装运企业生产的调味品。智能化生产车间。 一排排酱油发酵罐矗
2024-03-30 06:59:00
...”为业内人士所熟知的是,吉利德一直是病毒学领域的“优等生”。其在HIV、丙肝、乙肝等领域曾推出了多个开创性的药物:譬如全球首个HIV完整治疗方案的复方单片制剂,让感染者从每天
2023-06-06 07:37:00
36氪合伙人、副总裁李政:中国产业的未来在哪?| 2025年36氪产业未来大会
...长”存在路径依赖:一年融资一次是常态,一年两次是“优等生”,估值年翻倍是“标配”;如今创业者与投资者心态更趋理性,认可“20%-30%的年化增长、50%已属优秀”的稳健发展模
2025-09-16 01:03:00
强制披露落地首年,“科创板ESG优等生”名单出炉
...绿色治理、透明度、社会责任等方面具备示范效应的“ESG优等生”,为更多科创企业树立可对标、可借鉴的ESG实践范式,助力资本市场迈向更加可持续、负责任的发展路径。(科创板日报记
2025-07-26 00:45:00
生态优等生的“蓝碳”实践
本文转自:福建日报生态优等生的“蓝碳”实践——福建海洋碳汇发展观察龙海县红树林自然保护区位于漳州市龙海区的浮宫、紫泥、角美、港尾四个乡镇的河口海岸。下潭尾滨海湿地公园是我省最大人
2023-02-28 06:45:00
选拔水稻“优等生”
本文转自:三亚日报稻可稻 非常稻选拔水稻“优等生”听说今天亮相水稻班的“优等生”很多,要认真评选。今天要来好多位老师进行选拔,你们都别跟我争啊。 不错!它们都非常优秀,登记一下
2024-05-06 04:56:00
更多关于科技的资讯:
在全球制造业向高端化、智能化转型的浪潮中,激光技术作为核心支撑力量,正重塑产业发展格局。武汉华工激光工程有限责任公司(以下简称 “华工激光”)作为中国激光工业化应用的开创者与引领者
2026-02-06 15:27:00
国家超算互联网核心节点上线试运行,托举中国AI算力应用关键一跃!
2月5日,国家超算互联网应用技术大会暨核心节点上线试运行仪式在郑州隆重举行。发改委、科技部、工信部、国家数据局、国家自然科学基金委等单位莅临现场
2026-02-06 15:28:00
河北交投禄发集团徐水服务区升级改造换新颜 顾客出行体验再提升
视频摄制:周明哲河北新闻网讯(牟岚)2月4日,位于京港澳高速公路京石段121公里处的河北交投禄发集团所属徐水服务区升级改造后重新亮相
2026-02-06 15:29:00
随着银发经济从基础保障型供给向精神文化型消费升级,银发文教正在成为银发产业中最具潜力的细分赛道。与早期的兴趣培训不同,如今的银发文教已经覆盖文化素养
2026-02-06 15:39:00
近日,倍轻松推出的“早睡娃娃”系列以现象级热度席卷社交网络,成为年货消费市场的一抹亮色。1月23日至25日,全国巡展首站在深圳KKONE购物中心启动
2026-02-06 15:47:00
毛绒玩具产业是雄安新区容城县的特色优势产业。马年春节将至,位于容城县的中国(雄安新区)玩具总部基地内,上百款马年毛绒玩具扎堆上新
2026-02-06 13:57:00
“墨子号”卫星后里程碑式成果!中国科大首次在国际上构建出可扩展量子中继模块
大皖新闻讯 “这是‘墨子号’量子卫星之后又一里程碑式成果。”相关人员如此表示。2月6日,记者从中国科学技术大学了解到
2026-02-06 12:03:00
京东年货消费观察:AI玩具、家政服务、宠物年服跻身“新年货” 情绪价值成为年货新要素
退休的李阿姨购物车里堆满了坚果礼盒、糕点礼盒;80后的小晨选购了寓意“马上有福”的生肖挂饰,并给老家添置了智能电器;一位年轻的95后母亲则为孩子精心挑选了红色“新年战袍”……腊八过后
2026-02-06 11:07:00
2026钉峰会走进长沙,为企业打开通往AI时代大门
1月29日,“AI时代的工作方式”2026钉峰会走进长沙。当地近200位企业代表、行业专家齐聚一堂,探讨AI时代企业数字化转型机遇
2026-02-06 11:08:00
中新经纬2月5日电 据韩联社报道,韩国电商平台酷澎(Coupang)5日表示,在去年11月确认的用户个人信息外泄事件中
2026-02-06 08:19:00
春节AI大战杀疯了!2月6日一早,千问APP“春节30亿大免单”正式上线,发动奶茶攻势,邀请全国人民用AI一句话免费点奶茶
2026-02-06 08:35:00
以AI之名 勇立潮头
2月1日,在法国首都巴黎的香榭丽舍大街,由宇树科技及其法国代理INNOV8集团提供的机器人参加巡游活动。 新华社记者 张百慧 摄宇树科技的机器人在新疆阿勒泰-47
2026-02-06 08:38:00
“国际奥委会基于阿里巴巴千问大模型,打造了奥运史上首个官方大模型。”2026年米兰—科尔蒂纳丹佩佐冬奥会开幕在即,当地时间2月4日
2026-02-06 08:39:00
这颗以中国人姓氏命名的彗星,发现者是来自浙江的他
如果天空中有一颗彗星,以你的姓氏命名,是种什么体验?来自浙江乐清的天文爱好者孙国佑,刚刚体验了这份专属浪漫。近日,国际天文学联合会小行星中心发布公告
2026-02-06 08:39:00
厦门网讯 (厦门日报记者 李晓平)昨日,“2025胡润中国500强”发布,聚焦中国最具价值非国有企业。该榜单显示,总部位于厦门的7家企业入围
2026-02-06 08:40:00