• 我的订阅
  • 科技

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

类别:科技 发布时间:2023-12-22 19:48:00 来源:36氪

文|王怡宁

编辑|邓咏仪

12月初,法国AI初创公司Mistral AI已正式结束其备受期待的A轮融资。据彭博社报道,公司已筹集了3.85亿欧元(约4.15亿美元),该公司的估值约为20亿美元。Mistral AI今天也开放了其商业平台。

12月8日,Mistral AI的官方Twitter发布了他们账号开通以来的第三条推文,没有热闹盛大的发布会,也没有让人眼前一亮的宣传视频,仅仅是一条普通到不能再普通的磁力链接,就打破了AI开发者圈的平静。

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Twitter

这条下载链接通向的正是近期震动AI圈的开源MoE模型——Mixtral8x7B。

从名字来看,Mixtral8x7B就揭示了其架构:由8个70亿参数组成的小模型组合,这也被称为MoE(Mixture of Experts,混合专家)架构——指把复杂任务分成一系列更小且更容易处理的子任务,每个子任务都由一个特定领域的“专家”负责处理。MoE架构让整体模型更多功能且强大。同样这也是GPT-4采用的架构。

从官方公布的数据来看,Mixtral8x7B在基准测试中的表现十分出色,跑分全面超越GPT-3.5,更在多个跑分上超过了Llama2 70B,并且推理速度还是后者的6倍。

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Mistral AI

在生成同等质量的模型时,Mixtral8x7B的推理过程消耗的成本也明显低于Mistral AI,高能效优势显著。

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Mistral AI

此外,Mixtral8x7B还支持英语、法语、意大利语、德语和西班牙语五种语言,具备自然的编码能力。

开源、跑分优秀、高效……这一系列的优势叠加起来,让Mixtral8x7B有了赶超Chat-GPT的势头,这确实足以让人感到兴奋。

一位开发者在Mistral MoE的基础上做了微调,发布了dolphin-2.5-mixtral-8x7模型。这是一个完全未经审查的开源模型,这意味着它不会受开发者的道德观影响,也不会回复“作为一个AI助手,我不能……”

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Twitter

而随着Mixtral8x7B一起走入大众视野的,还有它的开发者—来自法国的大模型公司Mistral AI,从名不见经传到一举成名,他们仅仅用了半年。

“欧洲版OpenAI”,成立仅半年估值20亿美

彭博社报道,公司已筹集了3.85亿欧元(约4.15亿美元),该公司的估值约为20亿美元。

而仅仅在6个月前,Mistral AI才完成1.05亿欧元(约1.13亿美元)的天使轮融资——也是欧洲历史上最大的种子轮融资。Mistral AI仅仅用了7页PPT,就吸引了包括Redpoint、Index Ventures在内的一众欧洲老牌风投机构。事实上,这家颇受欧美两地明星投资机构青睐的AI独角兽公司,在今年5月才在法国巴黎正式成立。

尽管成立时间不长,Mistral AI的三人创始团队却相当有分量,在多模态、RAG方向上都有着丰富经验。公司CEO Arthur Mensch是前DeepMind研究科学家,主导了Chinchilla、Retro、Flamingo等重要论文的发表,而这三篇论文分别是20-22年间Google在LLM、RAG、多模态三个领域最重要的作品。

首席科学家Guillaume Lample,也是前Meta研究科学家,与CTO Timothee Lacroix,都来自Llama核心团队。目前,MistralAI的团队仅有22名员工,保持着小而美的风格。

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Mistral AI

不要大而全,强攻小模型

在大语言模型当道的今天,Mistral AI却反其道而行之,从成立之初就专注于研发「小模型」。联合创始人兼CEO Arthur在与硅谷投资人Sarah Guo和Elad Gil的专访中提到,让模型变小一定会有助于Agents的开发和应用,小模型能够有效降低使用成本,也能在更多设备上运行,从而让更多有意思的应用有机会被构建。

Mistral AI近期发布的聊天模型正是对这一理念的实践。

近期,Mistral AI刚刚发布了开放平台La plateforme,并提供了mistral-tiny、mistral-small和mistral-medium三个基于指令生成文本的聊天模型,以及一个嵌入模型。

其中,最受市场关注的还是目前仍在测试阶段的“中杯”模型Mistral-medium。作为Mistral AI推出的最强开源模型,Mistral-medium在MT-Bench得分高达8.6,在主流测评中各项指标已优于GPT-3.5。

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Mistral AI

Mistral AI另一个特别之处在于,对开源路线的坚定选择。

事实上,在2020年前,大部分大模型的研究成果都是共享和透明的,直到一些公司开始加速商业化,闭源模型才越来越广泛被使用。我们所熟知的OpenAI,最早就是作为一家开源的非盈利性组织创办的,而后才转为闭源公司,这也是曾经的投资者马斯克对其相当不满的点。

如今,除了Meta的LLaMA系列以外,目前大部分头部大模型厂商,如OpenAI、Google和微软都选择了闭源,但开源模型还是以能够快速迭代、可定制性的特点受到欢迎。这也是Mistral被称为“欧洲版OpenAI”的原因,在大公司纷纷闭源之际,也有人将Mistral AI称为开源路线的希望。

有趣的是,近日一张由ARK Invest团队制作的趋势图预测了2024年开源社区与专有模型在生成式AI上的发展。据其预测,开源模型的性能在不断提升,与专有模型之间的差距也将越来越小。对此,Meta首席AI科学家、图灵奖获得者Yann LeCun也转发表示:

开源人工智能模型正走在超越专有模型的路上。

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

△图源:Twitter

目前,Mixtral8×7B已经在不少开源模型平台上线,而开源究竟能否赶超闭源,仍需时间验证。

???????? 扫码加入「智涌AI交流群」????????

直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-22 21:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,潜在IPO的细节可能有变动。(界面)长城汽车全面进军欧洲:已开始研发中心选址从知情人士处获悉,长城汽车正计划全面进入欧洲市场,在德国和英国市场之后,长城汽车计划进一步扩展至
2023-11-27 20:15:00
法德正上演AI“吸金大战”,争夺“欧洲版OpenAI”
...出来的慧与(HPE)。Aleph Alpha成立于2019年,将自身定位为欧洲本地AI技术的领导者,相当于“德国自己的OpenAI”
2023-12-12 15:17:00
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来|钛媒体AGI
...如果生成式AI被进一步采用,耗电量可能会更多。3月13日欧洲议会通过《人工智能法案》欧洲议会3月13日以523票赞成、46票反对、49票弃权通过了具有里程碑意义的《人工智能法
2024-04-03 15:00:00
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...主,快速覆盖到了各个垂直行业。另外,苹果本周宣布在欧洲地区做出重大更新,允许第三方应用商店在iOS设备上运行,这是2008年以来苹果首次针对第三方下载问题做出让步。融资方面,
2024-01-29 09:34:00
AI掀起云计算融资热:2024年投资额将超5000亿,40%流向生成式AI创企
...算行业的增长。截至目前,2024年风险投资基金对美国、欧洲和以色列的云计算公司的投资比去年增长了27%,这是三年来的首次回升
2024-10-18 09:42:00
一周前瞻丨中国2月LPR报价将出炉;美联储、欧洲央行将公布最新货币政策会议纪要
...个大中城市住宅销售价格月度报告;海外方面,美联储、欧洲央行将公布最新货币政策会议纪要,美国、英国、欧元区等将披露2月PMI数据。本周沪深两市超700亿元市值限售股解禁。本周将
2024-02-19 10:48:00
欧洲用华为AI模型预报天气
...消息网8月14日报道据香港《南华早报》网站8月13日报道,欧洲一个政府间机构正在与中国一家科技巨头密切合作,将人工智能(AI)技术用于天气预报。报道称,近日,欧洲中期天气预报
2023-08-14 15:03:00
...。其中,米斯特拉尔人工智能公司估值近20亿欧元,成为欧洲人工智能领域的领军企业。去年12月,这家公司发布了“Mixtral 8x7B”模型,掌握法语、西班牙语、意大利语、英语
2024-02-07 07:35:00
极氪领克合体后首份成绩单:双品牌协同破局,“三驾马车”点燃资本想象空间
...牌着重拓展新兴市场,领克与极氪始终坚持向新向上,将欧洲、中东、东亚等地区的高端豪华市场作为扬帆的锚点。自创立以来,领克海外总出运量累计超8万辆,连续三年位列欧洲市场单车价格4
2025-03-05 20:17:00
更多关于科技的资讯:
以“兴趣”为引,开启银龄健康生活新方式:简橙太极如何助力科学养生、乐享晚年
在当今社会,随着健康老龄化的理念日益深入人心,越来越多的中老年人开始积极追求丰富多彩的退休生活和身心和谐的健康状态。这一趋势催生了对优质
2026-02-18 12:53:00
【网络中国节·春节】AI机器人带来新春消费新体验 带旺厦门文旅市场
AI机器人带来新春消费新体验厦门通过AI赋能打造新业态新场景,带旺假期文旅消费市场市民游客观看机器人咖啡师制作咖啡。(夏商咖啡供图)厦门网讯(厦门日报记者 沈彦彦 王元晖)厦门中山路“两岸数智非遗年”现场
2026-02-18 09:55:00
全力保交付 海辰储能厦门基地春节期间维持满负荷生产
位于同翔高新城的海辰储能厦门基地春节期间——满负荷生产 全力保交付春节期间,海辰储能满负荷生产。(厦门日报记者 卢剑豪 摄)厦门网讯(厦门日报记者 林露虹)大年初一
2026-02-18 10:26:00
成功捕获到约6500光年外的宇宙线信号网通院参研的LACT首台望远镜完成“首光”河北新闻网讯(河北日报记者王璐丹)近日
2026-02-18 07:58:00
2026年央视马年春晚,成为机器人扎堆亮相的“超级秀场”。而最牵动人心的,当属杭州宇树科技机器人与河南塔沟武术学校的小朋友同台呈现的节目《武BOT》
2026-02-18 07:04:00
2026年央视春晚演出现场,观众席间不少人佩戴的红围巾火了。微博上有网友实时提问:哪里能买到同款?这条名为“骐骥驰骋”的红围巾
2026-02-18 07:04:00
杭州智造“飞”上春晚 全球首次极寒载人飞行惊艳哈尔滨
图为央视春晚哈尔滨分会场彩排画面。除夕夜,央视春晚哈尔滨分会场以精彩的《冰雪暖世界》演出,带来了属于“冰城”的浪漫和温暖
2026-02-18 07:04:00
宇树春晚的表演,创下至少五个全球第一
网友热议“浙江黑科技” “太硬核了”“不愧是诞生‘六小龙’的地方”当虹科技8K超高清编码技术支持下,演员衣服上的刺绣纹理清晰可见
2026-02-18 07:34:00
豆包除夕AI互动19亿次 Seedance2.0为春晚提供技术支持
河北新闻网讯(记者 李春炜)2月16日,字节跳动旗下AI助手豆包与央视总台春晚联动,面向全国观众送出10万份科技好礼,并推出多项AI互动玩法
2026-02-17 20:35:00
中新经纬2月17日电 千问App数据显示,春节活动期间,全国超过1.3亿人第一次体验AI购物,说了50亿次“千问帮我”
2026-02-17 14:16:00
新春走基层|港口老司机“秀”新操作
2月16日,秦港股份九公司集控中心操作员曹宏璐在工作中。河北日报记者 张辉摄2月16日,农历除夕。下午2时30分许,随着“航旭鑫海”轮进入秦皇岛港902泊位
2026-02-17 08:53:00
1.3亿人春节首次体验AI购物,千问一跃成为国民级AI助手
2月17日大年初一凌晨,千问发布的数据显示,春节活动期间,全国超过1.3亿人第一次体验AI购物,说了50亿次“千问帮我”
2026-02-17 10:22:00
这一年,杭产机器人忙着进化忙着上岗
宇树机器人化身武林高手亮相春晚“这才一年,太震惊了!”昨晚的央视春晚上,宇树机器人和河南塔沟武术学校带来的《武BOT》一亮相
2026-02-17 07:17:00
新春走基层|总台春晚这条“骐骥驰骋”红色羊绒围巾出自河北品牌
见习记者于歆2026年总台春晚舞台上部分演员及嘉宾佩戴的“骐骥驰骋”红色羊绒围巾,出自河北品牌!由邢台市清河县的河北红太集团生产
2026-02-17 01:36:00
阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为其1/18
2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型
2026-02-16 17:34:00