• 我的订阅
  • 科技

Jina AI 推出全球首个开源 8K 文本嵌入模型

类别:科技 发布时间:2023-10-26 20:28:00 来源:瘦子财经

10月26日消息,JinaAI在其官网发布新闻稿,宣布推出jina-embeddings-v2模型,号称是目前是唯一支持8K(8192个token)上下文长度的开源产品,在功能和性能上与OpenAI的text-embedding-ada-002类似。

Jina AI 推出全球首个开源 8K 文本嵌入模型

在大规模文本嵌入基准(MTEB)排行榜方面,IT之家发现,官方进行如下解释:

与OpenAI的8K模型text-embedding-ada-002进行比较,jina-embedding-v2在分类平均值、重排平均值、检索平均值和摘要平均值方面均优于OpenAI的text-embedding-ada-002。

▲图源JinaAI官网

Jina AI 推出全球首个开源 8K 文本嵌入模型

▲图源JinaAI官网

官方表示,jina-embeddings-v2模型,是从头开始构建的。在过去的三个月里,JinaAI团队进行了密集研发、数据收集和调整。

JinaAI同时声称,jina-embeddings-v28K的上下文长度有利于以下应用场景:

法律文件分析:确保对大量法律文本中的每一个细节进行捕捉和分析。

医学研究:为了进行高级分析和发现,全面地嵌入科学论文。

文学分析:深入研究长篇内容,捕捉微妙的主题元素。

财务预测:通过详细的财务报告获得卓越的洞察力。

会话式AI:提升聊天机器人对复杂用户查询的响应能力。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-26 23:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...计的有效性。具体来看,ChatGPT在预测时主要依赖于历史平均值,而没有明确地将时间或空间数据纳入其预测模型中。Llama-2-70b虽然能够分析特定时间段和区域,但在处理数
2024-08-01 09:40:00
刚炮轰完GPT模式 杨立昆推出首个“世界模型”
...编码器的输出,其权重通过上下文编码器权重的指数移动平均值在每次迭代中更新。 I-JEPA中的预测器可以看作是一个原始的(受限制的)世界模型,它能够从部分可观察的环境中对静态
2023-06-14 18:02:00
EMQ 如何用DeepSeek大模型重构可观测性数据分析?
...户直观地理解数据,快速定位问题。示例1:计算duration的平均值在脚本模式下,用户发送了一个「计算当前追踪数据中duration字段(耗时)的平均值」的请求
2025-02-27 14:45:00
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
...测文本:把所有的token扔进所有的水印函数中,最后计算平均值,则带水印的文本通常应该得分高于无水印的文本。由此可知,水印检测是一个程度的问题。影响评分函数检测性能的主要因素
2024-11-09 13:34:00
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字
2023-10-30 15:02:00
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并
2024-03-28 10:06:00
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1
2024-02-21 14:05:00
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...于NSA(Natively Sparse Attention,原生稀疏注意力)。据DeepSeek,上下文建模对于下一代语言模型至关重要
2025-02-19 18:43:00
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
... LitQA2 问题时,PaperQA2 平均每道题解析并使用 14.5 ± 0.6(平均值 ± SD,n = 3)篇论文
2024-09-13 13:33:00
更多关于科技的资讯:
苏州制造名品好物生活节举办
1月24日至25日,为期两天的“苏州制造名品好物生活节”在苏州制造名品中心举办。本次活动以“苏州好物 名品上新”为主题
2026-01-25 13:34:00
2026委员通道丨林杰:让工业具身智能 “落地生根”助力“数智强省”建设
大河网讯 2025 年“具身智能”冲上了年度热词,而河南也正以“数智强省”为目标加速迈进“十五五”。1月25日,在河南省政协十三届四次会议“委员通道”上
2026-01-25 08:24:00
浙江日报讯 近日,丽缙高新区,浙江氢阳能源装备有限公司董事长黄刚向记者分享了一则喜讯:该公司首批50余个氢能两轮车固态储氢瓶产品小批量测试顺利完成
2026-01-25 08:48:00
当煤价下行的寒意与成本上涨的压力双重叠加,煤炭行业正经历一场前所未有的经营大考。如何在市场波动中稳住经营基本盘?怎样在双线挤压下答好逆势增长“优”答卷
2026-01-25 07:32:00
零的突破!云知声中标全国首个省级医保大模型项目,打通医保治理现代化“最后一公里”
2026年开年,智慧医保领域迎来里程碑式突破——云知声智能科技股份有限公司成功中标全国首个省级医保垂直大模型项目“江苏省医保垂直大模型及智能体应用项目”
2026-01-24 17:26:00
香港大学中国商业学院2026年专业研究生文凭课程火热招生中
香港大学中国商业学院2026年专业研究生文凭课程全面启动招生!课程涵盖人工智能、创新管理、增长营销、财务金融、人力资源等前沿及核心商管领域
2026-01-24 17:27:00
当哲思遇见科技:华为阅读携手周国平,探讨如何在独处中沉淀自我
在信息纷扰、节奏加速的时代,何处寻得一方宁静,让思想深度扎根?华为阅读联合北京广播电视台纪实科教频道《我们读书吧》第二季
2026-01-24 17:29:00
1月8日,深圳市精锋医疗科技股份有限公司(以下简称精锋医疗)在香港联合交易所主板成功挂牌上市,成为2026年深圳IPO“第一股”
2026-01-24 17:29:00
赋能普惠,引领向善:龙环汇丰实践获公益节大奖肯定
1月22日,第十五届公益节暨2025ESG影响力年会在北京盛大开幕。本届大会以“15年,共益新篇章”为主题,回顾中国公益事业十五年发展历程
2026-01-24 17:30:00
鸿蒙 6“智感握姿” 让交互体验更“近”一步
你是否也经历过这样“手忙脚乱”的时刻:出差途中单手提包,电话突然响起,另一只手紧紧攥着手机,大拇指却怎么也够不到那段长长的滑动接听条
2026-01-24 17:27:00
蚌埠这场脑机接口大会,让“大脑连接未来”照进现实!
大皖新闻讯 1月23日至25日,安徽省脑机接口创新发展大会在蚌埠隆重启幕。为期三天的盛会汇聚了300余位来自高等院校、科研院所
2026-01-24 16:54:00
固体废物综合治理是生态文明建设的重要内容,也是推进美丽中国建设的关键环节。近日,国务院办公厅印发《固体废物综合治理行动计划》
2026-01-24 12:14:00
鲁网1月24日讯国家新一轮消费品以旧换新及数码智能产品购新补贴政策红利持续释放。作为通信行业标杆企业,山东移动济宁分公司积极响应国家号召
2026-01-24 14:00:00
提供16万多方生态空间 设立7亿元资本活水每日商报讯 眼下,“AI漫剧”正加速走入公众视野。作为人工智能时代下中国文化“新三样”(网文
2026-01-24 10:59:00
固安搭建AI智慧招商平台 30秒生成企业选址方案
1月20日,“立业固安”平台工作人员(中)通过平台向企业推荐合适的选址方案。 万 倩摄河北日报讯(记者刘英)30秒,生成一份定制化的选址方案
2026-01-24 08:19:00