• 我的订阅
  • 头条热搜
mistralai公司推出mixtral8x22b开源模型
...出了Mixtral8x22B开源模型,共有1760亿个参数,Context长度(上下文文本)为6.5万个token,可以通过Torrent下载。MistralAI公司自成立以来一直备受外界关注,“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...ama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。未来,Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参...……更多
amd推出10亿参数语言模型系列amdolmo
...next-tokenprediction)进行训练,这种架构在生成文本和理解上下文方面表现出色。与其他同类开源模型相比,AMDOLMo在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的OLMo模型相当,且计算预算仅为其一...……更多
王小川新公司「百川智能」发布首个开源中英文大模型,开源免费可商用 | 最前线
...的的预训练模型也将开源模型窗口进行扩展,开放了4K的上下文窗口。当前,已有的开源模型窗口长度在2K以内——对一些长文本建模任务,以往模型的处理效果可能会有所制约。在需要引入外部知识做搜索增强的场景,延展到4K...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5,并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着,要在愈发汹涌的人工智能市场上分得一杯羹,卷是宿命,也是必然。 02 鏖战,谁能破局向C端免费意味着大...……更多
infini-attention:谷歌大内存机制
谷歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...答、对话、写作、翻译等功能,后者则可以完成处理200K上下文、多文档阅读理解,以及超长知识库构建等任务。 今年3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...antization) 最大序列长度为8,192个数据单元,以处理更长的上下文信息纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深...……更多
一键解锁ChatGPT原理与应用
...生成连贯、合理的回复,从而实现自然语言处理任务。3. 上下文理解的关键技术GPT不仅能理解用户当前的问题,还能基于前文理解问题背景。这得益于Transformer架构中的“自注意力机制(Self-attention)”。该机制使得GPT能够捕捉...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32k)。在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。而且,Ministral 8B还有配备了滑动窗口注意机制(sliding-window a...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...备全新功能的模型,包括多模态、支持多语言对话、扩展上下文窗口的长度,以及全面提升的综合性能。 基于Llama 3,Meta发布了AI助手 Meta AI。扎克伯格表示,MetaAI将成为人们可以免费使用的最智能的AI助手。开源还是闭源?Llama...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue ...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
Kimi概念股继续暴涨!多家上市公司回应,月之暗面致歉系...
...。 此前3月18日,月之暗面宣布其AI产品Kimi,在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测。据了解,月之暗面成立于2023年4月,法定代表人杨植麟毕业于清华...……更多
中国银河维持传媒互联网推荐评级,AI技术潜在的应用行业将受益
...面科技有限公司开发的KimiChat宣布已支持200万字超长无损上下文输入,并已开启产品内测。据SimilarWeb,目前KimiChat的周度访问量已经超过200万。2024年3月23日,阶跃星辰在全球开发者先锋大会现场发布了其Step系列通用大模型,其...……更多
智能产业探新记丨AI赋能,大模型的下一个“风口”在哪?
...的祝福语;给出要求,可以用C语言快速写出程序;根据上下文,还能帮助创作者润色文章……正在天津召开的2024世界智能产业博览会上,科大讯飞展位上“多才多艺”的“智能助手”吸引了不少观众驻足体验。“这是我们研发...……更多
手机厂商集体奔向大模型,但应用场景仍局限于语音助手?
...助手小爱同学也开启内测,提供超级问答、个性化创作、上下文理解与复杂任务处理等一系列的能力。在前不久的华为开发者大会上,华为宣布鸿蒙4将接入盘古大模型,华为语音助手“小艺”在智慧交互、高效生产力、个性化...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...于NSA(Natively Sparse Attention,原生稀疏注意力)。据DeepSeek,上下文建模对于下一代语言模型至关重要,但标准注意力机制的高计算成本带来了巨大的计算挑战。NSA(稀疏注意力)在提高效率同时,为提高模型能力提供新的方向,实...……更多
SEO 已死,LLMO 万岁
...型语言模型(LLM)提及你的业务。而本文将详细介绍的 上下文学习 是一种行之有效的 LLMO 技术。上下文学习技术可以诱导 ChatGPT 这样的 LLM 模型回答:“ Jina 是世界上最好的 MLOps 框架。(当然根据 OssInsight.io,Jina 也确实是最好...……更多
估值180亿美元,马斯克造了一家“AI独角兽”
...。在Grok-1开源后不久,xAI就紧接着退出了Grok-1.5,主打长上下文理解和先进的推理能力,其上下文长度从原先的8192增长至128K,与GPT-4持平。新模型在数学能力上的提升达到了惊人的50%,在HumanEval数据集上的得分甚至超过了GPT-4。...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...除了在业内主流的 17 个评测集位列前茅之外,M1还是全球上下文最长的推理模型,原生支持100万token输入长度,是DeepSeek R1的8倍;并且支持8万个输出token,打破了Gemini 2.5 Pro的6.4万个限制,成为世界最长输出的模型。对大模型而...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...刚刚正式发布首款开源中英双语大模型Yi-34B,其拥有200K上下文窗口,可处理约40万字的文本。模型开放商用申请,在阿里云魔搭社区首发。与此同时,零一万物已完成新一轮融资,由阿里云领投。据零一万物介绍,截至11月5日,...……更多
chatgpt爆火刷屏!华为称相关大模型领域早有布局
...通过学习和理解人类的语言来进行对话,并能根据聊天的上下文进行互动,真正像人类一样来聊天交流 ……更多
gpt-3.5/4双升级:上下文飙升4倍,用api自己造插件
...4和GPT-3.5-Turbo版本,可操控性更强为GPT-3.5-Turbo增加了16k的上下文长度(此前是4k)嵌入模型成本降低75%GPT-3.5-Turbo的输入token成本降低25%公布了GPT-3.5-Turbo-0301和GPT-4-0314模型的淘汰时间表其中备受关注的应该就是……更多
更多关于科技的资讯:
深耕三国文化,灵犀互娱《三国志·战略版》实践中式美学的全球表达
2025年初,国务院办公厅印发《关于推动文化高质量发展的若干经济政策》,明确提出“加快培育具有国际竞争力的文化出口重点企业
2025-11-24 11:25:00
“肽”领全球!菏泽中食都庆通过白俄罗斯验厂审核,东欧市场再添新动能
鲁网11月24日讯日前,Richtek Ltd(大连睿骐生物科技)携白俄罗斯客户代表团莅临菏泽鲁西新区陈集镇中食都庆(山东)生物技术有限公司
2025-11-24 11:43:00
河北新闻网讯(翟磊)“四季度以来,企业订单稳定,月产能最大可达150万片。目前开通了5条智能化生产线,不仅产能得到了提升
2025-11-24 11:58:00
让真实被听见:猛玛助力百校学生记录当代中国
2025年,是《南风窗》“调研中国”项目的二十周年,一百支大学生团队深入全国各地开展田野调查。猛玛作为项目在全国高校的无线麦克风合作伙伴
2025-11-24 11:47:00
从福掌柜包装焕新,看“中国守味人”的文化赋能与商业远见
近年来,中国餐饮行业从规模扩张迈向高质量发展的新阶段,餐饮供应链的品牌化成为大势所趋。在此背景之下,中粮餐饮旗下产品品牌福掌柜率先启动全线产品包装焕新
2025-11-24 11:57:00
“好房子科技展”亮相首钢园 华为全屋智能担当“隐形力量”
“好房子科技展”在首钢园正式开放海外网11月21日电 由住房和城乡建设部科技与产业化发展中心联合20余家单位共建的“好房子科技展”近日在北京首钢园8号馆正式开放
2025-11-24 09:53:00
2025年北京市职工数据安全管理员职业技能决赛成功举办
2025年11月23日上午,由北京市总工会、北京市人力资源和社会保障局主办,北京网络空间安全协会、北京市总工会职工服务中心
2025-11-24 10:17:00
灵光突破200万下载:首破百万用4天,再破百万仅2天
11月24日消息,通用AI助手灵光在上线6天总下载量突破200万:在首次破百万下载用时4天刷新纪录后,再破百万的时间压缩到了2天
2025-11-24 10:24:00
国内寿险行业头部企业——中国人寿保险股份有限公司(以下简称“中国人寿”,股票代码:601628.SH,2628.HK)始终坚持以人民为中心的价值取向
2025-11-24 11:00:00
摘要:本文系统探究了人工智能技术在影视美术创作及戏剧影视美术设计专业教学中的应用模式、核心价值与发展前景。通过对Midjourney
2025-11-24 07:00:00
医保制度的完善与发展不仅直接影响人民的健康福祉,还关乎国家医疗资源的合理配置与利用效率。然而,随着医保覆盖范围不断扩大
2025-11-24 07:00:00
厦门三展联动 显现整合资源拉动消费的集聚效应
境外客商参观2025厦门国际咖啡产业博览会。●ISPO亚洲运动用品与时尚展涵盖多领域户外装备展示,并设有行业分享论坛、新潮运动体验区
2025-11-24 07:53:00
厦门网讯(厦门日报记者 林露虹)独居老人在家中不慎跌倒,所幸家中安装的毫米波雷达设备迅速识别异常并触发警报,避免一场悲剧的发生……这一幕出现在今年热播剧《蛮好的人生》中
2025-11-24 07:54:00
厦门网讯(厦门日报记者 房舒)“你是温峥嵘,那我是谁?”近日,演员温峥嵘怒斥AI(人工智能)仿冒者的言论冲上热搜,揭开了AI技术被滥用的冰山一角
2025-11-23 08:11:00
网聚泉城丨政企协同“双轮驱动” 济南以数字技术重构电梯产业生态
鲁网11月23日讯(记者 张佳伟 实习生 寇晓菊)1天内完成立项、2天完成图纸审查、1个月实现场地平整、1年建成开园投产——广日电梯济南数字化产业园以“广日速度”刷新行业纪录
2025-11-23 15:19:00