• 我的订阅
  • 头条热搜
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...答、对话、写作、翻译等功能,后者则可以完成处理200K上下文、多文档阅读理解,以及超长知识库构建等任务。 今年3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue ...……更多
amd推出10亿参数语言模型系列amdolmo
...next-tokenprediction)进行训练,这种架构在生成文本和理解上下文方面表现出色。与其他同类开源模型相比,AMDOLMo在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的OLMo模型相当,且计算预算仅为其一...……更多
鹰瞳科技:万语大模型通过国家深度合成服务算法备案 打造智能健康助手助力行业发展
...。为了帮助模型更好地理解和回答,用户可以提供相关的上下文信息,如病人的症状描述、医疗历史或特定的医学背景知识。该算法提供详细的解释、描述或总结,帮助用户理解答案背后的医学原理。算法模型生成的输出旨在为...……更多
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
...「grok-beta」,该模型目前正处于开发的最后阶段。该模型上下文长度为128000 token,这意味着Grok可以处理更长的文本输入,理解更复杂的上下文关系。此外,该模型不仅支持函数调用,也能支持系统提示词。从而让开发者能够更...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...ama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。未来,Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参...……更多
又热闹了!OpenAI的加强版“Her”正式开放,压过了Gemini的“生产级”大升级…
...提示。2. 整体质量改进:尤其在数学、代码生成、长文本上下文和视觉任务上的性能提升显著,包括在MATH、HiddenMath等基准测试中提高约20%,视觉和代码应用提高2%-7%。 3. 速率限制提高:1.5 Flash和1.5 Pro的速率限制分别从每分钟10...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...之后,Llama 3.1 终于在昨夜由官方正式发布了。Llama 3.1 将上下文长度扩展到了 128K,拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的...……更多
周活过亿,GPT4再升级!OpenAI放出杀手锏:可自定义,更强大还便宜
...次发布的Turbo模型在多个方面取得了显著进步。首先,在上下文对话长度上,基于GPT4的ChatGPT最大只能处理8000个tokens(语言模型中用来表示单词或短语的符号,8000个tokens约等于6000个单词),而GPT企业版拥有32000个tokens的上下文窗...……更多
没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?
...仔细阅读,汇总得出最终答案。MindSearch 中,LLM 如何管理上下文作为一个多智能体框架,MindSearch 为如何管理长上下文提供了全新尝试。当需要快速阅读大量网页时,由于最终答案只依赖 WebSearcher 的搜索结果,WebPlanner 将专注于...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...,Meta还推出了1B和3B两个轻量级纯文本的版本,可支持128K上下文。别看参数少,1B/3B在总结摘要、指令遵循、重写等任务上,表现非常出色,而且专为Arm处理器做了优化。LeCun激动地表示,「可爱的大羊驼宝宝来了」!Meta首席技...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
...通用人工智能创业公司Moonshot(月之暗面)宣布在大模型长上下文窗口技术上取得新的突破,其自研的Kimi智能助手(KimiChat)从2023年10月的20万汉字上下文能力,增长至200万字超长无损上下文。“近期非常火的AI语言模型反复发酵,这...……更多
智能化应用将出现爆发式增长(AI前沿观察)
...高处理能力,帮助开发者与最终用户精准理解输入信息的上下文关联和隐含信息。在艺术设计、市场营销和客户服务等领域,多模态交互能够提升应用的可用性,带来更丰富的用户体验。 ■AI Agent(人工智能代理)是大模型落...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...度快了,价格也下降了。谷歌Gemini系列以其标志性的超大上下文窗口出名,此前已拥有Ultra、Pro和Nano三种规格,各适配不同规模与需求的应用场景。本次发布会宣布,迭代后的Gemini 1.5 Pro 的上下文长度从原有的100万tokens(语句单...……更多
微软Copilot全面升级至GPT-4 Turbo模型
...Turbo模型由OpenAI于2023年11月首次发布,它提供了更大的128L上下文窗口,能够处理长达300页的单个文本提示。微软在12月首次宣布将支持ChatGPT-4Turbo,并将其作为CopilotPro服务的一部分,订阅费用为每月20美元。Copilot最初是基于GPT-3.5...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
Google 创始人谢尔盖·布林回归,直面 Gemini、Google、AGI 若干问题
...我想我们可以尝试一下。尽管今天我们更期待的是试验长上下文和一些技术特性。深入模型技术与安全在现场,布林多次提及了他对AI大模型发展的兴奋与期待。他的再次公开露面,将他对AI的热情尽现,他表示自己很热衷于研...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...,大模型是新时代的计算机,就如同中央处理器一样;而上下文窗口可以看做计算机的内存,存储了当下正在处理的文本。互联网实时信息与企业完整知识库,则共同构成大模型时代的硬盘。而基于搜索增强技术推出的API系列,...……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...到与用户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各技术模块之间的联动,形成一个闭环...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
豆包大模型综合能力提升20.3%,火山引擎成立零售大模型联盟
...了20.3%。其中,角色扮演能力提升了38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。语言理解能力提升了33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...确识别问题的核心并提供深度洞察。系统能够理解复杂的上下文关系,并通过逻辑推理为用户提供高质量的解决方案,做更懂你、更省心、更精准的AI搜索。推理能力的跨越式提升,离不开数据和信源检索技术的升级。在数据上...……更多
CMU副教授:在多智能体流行的当下,不要忽视单智能体系统
...完全匹配时,效果会很好,但问题是如果不匹配怎么办?上下文信息的传递:多智能体系统通常在多个智能体之间传递信息,但这可能是信息丢失的原因。例如,如果故障定位器仅将其摘要信息传递给其他智能体,则通常会导致...……更多
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
...同一文档中倾向于一起激活的 token。他们使用 1024 的最大上下文长度,并且每个文档只使用一个这样的上下文,因此每篇 The Pile 文档最多只能有 4 个块(和直方图更新)。他们计算了 50k 个文档的直方图。给定这个直方图,他们...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
...大模型具解析、理解、推理及生成能力。同时,大模型对上下文理解能力的突破,也使设计工程师得以用自然语言与大模型交互。 上海汽轮机厂智能出图项目由设序科技支撑,公司首席产品官杨庆保告诉记者,设计师们操作鼠...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...助手近期实现的现象级突破。此前,月之暗面将Kimi的无损上下文长度输入能力从此前的20万字提升到了200万字,应用场景扩展到更大范围。随着Kimi的爆红,多家相关上市公司被广泛关注,并积极回复外界关切。AIGC软件A股上市公司万...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...。训练数据集包括 Cauldron 和 Docmatix,并对 SmolLM2 进行了上下文扩展,使其能够处理更长的文本序列和多张图像。该模型通过优化图像编码和推理过程,有效降低了内存占用,解决了以往大型模型在普通设备上运行缓慢甚至崩溃...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...队表示,最初开发Genie时,只能访问微调16-32k范围内的短上下文模型,他们用这些模型进行了大量早期开发,用超1亿token的数据训练模型,虽然发现设计的架构有一定优势,但从根本上受限于模型在特定时间内可以处理的信息量...……更多
错误率从10%降至0.01%,领英全面分享LLM应用落地经验
... API,并将其响应注入到后续的 LLM 提示中,以提供额外的上下文来支持响应。许多此类数据通过各种微服务中的 RPC API 在内部公开。虽然这对于人类以编程方式调用非常方便,但对 LLM 来说并不友好。我们通过围绕这些 API 包装...……更多
更多关于科技的资讯:
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00
均胜电子:定位“汽车+机器人Tier1”,双轮驱动进阶智能新时代
全球领先的智能汽车科技解决方案提供商均胜电子(600699.SH / 00699.HK)正以创新驱动和全球协同,在汽车电子
2025-11-28 12:15:00
严禁“带病运行”!河南就政务信息系统开发公开征求意见
大河网讯 为给非涉密政务信息系统的开发建设加上一把“安全锁”,规范全生命周期的安全管控工作,11月27日,省行政审批政务信息管理局起草了《非涉密政务信息系统开发安全管理指南(征求意见稿)》(以下简称《征求意见稿》)
2025-11-28 14:10:00
吉林机场集团门户网站二次升级 打造智慧出行服务新标杆
为持续优化用户体验、丰富服务维度,吉林省民航机场集团有限公司门户网站(https//www.jlairports.com)正式迎来二次重大升级
2025-11-28 14:41:00
商赢酱酒以文化赋能商务社交,重塑“场景思维”新体验
11月25日,一场以“商界链接创富圈层,共享‘商赢酱酒’杯中哲学,解锁中国式商务社交的‘心’语”为主题的交流会在济南成功举办
2025-11-28 14:55:00