• 我的订阅
  • 头条热搜
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32k)。在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。而且,Ministral 8B还有配备了滑动窗口注意机制(sliding-window a...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
Yann LeCun说自回归要完,DeepMind论文证明自回归能实现通用计算
...究了自回归解码的一种自然泛化,其中在处理每个连续的上下文之后,输出的 token 都会被添加到序列末端 —— 只要输入能放入上下文窗口中,则该过程就会简化成标准的自回归解码。不过,该团队得到这一结果的过程比较复杂...……更多
商汤发布国内首个所见即所得模型“日日新5o”
...性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,这种交互体验正是源于“日日新5.5”基础模型能力的全面提升。相较于今年4月发布的“日日新5.0”,短短两个多月时间,全新“日日新5.5...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...平均化」的问题,使个性化信息能够更全面地表达。使用上下文学习(ICL)的检索增强生成(RAG)和用于微调的低秩适应(LoRA)等技术都可被视为局部更新个体数据的方法。 该团队的做法是采用一种混合策略来整合 LTM 数据,...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
...报基于声波能构建可重构光计算模块对人工智能高效解释上下文语义至关重要科技日报北京4月17日电 (记者张梦然)德国马克斯·普朗克光科学研究所与美国麻省理工学院研究人员合作,通过向光子机器学习添加声波维度,成功...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...嵌入,弥补基础大模型在垂直行业的知识短板,以及促进上下文间精确而紧密的互联,为大数据分析与用户决策提供更加坚实的信息基石。通过整理并优化行业专属术语库,确保每一个业务概念都能得到准确表达。同时,建立同...……更多
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...增强,与用户进行更自然、更有吸引力的对话,并提供与上下文相关的响应- 个性化推荐:根据用户喜好和历史记录,针对购物、新闻和其他内容进行定制化推荐- 家居自动化:Remarkable Alexa将作为一个更复杂的家居自动化中心,...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...、更便宜的GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...为一种强大的语言生成模型,通过语言理解、生成能力和上下文记忆能力,不断地自我完善和进化,让语音助手变得更加聪明和人性化,提供更加精准的服务。音色作为语音助手与用户交互的重要元素,其质量的好坏直接影响着...……更多
英伟达发布mistral-nemoai大语言模型
...发布了全新的Mistral-NeMoAI大语言模型,拥有120亿个参数,上下文窗口(AI模型一次能够处理的最大Token数量)为12.8万个token。VentureBeat与Midjourney合作制作Mistral-NeMoAI大模型主要面向企业环境,让企业不需要使用大量云资源的情况下..……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官方测试中,Grok-1.5...……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
ChatGPT已经过时?!尝试这8个替代品,让你惊艳不已!
...iniGoogle的AI助手已经升级。现在支持1.5 Pro,拥有百万标记上下文、数据分析和自然对话。无缝集成在Google应用中,成为你的个人AI助手,助你处理复杂任务。3、Anthropics的Claude sonnet 3.5Anthropics的最新AI模型。在编写代码和图像处理...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...希望一举打破英伟达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?AI芯片大决战,即将来临!AI硬件开发商初创公司的未来会怎样?Tenstorrent CEO David Bennett直言不讳地表示,在我们这个行业,...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...题。具体方法是,将每个数据集的所有文本内容视为背景上下文,然后利用大型语言模型(LLM)生成问题。首先,我们让LLM为每个数据集创建五个虚拟的RAG用户,每个用户代表不同的信息需求或兴趣领域。接着,针对每个用户,...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...k。如今,马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。具体来说,首先,Grok-1.5 最明显的改进之一是其在代码和...……更多
谷歌推出datagemma开放权重语言模型新版本
...数据共享平台检索相关信息来进一步提高回复的质量。长上下文窗口由Gemini1.5Pro实现,确保了回答的全面性和清晰度,同时引入了表格和脚注以提供更深层次的上下文。研究团队强调这些技术如何帮助大语言模型判断何时依赖外...……更多
MemGPT团队官宣创业,融资1000万美金,硅谷大佬Jeff Dean也投了
...宣创业。由该团队创立的Letta公司,推出了一个同名的AI上下文内存管理平台Letta。最近2年,大语言模型快速发展,但受到上下文窗口长度的限制,导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题,Letta提出了...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...步自回归给出任意长的预测结果。作者团队发现,在预测上下文长度不超过预训练序列长度的情况下,模型不会出现明显的多步误差累积现象。(2)时序填补(Imputation):类似语言模型T5,作者引入Mask Token表示一段连续的缺失...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...24文中还讨论了将外部数据集成到LLMs中的三种主要形式:上下文、小模型和微调,分析各自的优势、局限性以及适合解决的问题类型。级别1:显式事实查询(explicit fact queries)例:2024年夏季奥运会将在何处举行?Where will the 2024...……更多
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
...少了4到20倍,具体加速效果取决于序列长度。例如,在1k上下文中,训练速度提高了4倍;在4k上下文中,提高了10倍;而在8k上下文中,更是提高了20倍。研究人员指出,nGPT的优化路径从超球面上的点开始,通过位移来贡献最终的...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
...是合理的。(谁说是 Python?我 C++第一个不服!!)2忽略上下文和常识语义熵主要基于统计和概率计算,可能忽略了上下文和常识的影响。在一些需要综合上下文和常识来判断的问题中,语义熵可能无法提供准确的可靠性评估。...……更多
更多关于科技的资讯:
近期,在“智绘星空胜算在天—太空数据中心建设工作推进会”上,北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统
2025-12-03 09:42:00
太极韵动武汉,一场独属于银发爱好者的健康之约
承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕
2025-12-03 13:40:00
杭州日报讯 产品还没走下生产线,就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前,工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”
2025-12-03 13:41:00
本报记者 陆春花 为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作,推动江苏制造高质量“走出去”、精准“引进来”
2025-12-03 13:41:00
曹操出行与越疆合作,人形机器人入驻行业首个“绿色智能通行岛”,推进具身智能在出行、物流领域的规模化应用
12月1日,曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi(自动驾驶出租车)运营场景,共同探索机器人技术在车辆清洁
2025-12-03 13:41:00
江苏“领航工厂”引领“智造”变革
从“智慧车间”到“工业大脑”,“江苏智造”通过数据驱动全流程变革,赋能产业链协同升级 近日,全国首批15家领航级智能工厂名单发布
2025-12-03 13:41:00
国内首款AI助盲眼镜发布,基于通义千问打造
12月3日,杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造,具有出行避障
2025-12-03 13:41:00
橙友“橙汁儿”向橙柿直通车反映:这几天收到了短信,是杭州市公共自行车公司发来的——“尊敬的用户,由于业务升级,您之前办理的绑卡租车功能即将在2025年12月底取消
2025-12-03 13:41:00
北京上班族李想称,健身私教课结束后,教练为索要好评,直接拿他手机代笔修改达3分钟。好评既影响消费者选择,也关联平台推流与服务者收益
2025-12-03 13:41:00
找“搭子” 聊技术 谈合作每日商报讯 一个多星期前,“魔搭社区”(杭州)开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间
2025-12-03 13:41:00
革新影视拍摄技术,无影墙模块引领行业效率新发展
鲁网12月3日讯(记者 刘玉娜)在影视、摄影与直播行业飞速发展的今天,一项名为“无影墙模块”的实用新型专利技术正悄然改变传统场景搭建的作业方式
2025-12-03 13:43:00
阿里千问App位列全球AI应用增速榜第一名
12月3日,AI行业榜单“AI产品榜”发布最新月度数据。阿里巴巴最新推出的千问App凭借爆发式增长,位列全球AI应用增速榜第一名
2025-12-03 14:42:00
沐书源教育以“培训+就业”模式赋能国际中文教育人才,破解就业难题
随着“中文热”在全球持续升温,国际社会对高素质、专业化对外汉语教师的需求呈现爆发式增长。然而,对于许多怀揣“中文出海”梦想的从业者而言
2025-12-03 15:29:00
海尔感恩月 7城征集海尔洗衣机最美老用户
征集时间:即日起至2025年12月28日征集地点:济南、淄博、滨州、东营、德州、聊城、泰安7大城市所有用户征集规则:1
2025-12-03 15:29:00
传统助听器的困境:阻碍听障者康复的多重壁垒听力损失已成为全球重大公共卫生问题,我国的形势尤为严峻。《2024年中国听力健康产业发展报告》显示
2025-12-03 15:30:00