• 我的订阅
  • 头条热搜
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...eta和Llama团队对开源的巨大贡献"。他表示:"Llama3.1增加了上下文长度和改进了功能,是送给每个人的奇妙礼物。"图源:网络总的来说,Llama3.1模型有以下几个特点:1.包含8B、70B和405B三个尺寸,最大上下文提升到了128K,支持多语...……更多
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...列开源模型GLM-4-9B问世,具备更强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。智谱AI CEO张鹏表示,“2024是AGI元年,大模...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官方测试中,Grok-1.5...……更多
追一科技吴悦:一家做了7年NLP的公司,如何抓住大模型浪潮? | 36氪专访
...依赖的底层能力比较通用,不需要特别强的数学能力或者上下文长文本的逻辑推理能力。另一方面,我们在大模型的基础上进行了很多微调,强化专项能力,深入挖掘底层大模型。这两个方面决定了当下基础大模型在企业服务营...……更多
“华米OV”的新战场:手机大模型
...盖大量手机机型和部分智能音箱。升级版的小爱具有理解上下文、更高质量的问答、生成式内容输出等能力,基本上相当于把文心一言、讯飞星火这种大模型App的能力直接嵌入到了手机中。但与App不同的是,这种嵌入会更加底层...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...提高了大模型的准确性和可靠性,还使其能够更好地理解上下文,并将检索到的知识融入到生成过程中,从而生成更加贴合实际需求的文本。但RAG也并非完美无缺。互联网上的信息五花八门,存在着大量的干扰内容,甚至假新闻...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...两个字母。在多次请求后,你都没有做出任何澄清或说明上下文,我无法继续进行富有成效的讨论了。如果你有真正的问题或希望解释你的观点,我可以提供帮助。否则,我们可能需要换一个话题最后,小哥承认,自己的prompt是...……更多
国产品牌已开始普及AI,苹果AI赛道仍是追赶者
...争议最大的就是Siri了,苹果引入ChatGPT,能够结合场景和上下文,判断用户真实意图,可以制定最佳行程路线、查找记忆模糊的事项等。在图片的搜索上需要对Siri说出照片特征,之后就能轻松找到了。这些听上去也很熟悉,在欧...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这...……更多
Yann LeCun说自回归要完,DeepMind论文证明自回归能实现通用计算
...究了自回归解码的一种自然泛化,其中在处理每个连续的上下文之后,输出的 token 都会被添加到序列末端 —— 只要输入能放入上下文窗口中,则该过程就会简化成标准的自回归解码。不过,该团队得到这一结果的过程比较复杂...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
多角度发挥人工智能技术优势
...,不断优化系统功能,进一步应用于发现法条引用错误、上下文描述矛盾等场景。 ……更多
...型。第三阶段是2020年开始做基于生成式的模型,它是有上下文的有情感的一种模型。基于落地场景,我们也找到了癌症早筛这个领域,当时很多巨头还没有注意到这个方向。关于落地,首先一方面要紧追最前沿的技术,其次还...……更多
角逐数据智能下半场,谁能引领下一个十年?
...很多数据平台汇聚了海量的实时数据,但缺少灵活的业务上下文逻辑;另一方面,大模型理解能力有目共睹,但缺少实时业务数据反映的业务实时细节。一定程度上,这也解释了为什么过去两年来,大模型赛道始终处于鱼龙混杂...……更多
...型快速学习。而政府很多信息公开数据闭环性较高,缺乏上下文交互,属于生成式的低质量语料。中文优质语料的稀缺,更迫在眉睫。“中国大模型发展要获得突破,必然要依赖于中文优质语料库的建立。”申永生分析,目前,...……更多
OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能
...价为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,Claude Pro和Claude Team的订阅用户将获得五倍的速率限制。此外,新模型也...……更多
荣耀magicos8.0:人机交互迎来新范式
...做基础技术,另一方面让AI能够越用越懂用户,可以基于上下文理解与学习用户的意图,基于位置、时间对消费者习惯进行整合式机器决策。比如2022年的MagicOS7.0,可基于地理围栏、用户习惯等信息主动提供建议引导及服务,例...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...己的 GPT。根据官方说法,这一波 GPT 的升级包括:更长的上下文长度:128k,相当于 300 页文本。 更高的智能程度,更好的 JSON / 函数调用。 更高的速度:每分钟两倍 token。 知识更新:目前的截止日期为 2023 年 4 月。 定制化:GPT...……更多
voyageai推出两个嵌入式ai模型
...成本效益成本效益是新Voyage-3系列模型的核心。Voyage-3的上下文长度为32000个tokens,是OpenAI产品的4倍,是需要高质量检索的企业的成本效益解决方案,且价格亲民。Voyage-3的成本为每百万个tokens0.06美元,比CohereEnglishV3便宜1.6倍,.……更多
商汤 AI 办公小程序“Raccoon 智能助手”上线:提炼文章重点
...幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。 ……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...之后,Llama 3.1 终于在昨夜由官方正式发布了。Llama 3.1 将上下文长度扩展到了 128K,拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的...……更多
这才是改变人类的创新,最近又有新突破
...”字,其实暗示了我大概率是承德户口。第三个,它结合上下文,把所有信息点组合在一起,准确理解了真正的问题,也就是“一名河北承德户籍的用户,能不能用北京的公积金在承德贷款购房”,然后针对这个问题给出了回答...……更多
字节Coze国内版上线,30秒定制AI机器人,还做Bots商店|最前线
...是由字节的云雀大模型提供底层技术,支持最高30轮携带上下文轮数。除了能打造自己的AI Bot,Coze也对大众开放了GPT商店。用户在创建AI Bot的基础上,还可以将AI Bot公开给其他用户使用,同时也可以体验到其他用户或开发者开发...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...绝采样(RS)和直接偏好优化(DPO)。具体来说,Meta 将上下文窗口长度扩展到了 128K 个 token,同时保持与预训练模型相同的质量。为了提高模型的性能,Meta 也采用了生成合成数据的方法,他们筛选高质量的混合数据,来优化模...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...的环境信息,从三维形状和空间位置、到视觉特征、再到上下文环境指令,为模型提供了一个综合的世界视图。从而能够理解并响应非精确或模糊的指令,显著提高具身智能系统的适应性和执行效率。图丨LPLM 算法模型架构(来...……更多
英伟达发布mistral-nemoai大语言模型
...发布了全新的Mistral-NeMoAI大语言模型,拥有120亿个参数,上下文窗口(AI模型一次能够处理的最大Token数量)为12.8万个token。VentureBeat与Midjourney合作制作Mistral-NeMoAI大模型主要面向企业环境,让企业不需要使用大量云资源的情况下..……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的安全风险。在大语言模型可信性评估常用的越狱攻击和上下文隐私泄漏任务中,如果提供给模型一张与文本无关的图片,原本的安全行为就可能被破坏(如图2)。 结果分析和关键结论图8 实时更新的可信度榜单(部分)研究...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...真实标签。输出数据生成输出数据生成阶段采用了典型的上下文学习方法:研究者向模型提供任务指令和原始示例,使模型对输入生成阶段产生的每一个输入进行标注。在获取所有输出后,再进行一轮基于规则的过滤,以选择最...……更多
GTC对话黄仁勋:我眼中的GPU,和别人有很大差别
...不是基于检索的。当然,这个生成过程必须是智能的、与上下文相关的。我相信,未来人们电脑上的几乎每一个像素、每一次交互都将通过生成过程产生,我相信 Sam 也这么认为。希望通过 Blackwell 新一代架构能为生成式 AI 这个...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00