• 我的订阅
  • 头条热搜
mistralai公司推出mixtral8x22b开源模型
...出了Mixtral8x22B开源模型,共有1760亿个参数,Context长度(上下文文本)为6.5万个token,可以通过Torrent下载。MistralAI公司自成立以来一直备受外界关注,“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
infini-attention:谷歌大内存机制
谷歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...antization) 最大序列长度为8,192个数据单元,以处理更长的上下文信息纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
Kimi概念股继续暴涨!多家上市公司回应,月之暗面致歉系...
...。 此前3月18日,月之暗面宣布其AI产品Kimi,在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测。据了解,月之暗面成立于2023年4月,法定代表人杨植麟毕业于清华...……更多
中国银河维持传媒互联网推荐评级,AI技术潜在的应用行业将受益
...面科技有限公司开发的KimiChat宣布已支持200万字超长无损上下文输入,并已开启产品内测。据SimilarWeb,目前KimiChat的周度访问量已经超过200万。2024年3月23日,阶跃星辰在全球开发者先锋大会现场发布了其Step系列通用大模型,其...……更多
估值180亿美元,马斯克造了一家“AI独角兽”
...。在Grok-1开源后不久,xAI就紧接着退出了Grok-1.5,主打长上下文理解和先进的推理能力,其上下文长度从原先的8192增长至128K,与GPT-4持平。新模型在数学能力上的提升达到了惊人的50%,在HumanEval数据集上的得分甚至超过了GPT-4。...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...刚刚正式发布首款开源中英双语大模型Yi-34B,其拥有200K上下文窗口,可处理约40万字的文本。模型开放商用申请,在阿里云魔搭社区首发。与此同时,零一万物已完成新一轮融资,由阿里云领投。据零一万物介绍,截至11月5日,...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...,大模型是新时代的计算机,就如同中央处理器一样;而上下文窗口可以看做计算机的内存,存储了当下正在处理的文本。互联网实时信息与企业完整知识库,则共同构成大模型时代的硬盘。而基于搜索增强技术推出的API系列,...……更多
库克现身上海首次谈及AI话题,苹果真急了
...一篇论文,公开了一个名为“MM1”的多模态模型,其具有上下文学习、图片识别和一定连续推理的能力。该模型具有三个参数规模,其中最大的拥有300亿参数。作为对比,OpenAI的GPT-4拥有1.7万亿参数规模。而几周前发布的新款Mac...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...2 个。 旋转位置嵌入大小为 6144,与输入嵌入大小相同。上下文长度为 8192 tokens,精度为 bf16。此外还提供了一些权重的 8bit 量化内容。当然,我们还是希望 xAI 官方能够尽快公布 Grok-1 的更多模型细节。Grok-1 是个什么模型?能...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...的Baichuan2-192K大模型之后,李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B,可支持200K超长上下文窗口,可处理约40万汉字超长文本输入,是目前全球最长的上下文窗口。目前,零一万物估值超过10亿美...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
...一个基础设施的东西,来支撑上面的智能服务。大模型对上下文的理解,对情景的理解都更深了,不管它在手机上还是其他设备上,都能够随时随地了解你所在的场景,给用户提供下一步的可能性。小米的优势是多设备场景的综...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
...效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...与GPT-3.5相媲美,甚至优于GPT-3.5。Mixtral可以处理32k长度的上下文,支持英语、法语、意大利语、德语和西班牙语,具有强大的代码生成能力。具体来说,Mixtral拥有467亿总参数,但每个令牌只使用129亿个参数。因此,它处理输入...……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
...继续提出“把万里长城变成雪景”指令时,华藏可以根据上下文语境,对图片进行相应指令的修改——万里长城瞬间平添皑皑雪景。这种“文修图”能力是华藏自研技术之一,使用了数百亿的数据进行模型训练而成。包括文修图...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...可生成几个示例样本,以此作为提示下游模型完成任务的上下文学习示例,从而大幅增强下游模型的性能表现。假如这些后续研究能够顺利完成,将能更大程度地提升小模型的能力,从而为产业化落地提供更多支持。参考资料:...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
马斯克感慨硅谷AI人才争夺疯狂 万兴科技百万年薪邀人才共赴AI大时代
...本,在推理能力上获得了大幅度的升级,已支持长达 128k 的上下文。xAI网站显示,上个月,机器学习科学家 Ethan Knight 成为第三位转战 xAI 的特斯拉工程师。据一位前员工透露,在特斯拉,Knight 负责监督特斯拉自动驾驶技术的计算机视觉...……更多
更多关于科技的资讯:
雷神g80三模游戏手柄现货开售,内置2+2颗四转子马达
9月7日消息,雷神G80三模游戏手柄目前在京东现货开售,这款手柄主打“四马达震动、H桥急停芯片、霍尔摇杆、真无线RGB底座”
2024-09-08 02:31:00
谷歌宣布扩充和增强ai虚拟试穿工具
9月7日消息,谷歌公司于9月5日周四发布新闻稿,宣布扩充和增强AI虚拟试穿工具,现支持用户虚拟试穿来自Boden、Maje
2024-09-08 02:40:00
英伟达携手达慕思大学开发“生成式人工智能教学工具包”
9月7日消息,英伟达深度学习研究院(DLI)携手达慕思大学(DartmouthCollege),合作开发出了全新、免费的“生成式人工智能教学工具包”(GenerativeAITeachingKit)
2024-09-08 02:40:00
华为matext非凡大师9月20日开售
9月7日中午,HUAWEIMateXT非凡大师正式开启预约。根据华为官网显示,该产品与9月7日中午12:08正式开启预约
2024-09-08 02:42:00
大众id.3gtxfire+ice亮相瑞士洛迦诺
9月7日消息,大众汽车在瑞士洛迦诺举行的ID.会议上,和时尚品牌博格纳(Bogner)合作,为致敬20世纪90年代的高尔夫FireandIce
2024-09-08 02:42:00
云安全联盟发布大模型供应链安全国际标准
9月7日消息,世界数字技术院(WDTA)公众号昨日(9月6日)发布博文,宣布其在外滩大会上正式发布了国际标准《大模型供应链安全要求》
2024-09-08 02:45:00
nothingphonePlus将在欧洲市场开售
今年7月,Nothing正式推出了全新的NothingPhone(2a)Plus,目前该产品已经在部分市场上市,但尚未进入欧洲市场
2024-09-08 02:47:00
华硕推出geforcertx4070显存版本
9月7日消息,华硕推出搭载GDDR6显存的GeForceRTX4070显卡,基于现有RTX4070EVO版本,采用2.5槽厚
2024-09-08 02:47:00
领克Z10推出5款配置车型,限时价19.68万起
9月7日消息,领克Z10于9月5日晚迎来上市,共推出5款配置车型,限时价19.68万-28.88万元。领克今日公布战报
2024-09-08 02:49:00
荣耀aiagent正式发布
9月6日,2024德国柏林消费电子展(InternationaleFunkausstellungBerlin,简称IFA)
2024-09-08 02:52:00
科技媒体评测amd锐龙57600x3d处理器
9月7日消息,科技媒体PCGamesHardware于9月5日发布博文,评测了AMD公司最新推出的锐龙57600X3D处理器
2024-09-08 02:53:00
vivox100s喜报公布,3分钟打破上一代销量纪录
苹果公司一直都被誉为手机行业风向标,当苹果公司做出改变的时候,多家手机厂商都会模仿跟随,虽然这几年苹果手机在行业中的影响力已经大不如前了
2024-09-08 02:59:00
全球最小家用扫地机器人k10+procombo海外上市
9月7日消息,卧安科技旗下品牌SwitchBot出席柏林IFA2024大展,展示了全新的K10+ProCombo三合一吸尘器
2024-09-08 02:59:00
传音tecno展示phantomultimate2三折叠手机
9月7日消息,消息源RolandQuandt在德国柏林IFA2024大展上,和传音TECNO公司的工作人员交流后,得知该品牌将于MWC2025上展示PhantomUltimate2三折叠手机
2024-09-08 03:00:00
安克推出“超小型”100wusb-cnano充电器
9月7日消息,科技媒体iclarified昨日(9月6日)发布博文,报道安克(Anker)在柏林IFA2024大展上,推出了“超小型”100WUSB-CNano充电器
2024-09-08 03:01:00