• 我的订阅
  • 头条热搜
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5,并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着,要在愈发汹涌的人工智能市场上分得一杯羹,卷是宿命,也是必然。 02 鏖战,谁能破局向C端免费意味着大...……更多
RNN回归!Bengio新作大道至简与Transformer一较高下
...直相信并期待着RNN回归的那天:毕竟,凭借强大的顺序和上下文感知能力,RNN曾在各种任务中表现惊艳。直到后来遭遇了反向训练的瓶颈,因Scaling Law而跌落神坛。然而,人们并没有忘记RNN。RWKV、Mamba、xLSTM等RNN衍生模型接连出...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...时间因果卷积确保了信息的因果性,减少了通信开销。而上下文并行技术的采用,则可以适应大规模视频处理。 实验中,团队发现大分辨率编码易于泛化,而增加帧数则挑战较大。因此,可将分两阶段训练模型:- 首先在较低...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...,最新发布的 MiniCPM-V 2.6 首次将多图联合理解、多图ICL(上下文少样本学习 )功能集成在端侧模型,这也是此前业界多模态王者 GPT-4V 引以为傲的能力。1. 流畅的多图多轮理解,爽!就像人们习惯把多个文件拖拽给大模型处理,...……更多
商汤 AI 办公小程序“Raccoon 智能助手”上线:提炼文章重点
...幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。 ……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...2 个。 旋转位置嵌入大小为 6144,与输入嵌入大小相同。上下文长度为 8192 tokens,精度为 bf16。此外还提供了一些权重的 8bit 量化内容。当然,我们还是希望 xAI 官方能够尽快公布 Grok-1 的更多模型细节。Grok-1 是个什么模型?能...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...很有可能是事实。但如果进行FP8量化,依旧可以用128k的上下文窗口在单节点上运行。从另一个角度来看,我们还是要寄希望于开源社区的力量。Llama 1和Llama 2刚刚发布时,大家同样认为模型太大了,但两周后它就能在树莓派上运...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...升了大模型的记忆能力:在大模型的工作过程中,大部分上下文学习都是利用模型的短期记忆来进行的。智能体利用外部向量存储和快速检索等机制,提供了长时间保留和回忆「无限」信息的能力。最后是工具的使用:智能体可...……更多
微软Copilot客户量上季增60%!新升级能编Excel表、分析优先处理邮件
...容的表现较为不稳定,尤其是在涉及电子表格或需要理解上下文的任务时同样如此。近几个月来,投资者对科技公司通过AI大规模投资获利的努力表现出不耐烦的迹象。新AI工具 可帮用户创建Excel图表、分析优先处理邮件微软还...……更多
全面对标 OpenAI,智谱 AI 想要开发者 | 独家
...体性能相比上一代大幅增强,逼近 GPT-4。可以支持更长的上下文,具备更强的多模态能力,有着更快的推理速度、响应高并发的能力,推理成本得到了更进一步的降低,还对智能体能力进行了大幅增强。除了模型本身之外,智谱...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...。与此同时,Claude还具备强大的视觉理解能力、支持超长上下文(相当于470页PDF)的能力,以及优秀的内容创作和代码辅助能力。为了直观展示Claude的实力,王睿分享了多个实际应用案例。在文本分析场景中,他将一份亚马逊云科技产品...……更多
腾讯混元文生图大模型升级并对外开源
...细粒度理解能力,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。运行该模型需要支持CUDA的英伟达GPU,单独运行混元...……更多
Jina AI 推出全球首个开源 8K 文本嵌入模型
...na-embeddings-v2模型,号称是目前是唯一支持8K(8192个token)上下文长度的开源产品,在功能和性能上与OpenAI的text-embedding-ada-002类似。在大规模文本嵌入基准(MTEB)排行榜方面,IT之家发现,官方进行如下解释:与OpenAI的8K模型tex……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...代表包含了图像(VI)和图像中的文字(TEI)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率...……更多
openai推出gpt-4turbo:比上代便宜三倍
...者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此外还添加了JSONMode,更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...上使用2.5T tokens进行训练 主要是英文数据,拥有2048tokens上下文窗口 数据集包括DCLM-BASELINE、StarCoder和ProofPile2 MMLU得分接近Llama 3 8B 使用PyTorch和OpenLM框架进行训练具体而言,研究团队先是提出了一个语言模型数……更多
ai时代,高通arm架构成了“史诗级”提升
...圈”。 而真正让高通有底气挺进PC领域,还得是老大哥微软的Windows系统:为了在AI时代建立起WindowsonArm生态的优势,微软拉来了高通这个曾经的盟友,势要打响“Copilot+AI”这个品牌。但谁都知道,“AIPC”是今年的绝对热点,没...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...et 媲美。今年 2 月,Mistral AI 推出了最初的 Large 模型,其上下文窗口包含 32,000 个 token,新版模型在此基础上构建,具有更大的 128,000 个上下文窗口(大约相当于一本 300 页的书)—— 与 OpenAI 的 GPT-4o 和 GPT-4o mini……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...可生成几个示例样本,以此作为提示下游模型完成任务的上下文学习示例,从而大幅增强下游模型的性能表现。假如这些后续研究能够顺利完成,将能更大程度地提升小模型的能力,从而为产业化落地提供更多支持。参考资料:...……更多
“三巨头”杀疯了!开盘15分钟,微软、苹果、英伟达轮番角逐市值“一哥”!
...苹果展示的功能虽然有限,但却显得无缝且简单,如基于上下文搜索照片、分享定制表情符号等。由于微软在日常生活中的作用有限,使得其AI应用的实际用途受到限制。华泰证券最新研报分析指出,苹果在2024年WWDC首日推出了...……更多
微软更新kb5032288,新增功能!
...此更新解决了影响文件资源管理器的问题。按Shift+F10时,上下文(快捷方式)菜单无法打开。此更新解决了影响文件资源管理器窗口的问题。如果不期望它们,它们会显示在前台。此更新解决了影响文件资源管理器的问题。左窗格...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...的触达,可以让用户在驾车的过程中,通过简单的语音和上下文的一些辅助,帮助他更好的完成交互。在一些智能的操控领域以外,我们也希望更多的结合传感器和座舱能力,更主动的帮助用户去完成一些面对环境变化时的操作...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80……更多
首发XGP!微软今年内发布Forza Motosport新作
...示会后发表的一篇博客文章中说。每辆汽车现在还将具有上下文感知的损坏和污垢堆积,Turn 10说这对每辆车来说都是 \"真实和独特的\"。在展示会上,工作室展示了南非的Kyalami Grand Prix Circuit,这是游戏中的五条新赛车道之一。...……更多
人工智能的第三支柱:数据存储
...例和更先进的模型令现有数据资源库和额外数据源对模型上下文和训练的价值更甚。数据的不断生成促成了更多的数据存储,而更多的数据存储又进一步推动数据生成,一个良性循环的人工智能数据周期就此诞生。西部数据在今...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...浪潮信息的多路并发透传技术有效减少了I/O操作中频繁的上下文切换,降低单次I/O时延50%。本次测试的3D-UNet场景中,3节点存储支撑了1430个高并发读线程,计算节点网络利用率达到了72%。网络利用率的提高有效降低了网络资源的...……更多
...aichuan2-Turbo系列API(应用程序编程接口),在支持192K超长上下文窗口的基础上还增加了搜索增强知识库的能力。尽管大模型是划时代的技术突破,但现阶段并不完美,幻觉、时效性差、缺乏专业领域知识等问题,是其落地千行百...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...为。该观点还指出,人类在解决数学问题时通常有明确的上下文,而 LLM 在处理数学问题时可能没有这样的上下文。因此,如果通过适当的提示工程,向模型明确这是一个数学考试的环境,那么它们在添加多余子句时导致的性能...……更多
更多关于财经的资讯:
大族激光获得发明专利授权:“圆心定位方法、装置、存储介质及计算机程序产品”
证券之星消息,根据天眼查APP数据显示大族激光(002008)新获得一项发明专利授权,专利名为“圆心定位方法、装置、存储介质及计算机程序产品”
2025-01-08 02:41:00
奇安信获得发明专利授权:“程序的检测方法、装置、电子设备和介质”
证券之星消息,根据天眼查APP数据显示奇安信(688561)新获得一项发明专利授权,专利名为“程序的检测方法、装置、电子设备和介质”
2025-01-08 02:41:00
格力电器获得发明专利授权:“一种多轮交互方法、装置及存储介质”
证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“一种多轮交互方法、装置及存储介质”
2025-01-08 02:43:00
大华股份获得发明专利授权:“一种优化对焦曲线的方法、装置、设备及介质”
证券之星消息,根据天眼查APP数据显示大华股份(002236)新获得一项发明专利授权,专利名为“一种优化对焦曲线的方法
2025-01-08 03:13:00
富煌钢构获得发明专利授权:“大跨钢连廊混凝土牛腿无支架浇筑的组件及施工方法”
证券之星消息,根据天眼查APP数据显示富煌钢构(002743)新获得一项发明专利授权,专利名为“大跨钢连廊混凝土牛腿无支架浇筑的组件及施工方法”
2025-01-08 03:14:00
西点药业:24 年 Q3 营收增 12.95% 亮点多
【西点药业 1 月 7 日发布投资者关系活动记录】西点药业是“原料+制剂”双核驱动的制药企业,2024 年前三季度实现营业收入 1
2025-01-08 03:14:00
贵州茅台获得发明专利授权:“一种大曲贮存过程中的含水量检测方法”
证券之星消息,根据天眼查APP数据显示贵州茅台(600519)新获得一项发明专利授权,专利名为“一种大曲贮存过程中的含水量检测方法”
2025-01-08 03:14:00
买年货 95后成为绝对主力
春节是中国重要的传统节日。节前买年货,不仅满足了节日期间的生活需要,还承载着人们对新年的美好期盼和祝福。随着春节申遗成功
2025-01-08 03:15:00
华新水泥获得发明专利授权:“一种利用钙矾石提高低碳熟料碳化性能的方法”
证券之星消息,根据天眼查APP数据显示华新水泥(600801)新获得一项发明专利授权,专利名为“一种利用钙矾石提高低碳熟料碳化性能的方法”
2025-01-08 03:15:00
MSK 航司报价下调:SCFIS 欧洲航线跌 3.6%
【昨日新一期 SCFIS 欧洲航线报 3387.69 点,环比下跌 3.6%。】航司报价方面,MSK 二次开舱 W4 报价至$3400/FEU
2025-01-08 03:16:00
马钢股份获得发明专利授权:“一种顶底复吹转炉及系统化提高大型转炉高强复吹效果的方法”
证券之星消息,根据天眼查APP数据显示马钢股份(600808)新获得一项发明专利授权,专利名为“一种顶底复吹转炉及系统化提高大型转炉高强复吹效果的方法”
2025-01-08 03:16:00
中工国际:公司未被列入上述清单。目前公司整体经营情况良好,各项工作稳步开展
证券之星消息,中工国际(002051)01月08日在投资者关系平台上答复投资者关心的问题。投资者:董秘您好!请问贵司是否已经被移除1260H清单了
2025-01-08 03:16:00
华维设计:拟 6300 万购九江正启,机遇风险并存
【1 月 7 日晚间,华维设计拟 6300 万元收购九江正启 51%股权】华维设计主要从事工程设计等业务,因经营业绩下滑
2025-01-08 03:16:00
凯大催化获得发明专利授权:“一种非均相甲酸制氢钌催化剂的制备方法及应用”
证券之星消息,根据天眼查APP数据显示凯大催化(830974)新获得一项发明专利授权,专利名为“一种非均相甲酸制氢钌催化剂的制备方法及应用”
2025-01-08 03:16:00
陕西省国际信托:总会计师贾少龙因工作变动原因辞职
1月6日,陕西省国际信托发布《关于公司总会计师辞职的公告》表示,根据陕西省人民政府《关于贾少龙免职的通知》,因工作变动原因
2025-01-08 03:16:00