• 我的订阅
  • 头条热搜
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...到与用户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各技术模块之间的联动,形成一个闭环...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...asoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-...……更多
...aichuan2-Turbo系列API(应用程序编程接口),在支持192K超长上下文窗口的基础上还增加了搜索增强知识库的能力。尽管大模型是划时代的技术突破,但现阶段并不完美,幻觉、时效性差、缺乏专业领域知识等问题,是其落地千行百...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...时间因果卷积确保了信息的因果性,减少了通信开销。而上下文并行技术的采用,则可以适应大规模视频处理。 实验中,团队发现大分辨率编码易于泛化,而增加帧数则挑战较大。因此,可将分两阶段训练模型:- 首先在较低...……更多
字节、阿里云、百度大模型价格混战:低价背后是数据竞争,爆款尚未出现
...eek-V2“性能比肩GPT-4”,每百万token输入1元、输出2元(32K上下文),是GPT-4的近百分之一水平。在社交平台上,有认证为深度求索员工的用户表示,公司能够兼顾模型效果和成本,“基本纯靠模型结构创新(MLA+DeepSeekMoE)+ 超强In...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...任务中展现了广泛的适用性。模型只需快速微调就能适应上下文,可以无缝部署在各种场景中。 可扩展性:OpenCity展示了有希望的缩放定律,表明该模型有潜力在最小的额外训练或微调需求下有效地扩展和适应新的、以前未见过...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...图模型、语音模型来了一波大升级。通用语言模型:增大上下文、提升综合能力从 5 月到 9 月,豆包大模型的使用量实现了超过 10 倍的爆发式增长,顺着这股爆发式增长的势头,火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...f-Correction作者团队将自我纠错的过程抽象为对齐任务,从上下文学习(In-context learning)的角度对自我纠错进行了理论分析。值得一提的是,他们并没有使用线性注意力机制下的线性回归任务进行理论分析,而是使用真实世界LLM...……更多
生成式AI:手机厂商高端梦最后的希望
...集的云端进行。同时,由于本地设备可以访问用户的实时上下文信息(如位置、当前活动等),所以AI的响应能够更加准确和个性化,比在云端运行AI应用更为高效。”实际上,端侧AI如何解决算力和内存等限制,也是很多厂商在...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...PG-DiffusionMaster上线,同时文章和代码均已开源。RPG框架在上下文和组合语义对齐方面取得了显著的进步,还支持多轮对话编辑功能。△图源:Pika论文地址:???????? 扫码加入「智涌AI交流群」????????欢迎交流 ……更多
重磅!国产AI写作模型比ChatGPT强1000%,360前员工AI团队取得重大突破
...AI自研的“长文本输出工程”技术,能够保证它无损输出上下文,支持20000字超长内容生成。更为重要的是,据创始人李高才介绍,厉害猫AI通过深度学习投喂了高达200亿+的数据资源,用以对模型进行训练,涵盖了多个领域多个...……更多
MemGPT团队官宣创业,融资1000万美金,硅谷大佬Jeff Dean也投了
...宣创业。由该团队创立的Letta公司,推出了一个同名的AI上下文内存管理平台Letta。最近2年,大语言模型快速发展,但受到上下文窗口长度的限制,导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题,Letta提出了...……更多
豆包大模型综合能力提升20.3%,火山引擎成立零售大模型联盟
...了20.3%。其中,角色扮演能力提升了38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。语言理解能力提升了33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月,改进指令跟随和JSON Mode,更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...系统中的应用潜力概览监控功能:GenAI,特别是 LLMs,在上下文理解和预测方面显著增强了自适应系统的监控能力。LLMs 可将监控收集的非结构化数据进行结构化处理,辅助异常检测;在上下文预测方面,基于 LLM 和扩散模型的时...……更多
华藏生态共创,为大模型商业变现注入活力
...华藏的图生文(VQA)能力也可圈可点,不仅具备文本间的上下文能力,还具备图文间的上下文能力,比如与图对话、根据图片内容生成描述等。针对华藏多模态能力的商业变现,华藏与合作伙伴共创了模特生成和试衣平台,突破...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...层,相比 Mamba 可将 KV 缓存减少 32 倍。例如,在 256K 令牌上下文环境中,MixCon 仍能保持较小的 KV 缓存优势(如表 1 所示)。在吞吐量方面,处理长序列时,Conba 层计算效率更高,增加其比例可提高整体吞吐量。基本配置单位是 ...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...der。其中,Large-scale Transformer负责谱曲,学习Music Patches的上下文依赖关系,同时完成音乐可控性;DiT负责演唱,通过LDM(Latent Diffusion Model)让Music Patches被还原成高质量音频。在SOTA模型排行中,与海外顶尖的……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...即整合时空依赖编码器,以提升大型语言模型在捕捉时空上下文中的时间序列依赖性的能力。具体来说,我们设计的时空编码器由两个核心组件构成:一个是门控扩散卷积层,另一个是多层次关联注入层。上式 为初始化时空嵌...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
...reenAI等现有解决方案相比,Motiff妙多大模型能灵活地根据上下文理解界面元素,达到“设计专家”水平,最接近人类对UI界面的理解和表述结果。 权威UI指标横评中,Motiff妙多大模型所有指标均超过GPT-4o和Ferret UI最懂UI的大模型...……更多
百融云创荣获“2024大模型创新应用奖”
...构搭建企业级知识库。RAG技术能够帮助大模型更好地理解上下文,并将检索到的知识融入到生成过程中,从而产生更加贴合实际需求的答案。在第三方测评机构的测评中,CybotStar的准确率和精准性取得了行业领先的成绩。随着业...……更多
更多关于社会的资讯:
中新社吉隆坡1月3日电 题:马来西亚二十四节令鼓蕴含怎样的文化基因?——专访二十四节令鼓创始人之一陈再藩中新社记者 陈悦20世纪80年代诞生于马来西亚的二十四节令鼓
2025-01-03 17:07:00
《中国糖尿病防治指南(2024版)》发布 糖尿病防治又有新依据
2024年12月31日,《中国糖尿病防治指南(2024版)》(以下简称“《指南》”)在《中华糖尿病杂志》官网重磅发布!《指南》进一步明确了中医药在糖尿病防治中的重要地位和作用
2025-01-03 17:07:00
“新”中有“机”!创新服务承接新流量 撬动消费升级
央视网消息:新年伊始,消费市场焕发新活力,其中,冰雪消费更是亮点纷呈。从“雪具直达”到“滑雪摄影”,创新服务为这个雪季带来了更多新意
2025-01-03 17:07:00
中新网银川1月3日电 (记者 李佩珊)1月2日10时01分、16时43分,宁夏银川市永宁县、金凤区分别发生4.8级、4
2025-01-03 17:07:00
中新网1月3日电 据国家市场监督管理总局微信公众号消息,春节将至,保健食品作为节令商品将迎来一波消费热潮。为倡导文明、健康
2025-01-03 17:07:00
纪录片《那个瞬间的年代》:20余载接续纪录,再现“两弹一星”光辉历程
中新网北京1月3日电 (记者 高凯)20余载接续记录,137位亲历者口述,首次披露的国家影像档案;从组件的运送细节到“最后一按”的讨论
2025-01-03 17:07:00
韩国京畿道商业楼灭火工作初步完成 数十人已获救或自救
当地时间1月3日16时30分左右,韩国京畿道城南市一座8层的商业楼起火。据韩国消防部门消息,截至当地时间17时16分左右
2025-01-03 17:07:00
余干县第三小学知识竞赛超“燃”来袭!
为使全校师生尽快适应“新课程、新教材”改革,同时为发展学生的个性特长,激发学生潜在的学习兴趣,丰富学生的学科学习活动,拓展学生的知识视野
2025-01-03 17:08:00
婺源县第二幼儿园举行元旦特别活动
婚俗文化是中华优秀传统文化的重要组成部分。若与孩子们一起策划一场婚礼会碰撞出怎样的火花呢?2024年12月30日,一场特殊的婚礼在二幼甜蜜举行
2025-01-03 17:08:00
“数字拾遗 古韵新生”——以鲜活方式讲述“数字中国”故事
近期, 浙江传媒学院23级双语播音专业的学生团队,以浙大文物数字化团队的主要工作内容为主题,聚焦于“数字技术赋能文化遗产保护”拍摄的专题片——"数字拾遗 古韵新生"
2025-01-03 17:08:00
石家庄将暂停社保卡相关业务办理
据石家庄社会保障卡公众号显示,因省社会保障卡管理平台业务改动,需要暂停社保卡相关业务办理。停机时间为2025年1月3日晚18点至1月4日早6点
2025-01-03 17:09:00
“流感≠感冒!”河南名医支招:这些误区请注意
大河网讯 “嗓子好痛”“医院发烧的人都排满了”“感冒多日不好”“比普通感冒难受”“此次甲流如何预防”……时至冬季,流感易发
2025-01-03 17:16:00
十堰广电讯(全媒体记者 叶旭升 通讯员 顾乙宁) 2025年春节将至,为切实保障全市人民群众节日饮食安全,十堰市市场监管局发布以下消费提醒
2025-01-03 17:22:00
锣鼓喧天迎新春 墨香四溢送祝福 环球酿造多彩活动迎腊八
鲁网1月3日讯(记者 吴美琳)欢庆锣鼓敲起来,祥蛇贺岁送福来, 腊八节,是开启年味的钥匙。每年腊八节,德州人便纷纷拎着大桶小瓶
2025-01-03 17:22:00
近日,商洛市公安局交通警察支队高速公路交警大队、陕西交通控股集团有限公司西镇分公司联合发布关于包茂高速营盘收费站西安方向交通管制的通告
2025-01-03 17:23:00