• 我的订阅
  • 头条热搜
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...源的多模态大模型。”他提到的这两款模型是300亿参数的文生视频模型,以及1300亿参数的语音模型Step Audio。“我们希望通过这两款多模态大模型的的开源,助力开发者创建出更丰富多彩的应用出来。”姜大昕还透露,阶跃正在...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
...「上价值」 ?一句话、30 秒,创意立刻「活了」 。Vidu 文生视频一句话,召唤出 3D 世界。哇嘶嗒(VAST)文生3D模型一个创意、一键生成,短短五分钟,一段品牌宣传片便能完美呈现。手机,也能来个「即圈即搜」 。贵阳市民早...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...为到位,且能给出中上水平的答案。因而对于有图生文或文生文需求的用户而言,LLaVa-1.6模型不失为更适合中国人体质的GPT-4V。图片来源:笔者在文心一格平台的使用截图更强的视觉对话能力使得LLaVa-1.6的智能服务可以覆盖更多...……更多
文生视频让自动驾驶看到新方向
...文转自:广州日报港科大(广州)人工智能专家陈颖聪:文生视频让自动驾驶看到新方向来源:视觉中国陈颖聪近年来,生成式人工智能在AI技术应用中成为焦点,尤其是文本生成视频大模型Sora,近来更是在全球范围内激发了科...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...Llama上做了测试,可以有效地训练或部署AI大模型,包括文生图的Stable Diffusion和语音识别的Whisper等等。在现场,基辛格也展示了集成最新英特尔芯片的AI PC,能够快速处理的多项任务,例如快速处理邮件、语音处理、图像渲染等...……更多
摄影棚、演员都不要了!贵州青年把AI影视搞得很精彩
...耗资巨大。但AI电影制作只需巧妙运用AI视频工具,结合文生图、文生视频、图生视频等功能,生成画面分镜,再用后期剪辑串联并配乐,即可快速合成完整短片。齐磊说:“在AI电影领域,导演指令已从‘指导演员’变为‘训练...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...同时提升生成质量。具体来说,Magic3D可以在40分钟内创建高质量3D网格模型,比DreamFusion快2倍,同时实现了更高分辨率,并在人类评估中以61.7%的比率超过DreamFusion。图像-文本模型生成 主要代表作有Flamingo、VisualGPT。Flamingo 是Dee……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...用中具有很大的潜力,可以在计算资源有限的情况下实现高质量的语义分割任务。迁移学习是一种机器学习方法,它通过将从一个任务中学到的知识应用于另一个相关任务中,从而提高学习性能。在迁移学习中,通常有一个称为...……更多
“华米OV”的新战场:手机大模型
...如在手机上可以执行一些简单的任务,比如写作、建议、文生图等。另一些涉及到复杂的知识体系和实时性的信息,不太适合数据采集和学习的,例如订票、订酒店等操作,可以调动云端的能力。接下来,是改造手机SoC,在原本...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...型在特定自然语言任务上的表现,现有的方法主要依赖于高质量的人工标注数据。这类数据的收集过程既耗时又费力,对于数据稀缺的任务尤为困难。为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...出,扩展参数数量并非提高模型性能的唯一途径,使用更高质量的数据训练也可以产生类似效果。OpenAI首席执行官阿尔特曼在4月的一次活动中表示,他相信当前正处于巨型模型时代的末期,“我们将通过其他方式来提升它们的...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...声图像-文本对数据上进行预训练。然后,在中等规模的高质量领域内和知识增强的图像-文本对数据上,再次进行训练。 接着,在后训练阶段采用与文本模型类似的方法,通过监督微调、拒绝采样和直接偏好优化进行多轮对齐...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,相比现有最高效的同类方法快了 47 倍。MimicTalk 算法被人工智能顶级会议 N...……更多
...模态大模型进行质量筛选和描述重写,从而自动产生大量高质量的 3D 图像数据,辅助训练更优秀的多视图扩散模型。Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍,24 点图形推理一步成神:BoT 可有效提...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
...作”的共性问题提供解决方案,短剧制作的重心有望回归高质量剧本创作。文娱传媒ETF(516190)是唯一跟踪中证文娱传媒指数的场内ETF,指数成分股50只,涉及视频、直播、游戏、电影、IPTV/OTT、数字出版、数字营销、在线教育...……更多
国产“Sora”亮相中关村,文生视频相关个股有哪些
...等方向上的延伸和突破,Vidu有望为我们带来更多惊喜。文生视频时代悄然降临,部分行业或将加速变革此前的2月16日,OpenAI的文字生成视频模型--Sora首次面世。该模型可以根据所输入的prompt(提示词),直接输出最高长达60秒的...……更多
苹果发布mm1.5-ui模型
...力。参考论文可知,团队在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,这显著提高了模型对包含大量文本的图像的理解水平。此外,研究人员在监督式微调阶段深入分析了不同数据类型对模型表现的作用,优...……更多
中国石油发布700亿参数昆仑大模型建设成果
...提供“贴心客服”。此外,中国石油还构建了超过280TB的高质量数据集,研发了集团公司集中统一AI中台,算力、模型、应用的统一管理和协同调度能力有效加强;在实践探索中形成“1+4+N”大模型架构体系,提炼“三阶十步”的...……更多
用AI生成的图片有著作权吗?我国首例案件一审宣判:被告侵权,判赔500元
...侵权纠纷一案,作出一审判决。该案是我国首例涉及“AI文生图”著作权的案件,案件庭审曾在央视和多个平台直播,累计吸引了17万网友观看,引发了AI生成内容与著作权之间关系的探讨。一审法院认为,人们利用人工智能模型...……更多
...,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采...……更多
微软推出14b参数“最先进”小型语言模型
...可能性。官方表示,得益于多方面的技术进步,包括采用高质量的合成数据集、精心挑选的高质量有机数据,以及训练后的创新,Phi-4在数学推理方面超越了同类和更大规模的模型。其在数学竞赛问题上的表现超过了包括GeminiPro1...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...只是科技爱好者的美好构想,同时让普通人的AI创作从“文生文”、“文生图”进一步拓展到了“文生视频”。这是否意味着传统广告行业、影视行业乃至更广泛的内容生产者的业务组织形式、工作方式都将被颠覆?3月29日,小...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...、计算量之间的关系。虽然备受质疑,但直到今天,可能高质量的缩放仍然是提高大模型性能的重要方法。“一方面,这几个因素相互关联,参数量更大的语言模型需要更多的高质量数据和训练量,以兼顾文本理解和生成任务上...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...习并模拟自然界中的扩散过程来合成新数据,尤其在生成高质量逼真图像方面相较于其他模型架构具有显著优势。因此,尽管近年来也有基于 GPT 等其它架构的优秀图像、视频生成模型不断涌现,基于扩散模型的架构依然是当前...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...(图像,文本) 数据上进行预训练。接下来,在中等规模的高质量域内和经过知识增强的 (图像,文本) 对数据上进行训练。在后训练阶段,再使用与文本模型类似的方法进行多轮对齐,这会用到监督式微调、拒绝采样和直接偏好...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...手和脚,能够将语音输出转化为多种模态信息,高效完成文生图、文生视频等,且速度行业最快。星睿数字孪生大模型则像是一个“超级元宇宙生成引擎”,拥有完备3D生成技术、数字人AI驱动技术、声音克隆技术,能够快速生...……更多
AI与人争资源怎么破解
...和为数据中心供电的发电厂。OpenAI公司今年年初发布的“文生视频”大模型Sora以惊人的视觉冲击力令全球瞩目,但相关评估认为,为此消耗的算力约是生成文字对话的千倍以上,它在峰值运算时消耗的电力和水资源更是天文数...……更多
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
...专业AI模型的开发人员来说,他们面临的长期挑战是获取高质量的训练数据。较小的专家模型(1-10B 个参数)通常利用蒸馏技术,利用较大模型的输出来增强其训练数据集。然而,使用来自OpenAI等闭源巨头的此类数据受到严格限...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...0GT,主要由 RefinedWeb 数据集组成,并添加了来自公共源的高质量技术数据、代码数据和数学数据。所有数据通过 Falcon-7B/11B 标记器进行 tokenized 操作。 与其他 Falcon 系列模型类似,Falcon Mamba 7B 采用多阶段训练策略进行训练,上...……更多
AI PC是噱头还是更快的马车?
...。而且,这一代核显还支持AV1硬编码,可以更快速地输出高质量、高压缩率的视频。凭借领先的编解码能力,ArcGPU确实在视频剪辑行业积累的良好的口碑。随着矢量引擎能力的大幅度提升,大量内容创作ISV的演示了基于AIPC的更...……更多
更多关于科技的资讯:
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00