• 我的订阅
  • 头条热搜
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...力于赋能多模态大语言模型,使其能够基于条件输入生成高质量的 CAD 模型。与此同时,针对 CAD 模型的拓扑质量、空间封闭性等核心属性,团队还设计了一系列创新的评估指标,为模型性能提供更全面的衡量标准。借助这一技...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...上之前所用的视觉创意、数据和代码作为prompt,生成多个高质量的除了为每个问题生成答案,作者还提示LLM生成能解释答案的「原理」(rationale),以便用于训练模型,起到类似于CoT的作用。整个构建过程的流水线如下图所示:...……更多
星环科技Sophon 3.2发布,通过“六易三仓两中心”实现新一代AI平民化
...供的样本仓功能模块,可实现对数据的精细化管理,输出高质量多模数据,驱动高质量模型的迭代。图:Sophon样本仓库样本仓库支持数据接入、智能标签和数据洞察。样本仓库支持文本、视频、图像、时间序列等多模态的数据统...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...键。“如果未来我们能够与更多专业机构合作,得到更多高质量的音乐训练数据,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型...……更多
不要小看「实而不华」的腾讯 AI
...创作引擎:基于腾讯混元的自研图像创作底层模型,输出高质量的 AI 图像生成和编辑能力,为企业客户提供 AI 写真、线稿生图、图像风格化等能力。视频创作引擎:基于多模态算法技术,输出高质量的视频生成与处理能力,提...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。例如借助“书生2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...声兼备。同时输出带有字幕和封面标签的成品视频,方便一键分享到社媒或好友。对于普通用户,即使不会乐器不懂乐理也可以为Vlog、家庭录像增添背景音乐或创作专属歌曲来表达自己的态度与情感。对于专业人士,唱鸭网页...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...声图像-文本对数据上进行预训练。然后,在中等规模的高质量领域内和知识增强的图像-文本对数据上,再次进行训练。 接着,在后训练阶段采用与文本模型类似的方法,通过监督微调、拒绝采样和直接偏好优化进行多轮对齐...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”、能够记住和用户相处点滴的“小V记忆”功能。流畅方面,原系统5进行了超过1000项流畅体验优化。在系统底层层面,原系统5...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其他数据的供应量正在减少,原本的 Scaling Law(用更多的数据训练更大的模型)可能无以为继。文章发布后,很多人反驳了这一观点,认为 Scaling Law 还没到...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
高通aihub正式发布:支持75个ai模型
...。例如在演示中,模型能够根据不同个人或艺术偏好创建高质量自定义图像。高通表示这一技术不仅能够运用于图像生成,也可以应用于大语言模型等多种生成式AI模型,是实现个性化生成式AI的高效方式。 ……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...在计算机视觉领域,OpenAI推出了DALL-E系列模型,能够生成高质量的图像和艺术作品;在强化学习领域,OpenAI也推出了MuZero等模型,能够在游戏中实现超越人类的表现。未来,OpenAI将继续致力于推动AI技术的发展和应用。公司将不...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...质量参差不齐的现有偏好数据集不同,Align-Anything 提供了高质量的数据,包括了混合输入和输出中的任何模态,旨在提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,从而实现跨模态的全面评估和改进。总的来说,...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...模型微调套件,进一步降低了大模型的开发门槛,并通过一键式微调、低参数调优等提高了开发效率。全模态大模型的“神奇能力”,于开发者而言不再遥不可及。03 大模型的价值在“落地”也许就现阶段而言,还无法为开源和...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允许用户自己上传或从一系列预加载的示例中选择图像,...……更多
...新,增强核心竞争力,积极服务数字中国建设,不断开创高质量发展新局面。 ……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...0个身份数据集进行可视化。 最终可以看到,ConsistentID在高质量生成、灵活的可编辑性和强大的身份保真度方面表现出更强大的能力。而在定量评估中,在大多数评估指标中,ConsistentID始终优于其他方法,并且在生成效率方面超...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。将来,通过更强、更统一的算法,更高性能的算力和更高质量的大规模数据,整个AIGC的内容生成还将有质的提升。一方面,和语言模型有更加深度结合,提供更强的语言交互,用户可以通过语言更好更便捷的进行创作。第二...……更多
华人团队爆火instructblip抢跑看图聊天
...另外,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。还有LLaVA,是用一个小的多模态指令数据集训练的,但它在一些示例上展示了与多模态模型GPT-4非常相似的推理结果。 ……更多
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...的创新平台WorldEngine,让创作者“一键成剧”,轻松制作高质量AI视频。Melodio产品展示 Mureka商业化展示AI社交产品Linky功能展示 商业化侧,天工大模型通过与众多企业如电信运营商、主流手机厂商、金融机构、头部短视频平台...……更多
...练大语言模型,国内科技界和产业界的当务之急,是开发出高质量的大模型,在此基础上发展产业生态就会有很大潜力。本报综合 ……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...对所有的架构来说都是如此。值得注意的是,研究人员将高质量的纯文本数据集精心整合到多模态训练中,并辅以大量的多模态数学和推理数据,从而在各个模态上增强了数学和编码能力,使其在视觉-语言任务上表现出色的同...……更多
更多关于科技的资讯:
江南时报讯 近年来,建湖农商银行积极响应省联社号召,不断优化移动展业平台功能,提供流程、岗位、调查、效率、风控、预授信和贷后管理支撑
2024-11-27 22:31:00
江南时报讯 近年来,东海农商银行始终秉持“服务地方经济、服务中小企业、服务城乡居民”的理念,坚持深耕东海、服务三农,积极探索具有东海特色
2024-11-27 22:32:00
一切皆可搜!360发布“纳米搜索”:开启搜索3.0时代
快科技11月27日消息,360今晚正式发布多模态内容创作引擎“纳米搜索”,知名脱口秀演员李雪琴和徐志胜成为纳米搜索声音大使
2024-11-27 22:32:00
85英寸杀到4000元!REDMI智能电视X 2025开售:还是240Hz高刷
快科技11月27日消息,Redmi智能电视X 2025系列现已正式开售,到手价仅为2199元起。85英寸也仅4799元
2024-11-27 22:32:00
支持4C超快充技术!smart精灵#5中型SUV正式开启交付
快科技11月27日消息,smart品牌旗下纯电动中型SUV——smart精灵#5现已正式开启交付。该车型自10月27日上市以来
2024-11-27 23:02:00
本文转自:人民网-江苏频道11月26日,徐工与网易在2024上海宝马工程机械展上签署战略合作协议,双方发布了行业首个搅拌站场景下无人装载机“黑灯工地”和露天矿山场景挖掘机一人多机“牧羊人”模式
2024-11-27 23:27:00
关系我们健康安全的电器产品标准--GB 4706.1标准介绍
为啥需要这个标准我们的市场上充斥着形形色色的产品,有着各种用途,而家电是与我们密切相关的一类产品,我们用的热水器、电饭煲
2024-11-27 23:31:00
本文转自:人民日报海外版《人民日报海外版》(2024年11月28日第 02 版)本报南宁11月27日电 (记者庞革平)近日
2024-11-28 04:17:00
本文转自:人民日报海外版《人民日报海外版》(2024年11月28日第 11 版)本报电 (袁子茗)日前,2024少儿出版市场年会在广西南宁举办
2024-11-28 04:18:00
Redmi K80 Pro性能拉满!王腾直呼“狂暴辣 完爆13香”
快科技11月27日消息,今晚,Redmi K80 Pro正式发布,这款新机以其强大的性能和出色的设计引起了广泛关注。发布会上
2024-11-27 20:02:00
REDMI首次!K80 Pro搭载超声波屏幕指纹
快科技11月27日消息,K80 Pro这次搭载了超声波屏幕指纹识别,是REDMI品牌首次配备。超声波指纹识别原理是手指按压屏幕
2024-11-27 20:02:00
美女产品经理来了!馨心登台主讲REDMI K80 Pro外观设计
快科技11月27日消息,REDMI全新产品经理馨心上台主讲K80 Pro外观设计,这次新机的设计也与她之前负责的Civi系列有异曲同工之妙
2024-11-27 20:02:00
理想汽车首个国产自研CFRT材料下线 2025年L系列车型率先搭载
快科技11月27日消息,理想汽车与劳士领、福瑞科合作开发的首个国产自研CFRT(连续纤维增强热塑性复合材料)在昆山工厂成功下线
2024-11-27 20:02:00
荣耀赵明和华为余承东的“恩爱”名场面:英雄果然都是惺惺相惜
快科技11月27日讯,据媒体报道,今日下午,荣耀CEO赵明在直播中针对“余承东称靠抄袭是没有未来的”这一观点,他表示:同意余总的观点
2024-11-27 20:02:00
REDMI推出后悔宝:友商骁龙8至尊版机型最高加1000回收
快科技11月27日消息,今晚,备受期待的REDMI K80 Pro正式发布,其起售价仅为3699元,相较于市场上其他友商普遍4000元的起售价格
2024-11-27 20:32:00