• 我的订阅
  • 头条热搜
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...力于赋能多模态大语言模型,使其能够基于条件输入生成高质量的 CAD 模型。与此同时,针对 CAD 模型的拓扑质量、空间封闭性等核心属性,团队还设计了一系列创新的评估指标,为模型性能提供更全面的衡量标准。借助这一技...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...上之前所用的视觉创意、数据和代码作为prompt,生成多个高质量的除了为每个问题生成答案,作者还提示LLM生成能解释答案的「原理」(rationale),以便用于训练模型,起到类似于CoT的作用。整个构建过程的流水线如下图所示:...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...键。“如果未来我们能够与更多专业机构合作,得到更多高质量的音乐训练数据,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型...……更多
不要小看「实而不华」的腾讯 AI
...创作引擎:基于腾讯混元的自研图像创作底层模型,输出高质量的 AI 图像生成和编辑能力,为企业客户提供 AI 写真、线稿生图、图像风格化等能力。视频创作引擎:基于多模态算法技术,输出高质量的视频生成与处理能力,提...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。例如借助“书生2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...声兼备。同时输出带有字幕和封面标签的成品视频,方便一键分享到社媒或好友。对于普通用户,即使不会乐器不懂乐理也可以为Vlog、家庭录像增添背景音乐或创作专属歌曲来表达自己的态度与情感。对于专业人士,唱鸭网页...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...声图像-文本对数据上进行预训练。然后,在中等规模的高质量领域内和知识增强的图像-文本对数据上,再次进行训练。 接着,在后训练阶段采用与文本模型类似的方法,通过监督微调、拒绝采样和直接偏好优化进行多轮对齐...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”、能够记住和用户相处点滴的“小V记忆”功能。流畅方面,原系统5进行了超过1000项流畅体验优化。在系统底层层面,原系统5...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其他数据的供应量正在减少,原本的 Scaling Law(用更多的数据训练更大的模型)可能无以为继。文章发布后,很多人反驳了这一观点,认为 Scaling Law 还没到...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
高通aihub正式发布:支持75个ai模型
...。例如在演示中,模型能够根据不同个人或艺术偏好创建高质量自定义图像。高通表示这一技术不仅能够运用于图像生成,也可以应用于大语言模型等多种生成式AI模型,是实现个性化生成式AI的高效方式。 ……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...在计算机视觉领域,OpenAI推出了DALL-E系列模型,能够生成高质量的图像和艺术作品;在强化学习领域,OpenAI也推出了MuZero等模型,能够在游戏中实现超越人类的表现。未来,OpenAI将继续致力于推动AI技术的发展和应用。公司将不...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...质量参差不齐的现有偏好数据集不同,Align-Anything 提供了高质量的数据,包括了混合输入和输出中的任何模态,旨在提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,从而实现跨模态的全面评估和改进。总的来说,...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...模型微调套件,进一步降低了大模型的开发门槛,并通过一键式微调、低参数调优等提高了开发效率。全模态大模型的“神奇能力”,于开发者而言不再遥不可及。03 大模型的价值在“落地”也许就现阶段而言,还无法为开源和...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允许用户自己上传或从一系列预加载的示例中选择图像,...……更多
...新,增强核心竞争力,积极服务数字中国建设,不断开创高质量发展新局面。 ……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...0个身份数据集进行可视化。 最终可以看到,ConsistentID在高质量生成、灵活的可编辑性和强大的身份保真度方面表现出更强大的能力。而在定量评估中,在大多数评估指标中,ConsistentID始终优于其他方法,并且在生成效率方面超...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。将来,通过更强、更统一的算法,更高性能的算力和更高质量的大规模数据,整个AIGC的内容生成还将有质的提升。一方面,和语言模型有更加深度结合,提供更强的语言交互,用户可以通过语言更好更便捷的进行创作。第二...……更多
华人团队爆火instructblip抢跑看图聊天
...另外,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。还有LLaVA,是用一个小的多模态指令数据集训练的,但它在一些示例上展示了与多模态模型GPT-4非常相似的推理结果。 ……更多
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...的创新平台WorldEngine,让创作者“一键成剧”,轻松制作高质量AI视频。Melodio产品展示 Mureka商业化展示AI社交产品Linky功能展示 商业化侧,天工大模型通过与众多企业如电信运营商、主流手机厂商、金融机构、头部短视频平台...……更多
...练大语言模型,国内科技界和产业界的当务之急,是开发出高质量的大模型,在此基础上发展产业生态就会有很大潜力。本报综合 ……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...对所有的架构来说都是如此。值得注意的是,研究人员将高质量的纯文本数据集精心整合到多模态训练中,并辅以大量的多模态数学和推理数据,从而在各个模态上增强了数学和编码能力,使其在视觉-语言任务上表现出色的同...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...全方位支持。“坤元”通过深度学习320亿词元及4万余条高质量地理学指令,构建了深厚的地理学语言基础。与通用语言大模型相比,它在地理学专业术语、领域知识及语言模式上的熟悉度显著提升,使得在地理学基准测试集上...……更多
更多关于科技的资讯:
今日起 华为2025届校招陆续放榜
据华为招聘官方介绍,11月30日起,华为2025届应届生招聘录用意向书陆续发放。华为称,将通过邮件发送录用意向书,参与的同学敬请留意
2024-11-30 13:34:00
一男子恶意“找回”游戏账号被抓:行政拘留8天
快科技11月30日消息,近日,一男子卖了游戏账号又恶意用身份证“找回”,结果被抓了。据乐山警方介绍,近期峨眉山市公安局名山派出所接到范某某报警称
2024-11-30 14:04:00
博主建议国产新能源暂时不要碰跑车:不是老百姓消费的东西
快科技11月30日消息,国产新能源蓬勃发展,从几万到上百万都有产品布局,甚至还涌现了如仰望U9、昊铂SSR等百万级超跑
2024-11-30 14:04:00
鱼台县开展智慧化工厂生态渔业养殖,改变传统的依靠人力和经验的渔业管理模式,将工程技术、机械设备、监控仪表、管理软件和无线传感网络等现代技术手段用于渔业生产
2024-11-30 14:17:00
女孩边充电边玩手机突然被电瘫 手脚都肿了
日前,浙江一名女孩在客厅充电的同时玩手机,突然遭遇电击,瞬间瘫倒在沙发上,痛苦地尖叫起来。幸亏孩子的爷爷及时在场,迅速拔掉了电源线
2024-11-30 14:34:00
海洋主题VR沉浸展《深海奇遇》即将开业
本文转自:人民日报中央厨房-大有文化工作室随着当今技术的进步和文化内容创意的提升,VR大空间已经成为中国数字文化和文旅产业的重要组成部分
2024-11-30 16:01:00
本文转自:人民网-湖北频道11月29日,第二届武汉技术经理人大赛复赛火热开赛。21名选手从217名初赛选手中突出重围,在一场形式新颖的复赛中
2024-11-30 16:38:00
50岁林志玲晒新照引围观 与儿子庆生画面有爱:网友感慨少女感满满
11月30日消息,近日,知名影星林志玲在微博晒出了自己与儿子的合照,并发文庆祝自己的50岁生日,照片里的林志玲身着白色服装
2024-11-30 08:04:00
REDMI K80维修备件价格出炉:2K屏610元、电池119元
快科技11月30日消息,REDMI K80系列已经上市,首销一天时间就卖出了66万台,提前预定同档最强。尤其这次全系标配了顶级护眼2K屏
2024-11-30 08:04:00
印度指控大众汽车逃税14亿美元
快科技11月30日消息,海外媒体报道,印度海关文件显示,印度已向大众汽车公司发出通知,指控其“故意”少缴奥迪、大众和斯柯达汽车零部件的进口税
2024-11-30 08:34:00
俞敏洪称新东方教室100%是格力空调 用了20年:董明珠曾称不买格力是傻瓜
快科技11月30日消息,新东方创始人、东方甄选CEO俞敏洪公开表示,新东方教室100%是格力空调。俞敏洪表示,新东方的教室100%是格力空调
2024-11-30 09:04:00
形状像根葱 天津上空出现神秘绿光疑是UFO:官方揭秘
快科技11月30日消息,近日,网传天津出现不明飞行物(UFO),散发绿色的光芒,瞅着像“天上一根葱”。那么它的真实身份是什么
2024-11-30 09:04:00
90天免费试用!荣事达加热按摩足浴盆34元起
天冷一泡去疲劳,荣事达加热按摩足浴盆报价 138 元起,限时限量 99 元券,实付 39 元起包邮。购买链接:天猫(券后39元)经典款(旋钮标准款)此价
2024-11-30 10:04:00
深圳彩民80元中双色球2.25亿巨奖尚未兑奖上热搜:网友直呼走上人生巅峰
11月30日消息,深圳一彩民80元中双色球2.25亿巨奖上了热搜,不少网友看后纷纷感慨,这是直接到达了人生巅峰。“太激动了
2024-11-30 10:04:00
重型运载火箭制经费不足:俄罗斯推迟载人登月计划
快科技11月30日消息,在青年科学家大会上,俄罗斯国家航天集团Roscosmos顾问奥列格·戈尔什科夫宣布,由于研发俄罗斯超重型火箭的资金有限
2024-11-30 10:04:00