• 我的订阅
  • 头条热搜
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...力于赋能多模态大语言模型,使其能够基于条件输入生成高质量的 CAD 模型。与此同时,针对 CAD 模型的拓扑质量、空间封闭性等核心属性,团队还设计了一系列创新的评估指标,为模型性能提供更全面的衡量标准。借助这一技...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...上之前所用的视觉创意、数据和代码作为prompt,生成多个高质量的除了为每个问题生成答案,作者还提示LLM生成能解释答案的「原理」(rationale),以便用于训练模型,起到类似于CoT的作用。整个构建过程的流水线如下图所示:...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...键。“如果未来我们能够与更多专业机构合作,得到更多高质量的音乐训练数据,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型...……更多
不要小看「实而不华」的腾讯 AI
...创作引擎:基于腾讯混元的自研图像创作底层模型,输出高质量的 AI 图像生成和编辑能力,为企业客户提供 AI 写真、线稿生图、图像风格化等能力。视频创作引擎:基于多模态算法技术,输出高质量的视频生成与处理能力,提...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...声兼备。同时输出带有字幕和封面标签的成品视频,方便一键分享到社媒或好友。对于普通用户,即使不会乐器不懂乐理也可以为Vlog、家庭录像增添背景音乐或创作专属歌曲来表达自己的态度与情感。对于专业人士,唱鸭网页...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...声图像-文本对数据上进行预训练。然后,在中等规模的高质量领域内和知识增强的图像-文本对数据上,再次进行训练。 接着,在后训练阶段采用与文本模型类似的方法,通过监督微调、拒绝采样和直接偏好优化进行多轮对齐...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”、能够记住和用户相处点滴的“小V记忆”功能。流畅方面,原系统5进行了超过1000项流畅体验优化。在系统底层层面,原系统5...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其他数据的供应量正在减少,原本的 Scaling Law(用更多的数据训练更大的模型)可能无以为继。文章发布后,很多人反驳了这一观点,认为 Scaling Law 还没到...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
高通aihub正式发布:支持75个ai模型
...。例如在演示中,模型能够根据不同个人或艺术偏好创建高质量自定义图像。高通表示这一技术不仅能够运用于图像生成,也可以应用于大语言模型等多种生成式AI模型,是实现个性化生成式AI的高效方式。 ……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...在计算机视觉领域,OpenAI推出了DALL-E系列模型,能够生成高质量的图像和艺术作品;在强化学习领域,OpenAI也推出了MuZero等模型,能够在游戏中实现超越人类的表现。未来,OpenAI将继续致力于推动AI技术的发展和应用。公司将不...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...质量参差不齐的现有偏好数据集不同,Align-Anything 提供了高质量的数据,包括了混合输入和输出中的任何模态,旨在提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,从而实现跨模态的全面评估和改进。总的来说,...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...轻量级的轨迹信息模型,能以较低的延迟和模型大小产生高质量的结果。他们的想法基于重新审视普通、非层次化的视觉 Transformer(ViT),将其作为用于视频对象分割的图像编码器,并引入高效内存模块,从而降低帧特征提取和...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允许用户自己上传或从一系列预加载的示例中选择图像,...……更多
...新,增强核心竞争力,积极服务数字中国建设,不断开创高质量发展新局面。 ……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...0个身份数据集进行可视化。 最终可以看到,ConsistentID在高质量生成、灵活的可编辑性和强大的身份保真度方面表现出更强大的能力。而在定量评估中,在大多数评估指标中,ConsistentID始终优于其他方法,并且在生成效率方面超...……更多
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...的创新平台WorldEngine,让创作者“一键成剧”,轻松制作高质量AI视频。Melodio产品展示 Mureka商业化展示AI社交产品Linky功能展示 商业化侧,天工大模型通过与众多企业如电信运营商、主流手机厂商、金融机构、头部短视频平台...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...对所有的架构来说都是如此。值得注意的是,研究人员将高质量的纯文本数据集精心整合到多模态训练中,并辅以大量的多模态数学和推理数据,从而在各个模态上增强了数学和编码能力,使其在视觉-语言任务上表现出色的同...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...全方位支持。“坤元”通过深度学习320亿词元及4万余条高质量地理学指令,构建了深厚的地理学语言基础。与通用语言大模型相比,它在地理学专业术语、领域知识及语言模式上的熟悉度显著提升,使得在地理学基准测试集上...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...叙事的完整性,就必须在这些核心元素上实现全面可控。一键生成32秒视频生数科技上一次对外发声是在今年4月,清华大学人工智能研究院副院长、生数科技联合创始人兼首席科学家朱军教授发布了长时长、高一致性、高动态性...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...图生视频对创意生产力带来的解放,更期待AI在3D领域的高质量生成能力”。 作为AI领域的知识博主和模型训练师,娜乌斯嘉认为,AI在视频生成领域归结为四类场景:原视频风格转化、瞬息全宇宙、图生视频、场景转换视频。...……更多
更多关于科技的资讯:
全球首款AMD Zen5模块化掌机!AYANEO 3可以随心换
快科技12月26日消息,AMD虽然为新一代掌机定制了锐龙Z2系列处理器,但还是有很多厂商盯上了更强大的锐龙AI 9 HX 370
2024-12-26 10:07:00
任天堂Switch2真机曝光:U形支架、磁吸Joy-Con接口
据报道,备受瞩目的任天堂Switch 2游戏掌机外观设计近日曝光。新主机巧妙地融入了U形支架设计,并引入了创新的磁吸式Joy-Con接口
2024-12-26 10:07:00
理想同学AI大模型APP抢鲜体验:识物精准、语音交互流畅
快科技12月26日消息,在2024理想AI Talk上,李想宣布,理想同学进入手机,APP将于12月27日上线。博主旌旗超智能抢先体验了理想同学APP的内测版本
2024-12-26 10:07:00
山东国新粮油发展集团有限公司:持续优化营销举措 与经销商伙伴合作共赢
大众网记者 李雪 李可欣 刘磊 枣庄报道12月25日,抱犊酱醋系列产品喜获国家级“一品牌两称号”发布会在枣庄传媒中心举行
2024-12-26 10:15:00
聚焦多元金融服务 助力数字强省建设 山东建行亮相第十六届信博会
大众网·海报新闻记者 张璐 济南报道12月22日上午,第十六届(济南)国际信息技术博览会暨2024中国(济南)数字经济高端峰会在济南黄河国际会展中心开幕
2024-12-26 10:16:00
努比亚focus25g通过相关认证,细节泄露
近日,努比亚Focus25G已通过相关认证,其关键细节也随之泄露。这款新机型号为Z2462N,设计上延续了今年早些时候发布的努比亚Focus初代的风格
2024-12-26 10:33:00
打造冰雪大事件!天猫如何用「超级派对」助力品牌破圈增长?
从“人生是旷野”、“勇敢的人先享受世界”到“人就应该生活在没有天花板的地方”,充满“passion”的标语是年轻人向枯燥生活的宣战
2024-12-26 10:34:00
苹果airtag智能追踪器将于2025年中期推出
据外媒报道,苹果新的AirTag智能追踪器——AirTag2,将于2025年中期推出。目前的AirTag于2021年4月首次亮相
2024-12-26 10:34:00
全球化与合规双驱动:BYDFi正式加入韩国CODEVASP联盟
BYDFi 加密货币交易所于2024年11月27日完成了里程碑式的合规突破 — 正式入驻韩国CODE VASP联盟。此举不仅提升了BYDFi在韩国市场的合规可信度
2024-12-26 10:34:00
联发科最强芯!天玑9400+明年见:OPPO Find X8S首批搭载
快科技12月26日消息,博主数码闲聊站爆料,联发科会在明年上半年带来天玑9400+,OPPO Find X8S首批搭载使用
2024-12-26 10:37:00
惠普Omen Max 16游戏本曝光!用上全新酷睿Ultra 9 275HX+RTX 5080
快科技12月26日消息,惠普即将推出的Omen Max 16游戏笔记本电脑配置信息被曝光,将搭载英特尔最新的Arrow Lake-HX处理器和英伟达GeForce RTX 50系列显卡
2024-12-26 10:37:00
余承东:问界M9对得起那四个字
快科技12月26日消息,鸿蒙智行宣布,鸿蒙智行全景智慧旗舰SUV问界M9成为中国新能源汽车里程碑产品,上市一年累计大定突破200000台
2024-12-26 10:37:00
全球首台!中国30MW级纯氢燃气轮机“木星一号”点火成功
12月22日,全球首台30MW(兆瓦)级纯氢燃气轮机“木星一号”整机试验首次点火成功,这也是目前全球单机功率最大的纯氢发电机组
2024-12-26 10:37:00
靠微信“送礼物”股价暴涨的微盟:五年亏损50亿 用户营收双双锐减
快科技12月26日消息,近日,微信小店开启“送礼物”功能灰度测试,除珠宝、教育培训类目,且商品款式原价不得高于1万元的商品将默认支持“送礼物”功能
2024-12-26 10:37:00
比亚迪出海痛击巨鳄
快科技12月26日消息,高速上遇到动物不稀奇,比如狗、猫,甚至是狼,但如果是一台大鳄鱼呢?近日,有位于马来西亚的比亚迪车主就遭遇了这样极其罕见的情况
2024-12-26 10:37:00