• 我的订阅
  • 头条热搜
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...力于赋能多模态大语言模型,使其能够基于条件输入生成高质量的 CAD 模型。与此同时,针对 CAD 模型的拓扑质量、空间封闭性等核心属性,团队还设计了一系列创新的评估指标,为模型性能提供更全面的衡量标准。借助这一技...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...上之前所用的视觉创意、数据和代码作为prompt,生成多个高质量的除了为每个问题生成答案,作者还提示LLM生成能解释答案的「原理」(rationale),以便用于训练模型,起到类似于CoT的作用。整个构建过程的流水线如下图所示:...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...键。“如果未来我们能够与更多专业机构合作,得到更多高质量的音乐训练数据,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型...……更多
不要小看「实而不华」的腾讯 AI
...创作引擎:基于腾讯混元的自研图像创作底层模型,输出高质量的 AI 图像生成和编辑能力,为企业客户提供 AI 写真、线稿生图、图像风格化等能力。视频创作引擎:基于多模态算法技术,输出高质量的视频生成与处理能力,提...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...声兼备。同时输出带有字幕和封面标签的成品视频,方便一键分享到社媒或好友。对于普通用户,即使不会乐器不懂乐理也可以为Vlog、家庭录像增添背景音乐或创作专属歌曲来表达自己的态度与情感。对于专业人士,唱鸭网页...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。例如借助“书生2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...声图像-文本对数据上进行预训练。然后,在中等规模的高质量领域内和知识增强的图像-文本对数据上,再次进行训练。 接着,在后训练阶段采用与文本模型类似的方法,通过监督微调、拒绝采样和直接偏好优化进行多轮对齐...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”、能够记住和用户相处点滴的“小V记忆”功能。流畅方面,原系统5进行了超过1000项流畅体验优化。在系统底层层面,原系统5...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其他数据的供应量正在减少,原本的 Scaling Law(用更多的数据训练更大的模型)可能无以为继。文章发布后,很多人反驳了这一观点,认为 Scaling Law 还没到...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
高通aihub正式发布:支持75个ai模型
...。例如在演示中,模型能够根据不同个人或艺术偏好创建高质量自定义图像。高通表示这一技术不仅能够运用于图像生成,也可以应用于大语言模型等多种生成式AI模型,是实现个性化生成式AI的高效方式。 ……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...在计算机视觉领域,OpenAI推出了DALL-E系列模型,能够生成高质量的图像和艺术作品;在强化学习领域,OpenAI也推出了MuZero等模型,能够在游戏中实现超越人类的表现。未来,OpenAI将继续致力于推动AI技术的发展和应用。公司将不...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...质量参差不齐的现有偏好数据集不同,Align-Anything 提供了高质量的数据,包括了混合输入和输出中的任何模态,旨在提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,从而实现跨模态的全面评估和改进。总的来说,...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...模型微调套件,进一步降低了大模型的开发门槛,并通过一键式微调、低参数调优等提高了开发效率。全模态大模型的“神奇能力”,于开发者而言不再遥不可及。03 大模型的价值在“落地”也许就现阶段而言,还无法为开源和...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...轻量级的轨迹信息模型,能以较低的延迟和模型大小产生高质量的结果。他们的想法基于重新审视普通、非层次化的视觉 Transformer(ViT),将其作为用于视频对象分割的图像编码器,并引入高效内存模块,从而降低帧特征提取和...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允许用户自己上传或从一系列预加载的示例中选择图像,...……更多
...新,增强核心竞争力,积极服务数字中国建设,不断开创高质量发展新局面。 ……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...0个身份数据集进行可视化。 最终可以看到,ConsistentID在高质量生成、灵活的可编辑性和强大的身份保真度方面表现出更强大的能力。而在定量评估中,在大多数评估指标中,ConsistentID始终优于其他方法,并且在生成效率方面超...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。将来,通过更强、更统一的算法,更高性能的算力和更高质量的大规模数据,整个AIGC的内容生成还将有质的提升。一方面,和语言模型有更加深度结合,提供更强的语言交互,用户可以通过语言更好更便捷的进行创作。第二...……更多
华人团队爆火instructblip抢跑看图聊天
...另外,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。还有LLaVA,是用一个小的多模态指令数据集训练的,但它在一些示例上展示了与多模态模型GPT-4非常相似的推理结果。 ……更多
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...的创新平台WorldEngine,让创作者“一键成剧”,轻松制作高质量AI视频。Melodio产品展示 Mureka商业化展示AI社交产品Linky功能展示 商业化侧,天工大模型通过与众多企业如电信运营商、主流手机厂商、金融机构、头部短视频平台...……更多
...练大语言模型,国内科技界和产业界的当务之急,是开发出高质量的大模型,在此基础上发展产业生态就会有很大潜力。本报综合 ……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...对所有的架构来说都是如此。值得注意的是,研究人员将高质量的纯文本数据集精心整合到多模态训练中,并辅以大量的多模态数学和推理数据,从而在各个模态上增强了数学和编码能力,使其在视觉-语言任务上表现出色的同...……更多
更多关于科技的资讯:
明星大咖云集:央视跨年晚会节目单公布
12月31日消息,据媒体报道,《启航2025——中央广播电视总台跨年晚会》节目单正式出炉,这档晚会将于晚上8点正式播出
2024-12-31 18:41:00
卫星直击179人遇难的韩国济州空难:机场大片被熏黑
当地时间2024年12月29日上午9时许,韩国济州航空公司一架客机在降落中飞机发生鸟击,降落时冲出跑道,与跑道尽头的围墙等设施发生碰撞
2024-12-31 18:41:00
抖音李亮:字节70亿美元购买英伟达芯片不实 张一鸣从未参与算力采购和数据中心建设
快科技12月31日消息,针对今日媒体报道的字节跳动70亿美元购买英伟达芯片的消息,抖音集团副总裁李亮回应称,相关报道多处不实且数字不准确
2024-12-31 18:41:00
华为鸿蒙智行官宣入驻天猫京东!全系车型都将上架
快科技12月31日消息,今天鸿蒙智行官方宣布入驻天猫、京东两大电商平台,对应的官方旗舰店也在今天正式开业。店铺内上架了包含近期刚上市的享界S9
2024-12-31 18:41:00
胖东来:明日起 自有品牌部分商品调整为同城线上限购销售
快科技12月31日消息,据媒体报道,今日,胖东来发布通知称,胖东来超市自有品牌部分商品调整为同城线上限购销售,凭会员账号每周每个单品按照限购数量购买一次
2024-12-31 18:41:00
沪渝蓉沿江高铁最后一段宜昌至涪陵正式开工:全程时速350公里
国铁集团官方宣布,12月31日,赶在2024年的最后一天,沪渝蓉沿江高铁宜昌至涪陵段(沿江高铁宜涪段)正式开工建设!沿江高铁宜涪段起自在建的沪渝蓉沿江高铁武汉至宜昌段宜昌北站
2024-12-31 19:12:00
赵明:荣耀12月海外销量占比突破50%!真正成为国际化企业
快科技12月31日消息,今天,荣耀CEO赵明在微博上发布了管理团队新年致辞。赵明透露,在今年12月,荣耀的海外销量占比突破50%
2024-12-31 19:12:00
大嘴猴5A级抗菌秋裤到手19元:锁温保暖 赠退货宝
大嘴猴5A秋裤原价46元,下单领取优惠券,到手价为19元。购买链接:天猫(券后19元)这款秋裤采用远红外热感升温科技,面料纤维吸收远红外线光波
2024-12-31 19:12:00
售价1.5亿!宝骏E100计划登陆越南:将成当地市场最便宜的车
快科技12月31日消息,据媒体报道,TMT汽车与上汽通用五菱合资公司达成协议,将三款小型低成本电动汽车Baojun Yep
2024-12-31 19:12:00
购物狂欢、电音跨年、烟花秀……元旦假期济南商场活动缤纷来袭
元旦假期,济南多家商场购物中心不断“上新”,超多福利与精彩活动吸引潮流一代前往现场打卡。消费抽大奖、DJ电音倒数跨年、新春启幕跑
2024-12-31 19:21:00
近日,交通运输部科技司组织综合交通运输大数据专项交通强国建设试点两项试点任务验收工作,高德地图承担的“综合交通大数据提升综合交通运输服务便捷化”任务顺利通过验收
2024-12-31 19:38:00
美女COS《剑星》伊芙:身材完美还原
日前,国外美女@Abi Aikou分享了其COS《剑星》伊芙的最新作品。据称服装灵感来自游戏更新的假日兔子战衣,这套服装完美的展示了Coser的性感身材
2024-12-31 19:42:00
罗技ERGO M575 S鼠标首发269元:配备无线轨迹球
快科技12月31日消息,罗技ERGO M575 S鼠标目前已经上市,首发269元。据介绍,罗技ERGO M575 S由罗技Ergo Lab的专家开发研制
2024-12-31 19:42:00
四川一长寿老人喜迎124岁生日:现已六世同堂 每天必食用猪油
快科技12月31日消息,据媒体报道,今日,在四川省南充市南部县花罐镇柴氏祠村,一位名叫邱柴氏老人迎来她的124岁生日。据了解
2024-12-31 19:42:00
2149元 蓝戟Intel Arc B580 Tri OC显卡终于开售!目前仅在中国销售
快科技12月31日消息,前不久蓝戟正式发布了全新Intel Arc 580系列显卡,共推出了ARC B580 PHOTON
2024-12-31 19:42:00