• 我的订阅
  • 头条热搜
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...OpenAI的Sora。Veo能够根据文字、图片和视频的提示来生成高质量的1080p视频,创作“一致且连贯”的镜头,用户可以对光照、镜头语言、视频颜色风格等进行自定义设置。不过,谷歌没有宣布Veo的具体推出时间。来源:谷歌I/O主题...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
...的含义,Motiff妙多大模型通过人工标注等方式收集了大量高质量的 UI 领域数据,能理解并指出同一图标在不同界面中的多种含义,显著提升了描述的准确度和情境相关性。图1数据由谷歌ScreenAI生成,将心形图标错误地理解为“...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...选择基于扩散模型、文本和掩码的图像编辑方法、以及多模态大型语言模型(MLLMs) 进行实现,并设计了简约实用的用户界面。MagicQuill的具体构成一起来看看MagicQuill系统的具体构成是什么样的。主要分为3个部分:1.编辑处理器...……更多
麦芒30手机震撼发布!迈向AI时代,麦芒无畏生长
...智能终端”规模普及,为加快打造新质生产力、扎实推进高质量发展作出更大贡献!责任编辑:任芯仪(EN063) ……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...端语音克隆方案,自研完善音色克隆TTS技术。该方案通过高质量音频数据收集处理,在模型中加入alignment loss对齐模块、语言学信息、prosody encoder模块等,再经过云端推理优化,系统地提升了音频合成的自然度、相似度和多样性...……更多
多元化征途中的美图,​AI能否助其“一键变美”逆袭?
来源:山东商报·速豹新闻网近年来,生成式人工智能(AIGC)频频出圈。日前,一款“丑到掉渣”的黏土风格滤镜攻占了各大社交平台。而继“始作俑者” AI 图像软件Remini 的单日下载量飙升到接近 40 万次后,“女神概念第一...……更多
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
...发者必须自己完成的大量繁重工作,从而让开发者能构建高质量的AI应用。OpenAI介绍,这种API是为了灵活性设计,用例范围包括基于自然语言的数据分析应用、编码助手、AI驱动的假期规划器、语音控制的 DJ、智能视觉画布。支...……更多
2024年投资展望丨AI、MR、短剧等概念爆发,传媒板块去年逆市涨近17%
...长城证券指出,随着AI应用发展,B端、C端用户均可实现高质量、低成本的图像、视频以及3D视频的制作,逐步打开AI多模态应用想象空间,有望赋能影视、营销、游戏等传媒行业细分板块,助力其降本增效。整体来看,机构多数...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...通过大规模使用AIGC在多模态方面的能力,提高国际酒店高质量视频覆盖、沉淀满足实际业务诉求的平台AI能力?紫东太初多模态大模型有哪些创新实践?它的技术趋势展望与思考是什么?在多模态AIGC前沿探索专题,来自竞技世...……更多
大模型到了该「验收」的时候
...,重症大模型能够将重症治疗中沉淀出的海量医生经验与高质量医学文献结合,通过迅速预测病情演进帮助医生辅助决策,还能辅助病历撰写、患者信息检索、重症知识检索等环节,将医生从繁琐的机械性工作中解放出来,“把...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...//huggingface.co/rain1011/pyramid-flow-sd3一、金字塔流匹配算法:高质量AI视频新技术,逐层提高分辨率文生视频领域有一个非常难的技术挑战,就是如何有效地处理和生成高维度的视频数据。针对这一技术挑战,Pyramid Flow研发团队提出...……更多
...迹自动规划方法,按无人机巡检飞行距离、标准拍照顺序一键生成巡检航线,无人机按照航线高精度飞行,保证了巡检安全性以及图像采集的规范性、准确性,单塔巡检时间由30分钟降低至8分钟。无人机执行巡检任务时,采集的...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...一个30B参数的Transformer模型,可以从单个文本提示,生成高质量的高清图像和视频,视频为1080P、16秒、每秒16帧。一同推出的还有Movie Gen Audio。这是一个13B参数的Transformer模型。通过视频输入和文本提示,它就可以可控性生成和...……更多
多模态AI午前大涨,游戏ETF半日涨幅近4%
今日午前,多模态AI题材午前崛起,Sora方向领涨,其中,游戏ETF(516010)和游戏ETF(159869)半日涨幅分别达到3.95%和3.93%,领涨整个ETF市场。投资逻辑方面,日前,谷歌发布了基础世界模型Genie,Genie是一个110亿参数的基础世界模...……更多
Galaxy S24系列上线大模型!三星:不排除未来Galaxy AI收费的可能性
...面,AI助手可以识别图像内容,给予用户优化建议,包括一键消除照片中倒影,可实现识别主体,并进行移动、消除或者生成相似画面进行填充等操作。此外,三星还与Google在图像识别并搜索方面进行合作,通过全新搜索工具,...……更多
...一键图像增强技术,部分技术已拓展到视频领域,能生成高质量的视频内容。 其二,是对前沿技术的敏感。段江分享了一个小故事,2022年,公司就注意到国外扩散模型(Diffusion Model)技术的发展,意识到这种能根据文本描述生...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...足多样化的语音合成需求。此外,方言语料库的稀缺以及高质量标注数据的匮乏,也进一步增加了技术难度。 巨人网络 AI Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...模型头部玩家VAST更新了旗下的大模型Tripo,是基于千万级高质量原生自有数据库训出来的那种超强版本。而3D生成新工具的玩法也更进一步,文字、单图、多图都能作为输入。至于几何精细度和图片还原度等方面的效果嘛,先小...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
总说具身智能的数据太贵,鹏城实验室开源百万规模标准化数据集
...大脑,想要让具身大模型的性能更优,关键在于能否获得高质量的具身大数据。不同于大语言模型或视觉大模型用到的文本或图像数据,具身数据无法从互联网海量内容中直接获取,而需通过真实的机器人操作来采集或高级仿真...……更多
由厦门市人民政府主办的第五届中国人工智能大赛正式启动
...挑战性的编程问题,考察参赛者提供的人工智能模型生成高质量程序代码的能力。本赛题要求参赛者提供人工智能模型接口,根据给定的自然语言描述或伪代码,生成功能正确、语法规范且可读性强的程序代码。本赛题将设置100...……更多
...模态大模型进行质量筛选和描述重写,从而自动产生大量高质量的 3D 图像数据,辅助训练更优秀的多视图扩散模型。Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍,24 点图形推理一步成神:BoT 可有效提...……更多
AI角色创作平台「捏Ta」完成超千万元融资
...奇绩创坛等,所得资金将主要用于模型的进一步优化、多模态功能的增强以及社交玩法的开发。成立于2022年12月,捏Ta可被看做为以角色幻想故事智能创作为主的早期“小红书”。看见概念CEO胡修涵将捏Ta用户的创作过程比作“...……更多
更多关于财经的资讯:
洽洽食品等成立老魔坊魔芋生物科技公司
近日,云南洽洽老魔坊魔芋生物科技有限公司成立,注册资本6000万元,经营范围包含:生物基材料制造;初级农产品收购;农产品的生产、销售、加工、运输、贮藏及其他相关服务等。企查查股权
2025-12-03 13:48:00
双首单科创债成功发行 青岛银行科技金融赋能民企创新突破
11月27日,由青岛银行独立主承销的“25临工重机PPN001(科创债)”顺利完成发行,标志着山东省首单首次注册民营企业科创债
2025-12-02 14:25:00
万达电影成立意马当先影视传媒公司
近日,北京意马当先影视传媒有限公司成立,法定代表人为沈晨,经营范围包含:电视剧发行;广播电视节目制作经营;电影发行;电视剧制作;电影制片;电影摄制服务等。企查查股权穿透显示,该公
2025-12-02 14:48:00
中国资源循环集团等在江苏新设城市更新公司
近日,中资环新源城市更新(江苏)有限公司成立,法定代表人为李九辰,注册资本9000万人民币,经营范围包括建设工程施工、建设工程勘察
2025-12-02 14:48:00
万润科技等在湖南成立智慧能源新公司
近日,湖南万润湘设智慧能源有限公司成立,经营范围包含:热力生产和供应;供冷服务;合同能源管理。企查查股权穿透显示,该公司由万润科技(002654)全资子公司深圳万润新能源有限公司
2025-12-02 14:48:00
宇树科技双足机器人专利获授权,可用于教育娱乐等领域
近日,杭州宇树科技股份有限公司“双足机器人”专利获授权。企查查专利摘要显示,本外观设计产品用途用于巡检、安防、搬运、教育、娱乐、服务、工业作业或勘察等机器人,其设计要点在于形状。
2025-12-02 14:48:00
兴业银行发行50亿元绿色金融债券 首期票面利率为1.81%
12月1日,兴业银行发布公告称,经中国人民银行批准,兴业银行于2025年12月1日在全国银行间债券市场成功发行了该公司2025年第三期绿色金融债券
2025-12-02 14:49:00
农行200亿元第三期总损失吸收能力非资本债(债券通)落地
12月1日,中国农业银行股份有限公司(以下简称“农业银行”)公告称,其2025年总损失吸收能力非资本债券(第三期)(债券通)已发行完毕
2025-12-02 14:51:00
泽州浦发村镇银行获批解散 浦发银行承接其全部资产、负债等
12月2日,国家金融监督管理总局山西监管局发布关于泽州浦发村镇银行股份有限公司解散的批复,同意解散泽州浦发村镇银行股份有限公司,该行全部资产、负债、业务、网点、人员及其他权利义务
2025-12-02 14:52:00
周梦晨获批担任元亨泰富保险经纪江西分公司主要负责人
12月2日,江西金融监管局发布关于周梦晨元亨泰富保险经纪(宁波)有限公司江西分公司主要负责人任职资格的批复,核准周梦晨元亨泰富保险经纪(宁波)有限公司江西分公司主要负责人的任职资
2025-12-02 15:42:00
广州农商银行122.5亿元重大资产出售完成 剩余款项分9期收回
11月29日,广州农村商业银行股份有限公司(股份代号:1551,以下简称“广州农商银行”)正式完成一项非常重大资产出售事项
2025-12-02 15:50:00
山西银行:董事会同意聘任邢毅为行长
12月1日,山西银行官网发布行长变更公告,披露该行管理层人事调整事宜。根据公告,经山西银行第一届董事会2025年第二次临时会议审议通过
2025-12-02 16:04:00
技术解码宜美全光谱灯具:我们如何重新定义“好光线”?
当“长时间用眼”成为现代人的生活常态,灯光质量的重要性已不言而喻。我们或许都曾经历过在灯光下阅读不久便眼干涩、颜色失真的困扰
2025-12-02 16:27:00
中行德州分行成功落地资本项目收入境内人民币线上汇划业务
鲁网12月2日讯(记者 吴美琳 通讯员 王汉源)为贯彻落实《中国人民银行国家外汇管理局关于提升银行办理资本项目业务数字化服务水平的通知》相关要求
2025-12-02 16:51:00
第三届济南科技金融论坛:贯通资本市场枢纽,驱动科技产业循环
鲁网12月2日讯在国家将“科技金融”置于金融“五篇大文章”首位,并明确要求“构建同科技创新相适应的科技金融体制”的背景下
2025-12-02 16:51:00