• 我的订阅
  • 头条热搜
...加拿大)等 7 家企业出资,谷歌母公司 Alphabet 则向涉足视频生成领域的 Runway(美国)等 4 家企业出资。中国则在过去一年内新增了 5 家独角兽企业,包含月之暗面、MiniMax、零一万物、百川智能和智谱 AI,这些企业均获得了阿里...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...谓buff叠满:SOTA级别的性能,低训练花销,多模态的内容生成能力和再一次将开源大模型卷上了新高度。根据LLaVa-1.6官网的标准评测数据集,该模型的表现超越了Qwen-VL-Plus、CogVLM和Yi-VL等一众模型,在大部分数据集上的表现都优...……更多
视频生成大模型sora和可灵的区别在哪里?
...可能仅一线之隔。Sora之后,它的挑战者前赴后继。6月,视频生成大模型迎来又一轮新品爆发,生成式AI赛道像是“过年了”。快手可灵、LumaAI以及Runway迭代更新后的Gen-3Alpha等现象级爆品不断涌现。其中,讨论度最高的是快手自...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
...析每个模块的功能和布局,这有助于提供设计建议、自动生成UI设计原型等。Motiff妙多在界面分析能力上处于行业领先水平,是最懂UI设计的多模态大模型。 Motiff妙多大模型能回答各种各样有关UI界面的问题Motiff妙多大模型在理...……更多
“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实
从技术到具体的应用场景,生成式AI正在全球卷起一股浪潮。一组预测数据显示,2035年生成式人工智能有望在全球贡献近90万亿元(人民币,下同)的经济价值,其中,我国将突破30万亿元,占比超过四成。不难想象,一轮新的...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
... NVIDIA Isaac Lab 强化学习,从少量人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...营销增长方案;不仅提供多模态的理解与生成能力,助力视频创作效率提升25倍,更上线抖音话题、POI、小程序等营销工具,使门店页面曝光提升600%。目前已经有3,000+企业在火山引擎开启AIGC视频营销增长。面向销售场景,火山...……更多
OpenAI「草莓」两周内发布?网传不是多模态,反应慢了10多秒
...试过该模型的人还透漏,初始版本的「草莓」只能接收和生成文本,而不能接收和生成图片,这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的,这似乎是「草莓」一个明显缺点。大...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...的新版本,用户现在可以在visionOS商店中下载ChatGPT。官方视频显示,Vision Pro版ChatGPT支持聊天问答和图像生成。Google宣布为聊天机器人Bard升级Gemini Pro模式2月1日,Google宣布其聊天机器人Bard将在全球范围内采用Gemini Pro模式,……更多
多家券商最新研判:海螺AI爆火,MiniMax商业化进展迅速
...长文、创作文案、智能搜索,也可以实现AI音乐创作与AI视频创作,为艺术和想象赋能。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后,海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计,海螺...……更多
...领域设计的大型模型系统,实现了对图像、文本、语音、视频等多模态手术数据的深入理解,能够准确识别和解析动作、影像和生命体征等多种医疗信息。在实际应用中,CARES Copilot 1.0不仅可为临床医生提供手术阶段的详细分析...……更多
AI智能体将迎爆发点,市场空间近300亿美元!中科金财6天5
...据用户输入的咨询文字或语音问题,生成文本、图像、音视频等形式的回答。商业空间巨大多种迹象表明,AI正在迈入全新发展阶段。从聊天机器转变为能解决问题的工具,AI变得更加智能化和实用,未来有望加快商业化进程。...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
...段短片利用了AI规划分镜并绘制图片,再辅以“图片生产视频”软件让图片“动起来”。视频作者冯先生在接受媒体采访时表示,这段视频如果人工制作至少需要半年,而自己在AI的帮助下用时一周就完成了。值得一提的是,上...……更多
腾讯元宝首发3D生成应用 一张图即可生成3D角色
...模态交互能力。据了解,腾讯混元大模型早已布局文/图/视频生3D能力,是业界最早的端到端3D生成大模型之一,通过大模型一步推理,30秒即可生成动漫、建筑、游戏道具等类型的3D资产。如果需要更高精度,还能进一步烘焙生...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...,助力全民提升科技素养。科普中国拥有40万+科普中国音视频、6000万+科技文献构建科普大模型,将优秀科普资源惠及广大中小学生,及时回应孩子的每一次提问,课堂学生互动参与率从25%提升到77%,问题解答率从23%提升到95%,...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...蓝河操作系统扩展了输入能力,支持声音、图片、文字、视频、手势、手语、脑波等的识别。 同时,支持应用开发新范式,能够帮你自动编写代码、生成专属桌面、壁纸、主题等。该系统支持各类配置运行,包括200MHzCPU和32MB内...……更多
齐鲁文化大模型通过国家网信办备案
...模态知识图谱生成、AIGC文生图自动标注、画作鉴真、长视频拆条自动处理等功能,都可以帮助文化机构在多个应用场景高效完成各种工作,行业需求巨大。据了解,齐鲁文化大模型将被应用于对话生成场景,其可根据用户输入...……更多
《2023人工智能赋能网络视听产业观察报告》在青发布
...工智能赋能网络视听产业观察报告》。《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能赋能网络视听创新应用的典型案例,以及人工智能相关法规政策与行业规范发布情况,并探讨了行...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...一较高下”的劲头。只是由于当下大家的视线焦点集中在视频领域,Sora 又是 OpenAI 首次发布文生视频模型,所以无奈被抢了头条。图源:微博评论 Gemini 1.5 Pro建立在谷歌对Transformer和MoE架构的领先研究之上。传统Transformer充当一...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中,通义方面发布了最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。应用层方面,百炼提供...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...答案。轻量级的1B和3B模型则可以帮助不仅在多语言文本生成和工具调用能力方面表现出色,而且具有强大的隐私保护,数据永远不会离开设备。之所以在本地运行模型备受大家的青睐,主要在于以下两个主要优势:提示词和响...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...AInno-75B 增加了多模态处理能力,支持输入文本、图像、视频以及工业场景中的行为(Action)模态,如 CAD 等。通过引入高参数量大模型 AInno-75B, 创新奇智的主推产品 ChatDoc、ChatBI 获得了显著的能力提升。生成式企业私域知识问...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...小变化可能会极大地改变某些模型的性能(比如要求模型生成与参考答案完全匹配时,6.0和6就可能是不同的)。 为了缓解这个问题,作者建议使用「Explicit」提示来明确指定参考答案所需的格式。多模态性能上表显示,在多模...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...适应策略(MSAC)的轻量化多模态大模型。Mini-Monkey自适应生成多尺度表示,允许模型从各种尺度中选择未分割的对象,其性能达到了2B多模态大模型的新SOTA。论文地址:https://arxiv.org/pdf/2408.02034项目地址:https://github.com/Yul……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...:使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。丰富的多模态输入输出方式赋能智能助手ChatGLM实现了跨家庭、出行、工作和教育等多个场景的应用,例如:通过手机摄像头获取穿搭建议利用视觉信息实...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...接受包括多种媒体类型的输入,组合文本、图像、音频、视频和编程代码。未来,谷歌还计划将 Gemini添加到谷歌搜索引擎和 Chrome 网络浏览器等产品中,而全球有数十亿人在使用这些产品。谷歌首席执行官皮查伊 让GPT-4“瑟瑟...……更多
开源证券:多模态AI赋能影视板块,建议继续布局IP、动画板块
...证券研报指出,Runway、Pika、Clande3等模型工具推动从文生视频、图生视频,到文生音频、视频生音频、多模态图像识别的多模态AI能力持续提升及应用持续落地,Sora的推出或进一步提升AI视频生成能力,助力文字、创意、剧本等...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00