• 我的订阅
  • 头条热搜
两个周鸿祎 杀入“百模大战”
...态能力之后,数字人的应用将更加便捷,用户只需通过将视频上传并解析讲话内容(就能生成数字人)。资料越多,越能模拟生活经历,模拟角色。”360也将智脑大模型场景应用的起点和当前重心,放在了数字人项目中。据了解...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...知识的深度学习和应用;「跨媒体大模型」还涉及诗词短视频合成和化合物合成的不同领域,通过结合不同形式的数据进一步拓展了 AI 的边界。「如果每个学科都能拥有自己的专业大模型,并将这些模型相互连接,将形成一个...……更多
Sora为何没能诞生在中国?
...框内输入“中世纪小号手”,打开音效开关键,点击生成视频,一个4秒的AI生成视频便跃然于屏幕上。人们不仅能看到一个身穿中世纪宫廷服饰乐手的画面,还能听到乐手吹小号的声音。北京时间3月10日,硅谷一家AI初创公司Pika...……更多
紧握根技术竞速大模型
...造的2.0版本,在语音、图像和文本三模态的基础上,加入视频、信号、3D点云等模态数据,突破了认知增强的多模态关联等关键技术,具备全模态理解能力、生成能力和关联能力。 “紫东太初”2.0可以理解三维场景、信号等数...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。此...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
...模型平台。该模型具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该模型融合了人类意图理解和长期记忆机制,为用户提供超拟人的情感陪伴服务。同时,结合实时的全域数据及 LBS 信息采集处理,WAKE-AI 大...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...型相当于语言大模型的眼睛和耳朵,能够将语音、图像、视频、车辆信号等多种信息模态进一步理解,再打通语言大模型进行智能交互。而多模态生成大模型则相当于语言大模型的手和脚,能够将语音输出转化为多种模态信息,...……更多
视频生成群雄逐鹿,哪些重要问题待解?
...大模型峰会、AI Infra峰会,分会场将组织端侧生成式AI、AI视频生成和具身智能三场技术研讨会。主会场与分会场外则设有展览区。50+位嘉宾将在大会上带来致辞、演讲、报告和对话讨论,以前瞻性视角为大家解构和把脉生成式AI...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...决方案,小米小爱同学为车主提供智能化交互体验。文生视频平台。“商汤在这么多年做了非常多视频、感知、理解的技术和内容,商汤关注如何把视频的生成做到可控。我们打造了文生视频平台,强调对人物的可控性、情绪的...……更多
周鸿祎 落子
...应用的智能化升级。360智脑展示了在城市治理场景中的「视频理解」多模态能力到头来,聚焦用户刚需痛点与自身优势场景下的能力沉淀,也会为360智脑「四路并发」提供厚实基础。眼下的360智脑,相当于举着「国内首个可信AIG...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tensor处理器单元(TPU)Trillium芯片。根据发布会最后的官方统计,完全聚焦于AI的这场主题演讲总共提到了121次AI。完全聚焦于AI的...……更多
通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通
...方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。据介绍,Qwen2.5-Omni采用Thinker-Talker双核架构。其中,Thinker 模块如同大脑,负责处理文本、...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...技术架构和精细化应用,以及多模态模型在图、文、音、视频方面的特色应用。 开悟大模型采用主流的transformer模型和扩散模型技术路线,针对不同行业场景训练了特色化大模型,具备六大亮点。 1.语言模型可控化,采用...……更多
空间智能产业化加速 一线企业集体锚定百度智能云
...在内容生产领域,筷子科技作为国内领先的内容商业AIGC视频应用企业,携手百度智能云打造了行业首个内容商业AI智能体应用服务平台,通过百度智能云的AI赋能,该平台链接了内容团队编导、拍摄、剪辑、投放、管理等五大协...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...击。此前,谷歌已经对外放出了语音助手demo演示的预热视频,而GPT-4o最让人惊艳的地方就是“天花板级别”的人机自然语音交互。 那么,OpenAI机关算尽、谷歌有备而来的多模态大模型,究竟有什么神奇之处?GPT-4o中的“o”代...……更多
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...了后来居上。在模型上,字节补全了图像、语音、音乐、视频、3D等不同模态的生成式AI模型;在应用上,豆包App已成为国内用户最多的ToCAI产品,截至11月底,累计用户规模已超过1.6亿,单日活跃用户接近900万。不知不觉间,字...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...工大学 S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基准:成功率最高 2%Meta 推出「高效追踪一切」模型SOLAMI:首个端到端社交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获...……更多
欢瑞世纪与阶跃星辰达成战略合作,共建“麟跃”AI联合实验室
...并接入阶跃星辰两款最新开源多模态模型——Step-Video-T2V视频生成模型和Step-Audio语音交互模型,以AI技术赋能影视内容生产。此次合作标志着欢瑞世纪加速AI领域的布局,推动影视产业智能化转型,并与其在短剧、互动剧、AIGC等...……更多
全面AIGC时代,豆包模型家族准备好了
...巡展」深圳站中,豆包模型家族再次全新发布两款豆包·视频生成模型:豆包视频生成-PixelDance、豆包视频生成-Seaweed,并面向企业市场开启邀测。活动中,火山引擎总裁谭待同时发布了豆包·音乐模型及豆包·同声传译模型,豆...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...mni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生...……更多
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...在清单公布的算法包括:美团在线智能客服算法、快手短视频生成合成算法、百度文生图内容生成算法、百度PLATO大模型算法、天猫小蜜智能客服算法、菜鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
... Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
...lash 可以生成并修改文本和图像。 该模型还能采集照片和视频以及录音,以回答相关问题(例如"他说了什么?)音频生成是 2.0 Flash 的另一项主要功能,多希将其描述为"可操纵"和"可定制"。 例如,该模型可以使用针对不同口音...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以...……更多
AI视频新战场:字节对决快手、反击Sora
...格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。@科技新知 原创作者丨萧维 编辑丨蕨影一场由Sora引发的AI视频生成竞赛,如今迎来新的竞争者...……更多
大厂加码落地大模型,京东云一口气发了10个AI应用
...这一局面。能自动生成高质量的营销文案、产品描述图片视频等,并根据不同的受众群体进行个性化服务,跟进消费热点,并可以理解和预测消费者行为,捕捉细微的趋势变化和个人偏好,支持更加精准的营销策略,在企业关注...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...着这些模型可以将文本“翻译”成图像,以及让图像变成视频、让文本变成音频等等。多模态模型自去年以来受到了热烈的关注,让用户与AI的互动变得更高效。这也就是为何谷歌在去年12月发布的大模型Gemini的宣传片引起了轰...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对外展示了图像识别...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...能力测试基准。其中每个问题包含三部分:一个人的活动视频,环境和人类动作的文字描述与一个 ToM 问题。视频链接:https://mp.weixin.qq.com/s/fRa138rmFsv8W8JOYcsAPA 此前,大部分的心智能力测试基准都使用较简单的模版,文字或视频...……更多
更多关于科技的资讯:
江苏南京:从“实验室”走向“生产线”,助力6000多家科创企业驶上发展“高速路”
从“实验室”走向“生产线”,助力6000多家科创企业驶上发展“高速路”南京云恒:这个科创“陪跑者”不简单图为云恒中试制造中心内
2025-08-15 07:43:00
南报网讯(通讯员高媛记者夏思宇)高击穿电场、高热导率、高电子迁移率、高工作温度……作为第三代半导体的主要代表材料之一,氮化镓在半导体功率器件领域的应用前景愈发受到行业关注
2025-08-15 07:44:00
8月9日,晚风裹挟着汾河的湿润气息,掠过山西体育中心体育场璀璨的灯火。看台上,数万名歌迷挥舞荧光棒的浪潮与手机屏幕闪烁的光海交相辉映
2025-08-15 07:59:00
全飞秒精准4.0与3.0该如何抉择?听听专家的专业解析
大众网记者 王文文 菏泽报道当近视手术的科技齿轮持续向前,全飞秒SMILE技术早已从最初的3.0版本,悄然迭代至更精准的4
2025-08-14 10:33:00
在胜利油田鲁胜公司鲁源采油管理区坨28注水站注聚生产现场,一个看似不起眼的泡沫问题,曾长期困扰着生产效率与驱油效果。如今
2025-08-14 10:51:00
黄河:从 “互联网原住民” 到 “AI 原住民”,教育的下一个十年
“2015年,我们说孩子是互联网原住民;2025年,他们将成为AI原住民。”伴鱼CEO黄河的这个判断,勾勒出教育代际变迁的轮廓
2025-08-14 11:02:00
中科慧远将发布首款工业具身质检机器人CASIVIBOT 开启智能质检新飞跃
在工业制造向智能化转型的关键时刻,质检环节正面临前所未有的技术挑战与升级机遇。8月19日,国内领先的AOI(自动光学检测)专有设备制造商中科慧远将举行新品发布会
2025-08-14 11:02:00
北京大学光华管理学院近日聘任国际投资人与Web3.0企业家刘晓俊先生为创业导师,任期自2025年5月至2028年6月。刘晓俊先生长期深耕全球创新投资
2025-08-14 11:02:00
国网济宁供电公司:首创“模块化、快接式、智慧型”配电预制舱
鲁网8月14日讯日前,国网济宁供电公司创新研发的全国首套“模块化、快接式、智慧型”配电预制舱完成送电,有效破解了老旧小区改造空间受限
2025-08-14 11:18:00
机器人重构消费体验
当机器人从“工业重器”变身为餐厅服务员、脱口秀演员、智能管家,伴随机器人产业发展的消费新趋势正悄然到来。走进位于北京市通州区的机器人大世界
2025-08-14 11:20:00
10余项课程赋能工作一线 海南农商银行标准化内训课程开发工作坊结课
消费日报网讯(记者郑红梅)近日,“海南农商银行内训师队伍建设点灯人计划 — 标准化内训课程开发工作坊” 在中国(海南)改革发展研究院圆满收官
2025-08-14 11:21:00
产业链上的山东好品牌丨中国首款“零碳”工装,烟台造!
大众网记者 王亮 烟台报道这是一件普通的、黄色夹克外套?不,这是一件高科技的、碳中和的、“绿色的”夹克。中国首款“零碳”工装
2025-08-14 11:30:00
中国光大银行烟台分行交易银行部:以专业创新为笔 绘就银企共赢新画卷
编者按:在中国光大银行烟台分行,有这样一群人,从辛勤耕耘到运筹帷幄,他们在自己的岗位上默默奉献,用智慧和汗水浇灌着分行的发展之花
2025-08-14 11:33:00
2025浦东家具家居双展9月启幕,规模逆势扩张,看点多元升级
跨界破圈迎增长,30周年献礼开启家居产业新纪元在当下挑战与机遇并存的全球经贸环境下,中国国际家具展览会迎来了30周年的荣耀时刻
2025-08-14 11:35:00
当前,宠物经济已步入黄金发展期。宠物行业信息平台宠业家的数据显示,今年上半年,国内宠物消费达773.75亿元,同比增长8
2025-08-14 11:53:00