• 我的订阅
  • 头条热搜
...者通过一些细节就能识别。例如,“张文宏带货”属于非实时视频,观看者可以从“动作重复性”“眼球运动”“面部细节”等来发现AI生成的漏洞。目前,社交平台上的很多数字人也有同样的瑕疵。具体来看,AI生成的视频可...……更多
年轻人的好友列表,AI越来越多
...字人,还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程,会有延时,Soul 现在语音对话延迟不到 200 毫秒,因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音,现在能将...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
Pokémon Go开发地理空间大模型,AR眼镜的高精地图?
...Rokid发布了新一代AR眼镜——RokidGlasses,通过摄像头、多模态大模型以及(玻璃衍射)光波导等技术,在一定程度上让AR眼镜实现了对真实世界的感知与理解,以及对用户的协同与展现。然而就当下来说,AI或者说视觉大模型对真...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后,想要更好地发挥出模型的实力,还需...……更多
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
...语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,为全球游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。大阪世博会中国馆“孙悟空”遇上自主可控AI大模型:让中国文化“活”起来“...……更多
Meta等成立AI联盟对抗OpenAI;春晚吉祥物“龙辰辰”被疑AI生成 | 图灵周报
...PU。点评:与大语言模型ChatGPT不同,Gemini大模型是原生多模态大模型,不仅可以处理文本内容,还可以无缝丝滑地处理代码、音频、图像和视频等多种模态的信息。据介绍,这是谷歌目前规模最大、能力最强的大模型。业内多名...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
...为,从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI(通用人工智能)的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...以来产生的所有数据还要多的数据。这些数据正在变得多模态,包括视频、图像和声音,所有这些数据都可以用来训练AI的基础知识。”而除了预训练Scaling Law,还有两个其他Scaling Law已经出现,第二个是后训练Scaling Law,其使用...……更多
Sora爆火96小时国内大模型进场
...车面临不小的难度。碾压同行2月16日,谷歌发布新一代多模态大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪称业界最强大模型。然而,OpenAI在同一日发布Sora大模型,风头直接盖过谷歌,仅需通过文本即可自动生成视频,...……更多
云知声受邀出席京西智谷大模型生态共建点亮仪式并获算法模型认证证书
...中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局。山海大...……更多
活力中国调研行|好用好玩!AI点亮百姓生活
...人工智能体验馆的工作人员介绍,讯飞智慧课堂融合AI多模态技术和星火大模型。让教师通过“智慧语音笔”联通“智慧黑板”,实现随讲随写;学生们则能以动态可视化的方式开展学习。此外,学生课后还可以借助AI交互式答...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...座赋能座舱的交互逻辑,使其在车载语音交互领域成为多模态感知、类人推理与群体协同的车载AI中枢,成为用户更人性化、更主动的智能出行伙伴。一、天琴语音助手系统架构:技术支柱+端侧部署天琴语音助手 8.0 以“空间智能、...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使用。据悉,CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统,实现了对图像、文本、...……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至9月,豆包语言模型的日均token...……更多
天玑8400赋能高阶智能手机市场
...持全球主流的大语言模型(LLM)、小语言模型(SLM)和多模态大模型(LMMs),可为用户提供AI翻译、改写、上下文智能回复、通话摘要、多媒体内容生成等终端侧生成式AI创新体验。天玑8400还搭载了在天玑9400旗舰芯片中率先亮...……更多
云知声上市在即,企业通过通用人工智能(AGI)创建互联直觉的世界
...中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局。 ...……更多
豆包再降价,字节“饱和式”进攻仍在继续
...AGI更进一步,大家都在加速。实际上,字节对视觉化、多模态模型的重视度肉眼可见的提升。12月11日,据智能涌现报道,字节提升了即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。字节计划后续把更多资源向更多模...……更多
...了语言模型的基础,才能继续训练文生图、文生视频等多模态大模型,背后还需要大量“数据对”,也就是数据之间的联系,比如文字和图片对应的数据,图片和视频对应的数据等。中国联通人工智能创新中心首席AI科学家兼技...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先...……更多
齐鲁文化大模型通过国家网信办备案
...率。此外,如数字人对话、基于NLP的知识问答和搜索、多模态知识图谱生成、AIGC文生图自动标注、画作鉴真、长视频拆条自动处理等功能,都可以帮助文化机构在多个应用场景高效完成各种工作,行业需求巨大。据了解,齐鲁...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
更多关于社会的资讯:
来上海看展 文博+中国画,解析传统与碰撞之美!
当千年文物走出展柜,当笔墨丹青遇上文明印记,一场跨越古今的艺术对话即将开启!上海市群众艺术馆(上海市非物质文化遗产保护中心)特邀深耕“文博中国画”领域的开创性艺术家嵇亚林带大家共赴一场“文物与美术”的深度之约
2025-12-02 12:31:00
湘西铁道线上,九年风雨坚守路
湘西群山叠嶂,沪昆铁路如一条钢铁巨龙穿梭其间。在这崇山峻岭中,有一位铁路人已默默守护了九个春秋——他便是中国铁路广州局集团有限公司“先进生产者”获得者
2025-12-02 11:37:00
肥城农行桃都支行:“移动银行”解难题
鲁网12月2日讯当老人因行动不便,被一道遗忘的密码阻隔于金融服务之外,中国农业银行桃都支行的一次主动出击,将传统的“柜台”精准位移至客户的床榻之侧
2025-12-02 12:02:00
旧物穿越四季,潮分点亮苏城 ——“小蜜蜂” 2025 环保答卷请查收
当最后一片金黄的银杏叶轻轻落在白塘公园的木质摊位上,苏州市 “小蜜蜂” 垃圾分类专项志愿服务队的 2025 年 “潮・分市集” 终于画上圆满句号
2025-12-02 11:32:00
月底截止!2026年度“北京普惠健康保”参保突破260万人
东方网从“北京普惠健康保”项目组获悉,由政府指导监督的2026年度“北京普惠健康保”参保截止时间不足一个月,投保通道将于2025年12月31日24时关闭
2025-12-02 10:45:00
匠心如炬,映照“金叶”初心
初冬的武陵山区,晨雾未散。在湖南省张家界市永定区天门山烟叶收购站,一束标准色温的光源早已亮起。光影交错间,一双布满浅黄老茧的手
2025-12-02 10:46:00
为防止非法飙车,六安月亮岛环岛路正在更换减速带
大皖新闻讯 环境优美的六安月亮岛一直是市民休闲、锻炼身体的绝佳去处。几年前,这里曾一度受到非法飙车现象滋扰,带来一定交通安全隐患
2025-12-02 10:34:00
海南文昌警方通报:男子编造殴打妻子视频被行拘
中国网12月2日讯 12月1日,海南文昌市公安局发布“警情通报”:近日,文昌市公安局接网民反映,抖音账号“诸葛神濠”(抖音号:AGT9957)在网络平台发布殴打妻子的视频
2025-12-02 10:03:00
“深临奇晋——山西文化巡展·深圳站”11月30日在深圳岗厦北地铁站启动,通过现代展陈语言和互动体验,山西古建、壁画、彩塑
2025-12-02 08:00:00
山西文旅交通运营公司12月1日发布消息,为助力太原打造旅游热点门户,新开通“晋祠—五台山”景区直通车,为两地游客提供“快旅慢游”体验
2025-12-02 08:01:00
本报讯(全媒体记者刘文琴)今年的12月1日是第38个世界艾滋病日,主题为“社会共治,守正创新,终结艾滋”。艾滋病病毒的传播方式有哪些
2025-12-02 07:10:00
“贷款没办下来,就该把钱退了,为啥不退?”近日,西安市鄠邑区的崔师傅致电华商报,称今年夏天由一家公司帮忙做20万元的农业扶持贷款
2025-12-02 07:54:00
“沣河热力工作人员没有提前联系,中午时间到我家来测温。我提出质疑后,对方说没有中午不能测温的规定,让我拿出文件来。而且还带着人一直在用手机在拍摄
2025-12-02 07:54:00
中国传媒大学视听艺术研究中心发布报告:微短剧成促进消费、服务民生、传承文化新载体
11月27日,中国传媒大学戏剧影视学院、中国传媒大学视听艺术研究中心在山西太原举办了《全民共创微短剧产业文化价值报告》(以下简称《报告》)的专家研讨会
2025-12-02 07:32:00
一首中国小诗的跨国旅行
下午3点,你在做什么?当大多数人还在为生活奔波时,一名外卖诗人悄悄记录下了一个温情瞬间——沙县小吃店里,一对母女在午后阳光下睡着了
2025-12-02 05:43:00