• 我的订阅
  • 头条热搜
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后,想要更好地发挥出模型的实力,还需...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
Sora“超级涌现力”将把AI引向何方
...tokens(机器模型输入的基本单位),而谷歌最近发布的多模态通用模型Gemini 1.5 Pro就把稳定处理上下文的上限扩大至100万个tokens。Sora之所以能对物理世界规律进行模拟,一个可能的原因在于大数据驱动下,人工智能模型体现出一...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
...12个重点领域,类型包含文本、图片、音频、视频等多种模态。其中,中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。 同样的模型,也负责决定在机器人上运行哪些学习...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
...自我学习与知识更新、文本高效生成、图像理解分析、多模态融合与应用拓展能力,专业知识问答更准确、预案制定修订更实用、图像识别解答更专业、法律法规解析更全面。据研发团队介绍,“大羽安全应急模型”的独创性是...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...。全自研技术All in 大模型的智谱 AI,很早就开始部署多模态生成式 AI 模型。从 2021 年开始,智谱 AI 先后发布了 CogView(NeurIPS’21)、 CogView2(NeurIPS’22)、CogVideo(ICLR’23)、Relay Diffusion(ICLR’……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
四川省首批8个人工智能高质量数据集发布
...量等方面符合相关要求,以文本、图像、音频、视频等多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。四川省首批人工智能高质量数据集充分利用全省海量数据资源、严格按照国家...……更多
2023 的人工智能之年
...的情感和情绪。Google 在 Bard 聊天机器人中融入了基于多模态数据集训练的 Gemini,它被誉为目前“最强大”的 AI 模型,是 OpenAI 的 ChatGPT 最强的竞争对手之一。Grok:Elon Musk 的创业公司 xAI 展示了其对 AI 开发的承诺,并可能与 Open.……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...“文心百中”。去年,阿里达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破。其中使用 512 卡 V100 GPU 实现全球最大规模 10 万亿参数多模态大模型 M6,同等参...……更多
更多关于科技的资讯:
宁德时代潘健:中国电动汽车正从“EV”变为“EIV”
快科技2月1日消息,据媒体报道,宁德时代联席董事长潘健在瑞士达沃斯举行的世界经济论坛年会上表示,中国电动汽车行业正在从“EV(电动汽车)”向“EIV(智能电动汽车)”转变
2025-02-01 08:39:00
杭州70岁大妈去影院看新《射雕英雄传》:我就想看肖战演的郭靖
2月1日消息,近日在杭州的一家影院,一位70岁的阿姨说自己特地来看肖战主演的春节档电影《射雕英雄传:侠之大者》,她表示哪怕剧情一般
2025-02-01 09:09:00
越南从韩国进口的无人机大批坠机起火:被迫取消除夕夜灯光秀表演
快科技2月1日消息,据报道,1月26日,越南河内大批无人机在彩排时坠落并在美亭国家体育场附近引起火灾。网友拍摄的视频显示
2025-02-01 09:09:00
小鹏G9/G6正式登陆爱尔兰/芬兰:加速欧洲市场布局
快科技2月1日消息,日前,小鹏汽车在都柏林和赫尔辛基分别举办发布会,正式进军爱尔兰和芬兰市场,小鹏G9和小鹏G6两款车型同步亮相
2025-02-01 09:09:00
每年超过0.3厘米的下沉 我们的房子怎么办
除了西湖醋鱼,杭州还有哪些地方特色呢?作为一个杭州人,差评君会自嘲地说:还有沉降东站!杭州的东站建设于 1992 年,在 2008 年改扩建后一度是亚洲最大的火车站
2025-02-01 09:39:00
蔚来推出5年0息金融政策 加赠5年NOP+免费使用权等权益
快科技2月1日消息,蔚来官方宣布,从即日起至2月28日期间支付定金购买蔚来旗下车型的用户,可享受首付20%起以及5年0息金融方案
2025-02-01 10:39:00
周边路面已修复!放炮炸翻多辆豪车的熊孩子已被带走:家长或赔超500万
快科技2月1日消息,近日在四川内江资中,一名小孩往下水道投放鞭炮,结果这一不当行为瞬间引发剧烈爆炸。据国内媒体报道称,四川资中县一男孩将鞭炮扔进下水道引发化粪池内沼气爆燃
2025-02-01 10:39:00
电瓶车强闯收费站 逆行上高速致轿车撞车!官方通报
快科技2月1日消息,近日,一段令人揪心的视频在网络引发热议。视频显示,在四川宜宾某高速公路上,一辆电瓶车竟在快车道上逆行
2025-02-01 10:39:00
前游戏公司总裁操作无人机与救火飞机相撞
Treyarch工作室联合创始人,空舞互动娱乐前总裁彼得·艾克曼(Peter Akemann)周五与控方达成认罪协议,协议规定可免于坐牢
2025-02-01 11:09:00
理想汽车1月交付29927辆:理想L6连续七月蝉联增程销冠
快科技2月1日消息,理想汽车公布最新交付数据显示,2025年1月份共交付29,927辆汽车。截至2025年1月31日,理想汽车历史累计交付量为1
2025-02-01 11:09:00
第二家盈利的新势力品牌!零跑汽车1月交付25170台 同比暴增105%
快科技2月1日消息,日前,零跑汽车公布其1月交付量达25,170台,同比增长105%。零跑汽车表示,将持续为用户打造好而不贵的产品
2025-02-01 11:09:00
美国四天四架飞机失事!一小型飞机在美国费城坠毁 已致6人死亡
快科技2月1日消息,据报道,当地时间1月31日,美国一架承载两人的小型飞机从宾夕法尼亚州东北机场起飞后不久在费城东北部坠毁
2025-02-01 11:09:00
欧美为何恐慌!周鸿祎谈DeepSeek遭美打压及污名化:动摇美国AI基础设施
快科技2月1日消息,毫无疑问DeepSeek的出现,让美国科技巨头们感到了恐慌,毕竟低算力需求下也能带来如此强大的AI大模型
2025-02-01 11:39:00
浙江“年糕泡饭”让全网惊叹 这真能吃吗:网友感慨没胃口 你们那吃什么
2月1日消息,近日,浙江的“年糕泡饭”因其新奇配方和简单制作过程在社交平台上引发热议。从分享的制作过程看,锅里水烧开后倒入剩饭
2025-02-01 12:09:00
印度部长盛赞DeepSeek低成本AI模型:震撼了该行业 戳破美国高投入谎言
快科技2月1日消息,DeepSeek的横空出世,吸引了全球目光,而印度部长也是盛赞这个大模型,认为震撼了该行业。印度铁道
2025-02-01 12:39:00