• 我的订阅
  • 头条热搜
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
带几个智能体偷偷开了一家公司,让 AI 把同事的活全干了
...底色。今天智谱 AI Open Day 上,CEO 张鹏也指出,对未来的想象力只有化为现实的生产力才具有真正的革命性的意义。▲ 智谱 AI CEO 张鹏在智谱 AI Open Day,我们看到了与其他 AI 大模型发布活动截然不同的画风。凭借「开箱即用」的...……更多
...面,通过软硬件、云模型、端模型协同优化,实现座舱全模态主动理解、全舱位车内场景感知、多视角车外场景感知以及弱网、高信息负荷场景等全工况安心可用;在组织服务方面,通过生成式场景引擎,围绕用户需求与场景进...……更多
openai发布gpt-4o多模态大模型
...5月14日凌晨1点,OpenAI举行春季发布会,发布最新GPT-4o多模态大模型,GPT-4o能读取人类情绪,另外,相较于GPT-4Trubo速度更快、价格也更便宜。OpenAI称,GPT-4o可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求Cha...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
多模态AI概念股震荡走高 因赛集团涨超10% 【多模态AI概念股震荡走高 因赛集团涨超10%】财联社12月19日电,因赛集团涨超10%,天娱数科涨停,思特奇、软通动力涨超5%,润和软件、宣亚国际、开普云、万兴科技等跟涨。中信证券...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
AIGC在教育产品的商业化应用
...关系和信任。4、通过AIGC生成的创意作品,鼓励孩子发挥想象力和创造力,培养孩子的综合素质。三、AIGC在教育产品中的使用案例有一些教育产品已经使用了AIGC技术来提高教学质量和效率,比如:1. Class BotClass Bot,一个由EDTK.US...……更多
...出前10详情见下表: 三、机构观点① 游戏新品上线+AI多模态模型赋能,游戏板块或迎来业绩与估值双轮驱动开源证券认为,海外科技巨头基于AI多模态大模型的竞争日趋激烈,或驱动大模型多模态底层能力不断突破,叠加GPTs的...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”
...。除此外,天工的另一大升级是搭载了大模型,具备了多模态操作能力。现在能开口说话和人类交互,支持中英文。还能听从人类指令抓取物品:【此处无法插入视频,遗憾……可到量子位公众号查看~】而这些只是其中的一部...……更多
松鼠Ai智适应教育大模型全新升级
...与科技融合的盛宴。松鼠Ai举行发布会,不仅展示了其多模态智适应教育大模型及系统的全方位升级,还推出了多款前沿的智适应教育硬件产品,为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多
...公告,中国第一汽车股份有限公司申请一项名为“副车架模态计算有限元建模方法、装置、终端及存储介质“,公开号CN117216865A,申请日期为2023年7月。专利摘要显示,本发明属于汽车技术领域,具体的说是一种副车架模态计算...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
多模态概念持续活跃 苏州科达3连板 【多模态概念持续活跃 苏州科达3连板】财联社12月11日电,多模态概念持续活跃,苏州科达3连板,宣亚国际大涨超10%,引力传媒、力盛体育、因赛集团等跟涨。消息面上,Google Al大模型Gemini...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...O吴泳铭进行了他在云栖大会上的首次主题演讲。AI最大的想象力在哪里?吴泳铭说,“绝对不是在手机屏幕上,而是通过渗透数字世界、接管数字世界,并改变物理世界。”他认为,机器人行业将是下一个迎来巨变的行业。未来...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...参数量将以指数级的速率提升,另一方面是数据量随着多模态的引入也将大规模增长。不过,徐立提到,虽然目前业界训练模型对基础算力、基础设施的需求非常旺盛,但基础算力里对并行效率的要求非常高,真正好用的基础设...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
天风证券:视频AIGC加速突破 多模态应用发展正当时 【天风证券:视频AIGC加速突破 多模态应用发展正当时】财联社12月4日电,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质...……更多
更多关于科技的资讯:
魅族基于领克 Z10,打造了领克 Z10 电竞定制版
ZAKER科技9月25日消息,星纪魅族在发布会上宣布在领克Z10的基础上打造了领克Z10电竞定制版。最神奇的是这款车的车机系统为windows系统
2024-09-25 18:41:00
第三届数贸会在杭州举行,重庆代表团组团参会
第三届全球数字贸易博览会(以下简称数贸会)于2024年9月25日至29日在杭州大会展中心举办。本届数贸会以“数字贸易 商通全球”为主题
2024-09-25 19:43:00
大皖新闻讯 9月25日,大皖新闻记者从蚌埠机场建设投资有限公司获悉,为方便统一对外衔接工作,简洁明了展示机场形象,该公司现面向公众广泛征集机场形象标识(LOGO)设计方案
2024-09-25 20:11:00
十堰广电讯(全媒体记者 陈林 通讯员 黄兴林)随着高层建筑数量的不断增加,火灾救援难度日益加大。十堰湖北一专汽车股份有限公司成功研发出一款携带大型无人机系统的
2024-09-25 20:47:00
涌金楼丨浙江数商,是什么商
潮新闻讯 浙江数商,来了!9月25日下午,在第三届全球数字贸易博览会(下称“数贸会”)期间举行的数据要素治理与市场化交流活动上
2024-09-25 20:47:00
寻找“环岛奇游大玩家”活动启动 海南旅投出境免单游等你来赢
南海网9月25日消息(记者 丁文文)国庆假期临近,准备好迎接一场环岛奇遇了吗?9月25日,记者从海南旅投获悉,寻找“环岛奇游大玩家”活动启动
2024-09-25 21:07:00
世界经理人发布2024年亚洲10大超级豪宅排行榜
2024年(第十五届)“亚洲10大超级豪宅”排行榜于9月25日在中国香港揭晓。印度的安蒂拉位居第一,阿联酋的大理石宫殿排名第二
2024-09-25 21:11:00
本文转自:人民网人民网记者 黄盛“世界前沿科技大会.网址”“成都大运会.网址”“蓉宝.网址”“中国科学院.网址”“故宫博物院
2024-09-25 20:45:00
本文转自:人民网-河北频道9月25日上午,在国网唐山供电公司检储配一体化基地,随着仓管员田殿雄在中控大厅内输入入库指令
2024-09-25 20:51:00
华为苹果新机热销背后,消费电子卷向新战场
又是一年华为苹果大战,可以说消费电子市场再度上演火星碰地球。华为的三折叠和苹果的16系列是最近最为热门的新机,满网都充斥着排队
2024-09-25 17:18:00
iOS 18 / 17.7 续航测试出炉,这功能被限制
本月中旬,苹果接连发布了 iOS 18 和 iOS 17.7 两个正式版更新。iOS 18 中新增了不少新功能,而 iOS 17
2024-09-25 17:18:00
vivo高管暗示今年新机或将涨价 小米OPPO也扛不住
【CNMO科技消息】vivo将于10月14日举办新品活动。虽然官方暂时没有宣布,但外界普遍猜测vivo X200系列将于此次活动上亮相
2024-09-25 17:18:00
刘作虎分享手机摄像头凸起对比图,直言新机“有潜望”
IT之家 9 月 25 日消息,OPPO 首席产品官、一加创始人刘作虎今日在微博分享了一张手机摄像头凸起对比图,并直言“别慌
2024-09-25 17:18:00
苹果iOS17.7深度评测:续航信号终于完美,发热极致优化
苹果iOS17.7为什么如此火爆呢?很多iPhone用户认为此版本或将是iOS17最后的版本,另外这个版本有着极致的优化
2024-09-25 17:19:00