• 我的订阅
  • 头条热搜
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...搭载了国产 14nm 的边缘训推芯片Deep Edge10 Max,以及自研多模态大模型“云天天书”。陈宁在会上表示,离不开核心能力算法芯片化。而“深目”AI模盒的算力基础,来源于去年云天励飞推出的14nm Chiplet大模型训推芯片DeepEdge10 Max...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
...联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
马斯克:未来两年内AI或将比“最聪明的人类更聪明”【附人工智能行业发展前景预测】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
CHINC2024丨史文钊:大模型时代 神州医疗全面领跑医疗AI行业
...作为医疗大数据AI行业领军者,神州医疗依托大数据及多模态等核心技术,倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型,赋能医疗领域多场景应用。同时,史文钊强调医学研...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
荣耀magicos9.0发布,提供小窗运行功能
...求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问用户是否需要取消自动续费。YOYO还可以自动查...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
更多关于科技的资讯:
快科技12月24日消息,据报道,近日,新乡一位丰田车主向他们求助称,自己在4S店买的新车却上不了。车主介绍,他这辆丰田电动车已经买了一周时间
2024-12-25 01:05:00
我们办了场差点翻车的人机大战 但效果出奇的好!
相信不少差友都知道,今年年初我们去逛 CES ( 国际消费电子展 )的时候,跟一家做 AI 翻译产品的中国企业时空壶打了交道
2024-12-25 01:05:00
高德地图2024年度出行报告发布:来看看你去了几个城市
快科技12月25日消息,随着2025年的脚步渐近,是时候回顾一下过去一年的足迹了。高德地图近日发布了2024年度出行报告
2024-12-25 01:05:00
OPPO A5 Pro 红色特别版一眼便能吸引众人目光
红色,在中国文化中一直承载着诸多美好的寓意,它象征着吉祥、幸运,能带来喜庆的氛围,同时也激发着人们的斗志,点燃内心的激情
2024-12-25 01:06:00
小米米家智能宠物饮水机2在小米商城等电商平台开售
12月24日消息,今日,小米米家智能宠物饮水机2发布,目前已在小米商城、小米有品等电商平台开售,首销到手价199元。米家智能宠物饮水机2最大优势之一就是内置4000mAh电池
2024-12-25 01:30:00
荣耀magic7rsr保时捷开售,提供两个版本
12月24日上午10点08分,荣耀Magic7RSR保时捷开售,新机提供16GB+512GB和24GB+1TB两个版本
2024-12-25 01:43:00
科技股集体反攻,苹果股价微涨
美东时间12月23日,美股市场迎来了一场科技股的集体反攻,各大科技巨头股价纷纷上扬,推动美股全线走强。截至收盘,博通公司股价大涨超过5%
2024-12-25 01:44:00
genai手机普及浪潮即将到来
市场调查机构CounterpointResearch最新研究显示,生成式AI(GenAI)正迅速重塑智能手机市场格局,预示着GenAI手机的普及浪潮即将到来
2024-12-25 01:47:00
郭明錤预测iphone18pro可变光圈技术
天风证券知名分析师郭明錤于12月23日在Medium平台发布最新预测,称苹果将于2026年发布的iPhone18Pro和iPhone18ProMax将首次搭载可变光圈技术
2024-12-25 01:48:00
oppoa5pro新机官宣,配置低端水平
近三个月内,各大手机品牌连连发,从旗舰机到低端机均有,而12月份新机量一样饱和,毕竟是今年最后一个月了,新机量自然不会减少
2024-12-25 01:53:00
TiPro9000固态硬盘发布,全面进化畅享竞速新境界
2024年12月24日,致态正式发布旗下首款PCIe5.0旗舰存储产品——TiPro9000固态硬盘。TiPro9000首次采用基于长江存储新一代晶栈®Xtacking®4
2024-12-25 01:56:00
新的一年,我要用镜头捕捉美好
距离2025年仅剩几天,在这个岁末年初的温馨时刻,圣诞节与元旦接踵而至。窗外,雪花轻轻飘落,给这个宁静的小镇披上了一层洁白的外衣
2024-12-25 01:59:00
尼康云创色彩方案实拍体验如何?
9月中旬,尼康正式发布了尼康云创功能。尼康云创包含了通过网络将照片备份到云空间、下载尼康色彩方案、更新相机固件三大功能
2024-12-25 02:07:00
iqooz9turbo长续航版开启预约,预计将于明年1月面世
iQOO品牌中端系列的明星产品iQOOZ9Turbo自今年4月发布以来,凭借其出色的外观设计、强大的性能配置以及亲民的1999元起售价
2024-12-25 02:12:00
科沃斯地宝x8proplus的几大亮点
在智能家居日益普及的今天,扫地机器人已经成为现代家庭不可或缺的清洁助手。然而,面对市场上琳琅满目的扫地机器人产品,消费者往往难以抉择
2024-12-25 02:14:00