• 我的订阅
  • 头条热搜
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...搭载了国产 14nm 的边缘训推芯片Deep Edge10 Max,以及自研多模态大模型“云天天书”。陈宁在会上表示,离不开核心能力算法芯片化。而“深目”AI模盒的算力基础,来源于去年云天励飞推出的14nm Chiplet大模型训推芯片DeepEdge10 Max...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
制造业AI也迎来大模型时刻? | 智造观察
...算法和工程化能力,加速生成式AI应用开发进程;具备多模态,支持工业缺陷样本生成、交互式报表生成、交互式故障诊断、产线设计生成等文本/视觉/多模态内容生成,驱动AI 2.0应用和解决方案的开发与落地。谈及训练大模型...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
海天瑞声宣布开源多模态数据集,布局全栈式自动驾驶数据平台
...消息,AI训练数据服务商海天瑞声CEO王晓东宣布将开放多模态数据集,推进数据资源整合共享。据介绍,此次即将开源的多模态数据集「DOTS-MM-0526」涵盖图像、语音、文本等多个维度,开源数据集可以帮助各领域的研究者和开发...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
...联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
马斯克:未来两年内AI或将比“最聪明的人类更聪明”【附人工智能行业发展前景预测】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
CHINC2024丨史文钊:大模型时代 神州医疗全面领跑医疗AI行业
...作为医疗大数据AI行业领军者,神州医疗依托大数据及多模态等核心技术,倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型,赋能医疗领域多场景应用。同时,史文钊强调医学研...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
荣耀magicos9.0发布,提供小窗运行功能
...求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问用户是否需要取消自动续费。YOYO还可以自动查...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
更多关于科技的资讯:
一加李杰:以用户需求为核心,将持续打造优势产品力
【CNMO科技】从一加11开始,以“产品力优先”作为品牌理念一加手机,在数字系列旗舰中取消了Pro版本的机型,或者用一加自己的话来说
2024-11-02 14:44:00
抖音原生鸿蒙版大升级 直播、私信功能均已上线
【CNMO科技消息】自10月22日华为宣布HarmonyOSNEXT正式发布以来,鸿蒙生态的各类迭代、上新,一直是大家关注
2024-11-02 14:48:00
办公好搭子!华为千元档位护眼办公显示器开启预售
【CNMO科技消息】10月30日,全新一代华为MateViewSE护眼办公显示器正式开启预售,预售价849元。华为MateViewSE定位千元档位护眼办公显示器新选择
2024-11-02 14:48:00
华为智选Hi畅享新机曝光:支持40W快充 或11月发布
【CNMO科技消息】CNMO最新获悉,一款神秘的华为智选Hi畅享新机曝光,该机有望在11月正式发布。Hi畅享70近日,有数码博主爆料称
2024-11-02 14:49:00
4199元!华为Mate60Pro降价
华为Mate60Pro和荣耀Magic6Pro这两款手机经常被拿来比较,它们确实有不少相似之处,比如在系统操作上,用起来的感觉挺像的
2024-11-02 14:53:00
7寸大屏+骁龙8!这款新机太强悍了
各位玩友们,准备好大开眼界了吗?红魔这个名字,可是无数gamers心中的白月光啊,这次又要给我们带来新惊喜了!最近关于红魔10Pro的消息一波接一波
2024-11-02 14:54:00
总投资8亿元!淳安经开区常芯科创园项目开工
浙江在线11月2日讯 (通讯员 汪霞飞)11月2日,淳安经济开发区再度迎来先进制造赛道“高光时刻”,继2023年浙江常淳科技公司投产之后
2024-11-02 16:27:00
专家喊话公共洗手间男女例应是1比2:对女性最起码尊重
11月2日消息,原韩国驻英国大使、原韩国公共外交大使朴银夏接受媒体采访时表示,公共洗手间男女例应是1比2,这也样对女性的尊重
2024-11-02 16:35:00
新疆沙漠里竟然养出大海里的鱼虾:口感Q弹、肉质鲜美
快科技11月2日消息, 浙江大学近日宣布,该校援疆科技特派员在新疆沙漠成功养殖鱼虾。去年9月,特派员对阿拉尔市地下盐碱水进行了深入调研
2024-11-02 16:35:00
ZDS 数字股票 布局全球视野,开启智能金融新篇章
在全球金融市场蓬勃发展的背景下,ZealDigitalShares(ZDS)正迈向一个全新的发展阶段。通过采用先进技术与深度融合人工智能(AI)
2024-11-02 16:37:00
ZFX山海证券 AI驱动引领行业革新
在全球金融市场蓬勃发展的今天,众多新兴金融机构如雨后春笋般涌现。而在这其中,ZFX山海证券凭借其全球化扩展战略、严格的监管
2024-11-02 16:57:00
埃安巧用“三折叠手机”打广告:5平大床AION Y不要9.98万
快科技11月2日消息,埃安今日宣布AION Y车型推出重大促销活动,享受国家补贴、地方补贴以及厂家补贴,三重优惠叠加。有趣的是
2024-11-02 17:05:00
时代变了!英伟达纳入道琼斯指数 英特尔被取代
见证历史!最新消息,英伟达将在2024年11月8日替代英特尔成为道琼斯工业平均指数的组成成员。这是历史最悠久的美国市场指数之一
2024-11-02 17:05:00
不适合中国人用 厨余垃圾处理器连续4年大跌:降价也回天无力
快科技11月2日消息,奥维云网(AVC)数据显示,2024年1-9月厨余垃圾处理器行业零售额为4.1亿元,同比下降28
2024-11-02 17:05:00
首发原生鸿蒙!华为Mate 70系列即将官宣
快科技11月2日消息,博主厂长是关同学、定焦数码爆料,华为Mate 70系列即将官宣。从下周开始,Mate 70系列的细节信息就会露出
2024-11-02 17:35:00