• 我的订阅
  • 头条热搜
阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...开源大模型DeepSeek走红,AI社区开发者也开始探讨,在多模态领域能否出现这样强大的模型。有着多模态领域深厚积累的阶跃星辰选择为开源贡献自己的力量,首次进行了模型开源。在大会期间,阶跃星辰与吉利联合宣布将双方...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...以适应不同领域和多样化的数据特性,无法在多任务、多模态的环境中有效工作。4. 缺乏端到端的任务执行框架:由于在结构化推理和时间信号的数值计算交叉点上的研究较少,实现端到端的时间序列任务执行仍然面临挑战。现...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...超过90%。在启用视觉感知能力的情况下,o1模型在MMMU(多模态理解)测试中获得了78.2%的高分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...—亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标:将来我们不仅要Speech to Speech,更要Any-to-Any!整体而言,Am...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠,连续4年荣获国际顶尖赛事冠军!
...世界顶级赛事中,平安产险(参赛团队名称PA-VCG)在“多模态文档推理理解”这一高复杂度任务中,凭借领先的大模型技术体系与卓越的多模态理解能力,从全球众多顶尖科研机构与知名科技企业中脱颖而出,强势夺冠,连续4...……更多
...器人应用场景中进行了验证,最新测试结果显示,经过多模态能力扩展的DeepSeek-R1能够让人形机器人在执行任务前结合看到的场景和接收到的指令进行思考验证,零样本推理水平与调优后的同级别大模型推理水平相当。公司将基...……更多
人工智能应用场景不断拓展
...业大模型占比七成。大模型已具备文本、语言、视觉的多模态能力,成为推动产业发展与社会进步的重要变量。在阶跃星辰创始人兼首席执行官姜大昕看来,通用人工智能的实现路径可以划分为模拟世界、探索世界和归纳世界3...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
连发两款模型“补课”,百度AI成色如何?
...箱底的技术实力?按百度说法,文心4.5定位新一代原生多模态基础大模型,在多个基准测试中超过GPT-4o,得分最高的则是DocVQA,该基准主要测试文档图像的问答能力。在文本能力方面,文心4.5则在多个主流基准测试中超过DeepSeek-...……更多
OpenAI没有放弃的机器人梦想
...捕捉到的语音转录文本,输入到一个由OpenAI训练的大型多模态模型中,然后由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。“同样的模型,也负责决定在机器人上运行哪些学习的...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
国内首个!百度文心大模型X1 Turbo斩获信通院最高评级证书
...心大模型最新版的技术创新。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低。基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...麦克风捕捉的语音,转录为文本输入到由OpenAI预训练的多模态大模型中,模型能够理解图像和文本。模型会处理整个对话的历史记录,包括以往的图像,以生成语言响应,再通过文本到语音的方式向人类回话。△Figure 01训练方法...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...千帆平台上线。据介绍,文心大模型4.5是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
苹果发布mm1.5-ui模型
10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...两个的版本,名为Scout和Maverick。Meta表示,Llama 4是一个多模态大模型,它能够处理和整合各种类型的数据,包括文本、视频、图像和音频,并且可以在这些格式之间转换内容。Llama 4系列首次采用了混合专家(MoE)架构的模型,这种...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
更多关于财经的资讯:
华夏久盈资管被罚款70万元,一名相关责任人被禁业10年
12月19日,国家金融监督管理总局行政处罚信息公示列表显示,华夏久盈资产管理有限责任公司,未按照规定运用保险公司资金等,被罚款70万元;相关责任人陈淑翠被禁止10年进入保险业。
2025-12-20 12:20:00
· 冰雪旅游,今冬如何添新意?
12月17日,哈尔滨冰雪大世界开园,除了规模创历届之最,今年还有哪些新亮点?冰雪+运动,冰雪+温泉,冰雪+民俗……以冰雪旅游为主的城市
2025-12-20 07:52:00
新业态催生新职业!海南万宁村民返乡“逐浪”
海南自贸港正式启动全岛封关运作,给海南旅游发展带来前所未有的机遇。随着冲浪、赛艇等新业态的崛起,不仅游客们有了更多到海南的理由
2025-12-20 07:52:00
视频丨从“过客”到“创客”:海南自贸港如何让老外“不见外”?
良好的生态环境和开放的政策红利,已吸引不少中、外企业以海南自贸港为起点,拓展全球市场。海南正积极打造中国企业走向国际市场的总部基地
2025-12-19 16:02:00
经济大省挑大梁丨中国电商直通欧洲2亿人的“空中快线”
中国“出海四小龙”货通全球,每天超万吨包裹飞往全球。但你知道最快进入中东欧2亿人市场的“秘密通道”在哪吗?内陆腹地的郑州开出一条黄金航线
2025-12-19 16:02:00
· 【中央经济工作会议目标任务解读】发挥存量政策和增量政策集成效应
中央经济工作会议在部署明年经济工作时强调,要坚持稳中求进、提质增效,发挥存量政策和增量政策集成效应,加大逆周期和跨周期调节力度
2025-12-19 16:03:00
编者按:2025年是“十四五”收官之年,也是中国式现代化进程中具有重要意义的一年。回眸这一年,经济的脉动、社会的情绪、生活的变迁
2025-12-19 16:03:00
文图墨画诠合规 建言献策筑防线 赫章农商银行“我为合规献策”征集活动圆满落幕
为凝聚全员智慧,筑牢合规防线,由赫章农商银行主办的“我为合规献策”征集活动已圆满落幕。活动期间,来自全行各部门、各机构的员工踊跃报名参赛
2025-12-19 16:10:00
聚焦贵州文旅,助力乡村振兴“民宿贷”服务案例
贵州某文旅公司在贵州市场深耕数年,其定位高端精品民宿,以其独特的选址、稀缺的自然景观及独具匠心的装修设计风格,深受广大热爱旅游人群的认可
2025-12-19 16:10:00
“科技e贷”破题融资难,光大银行贵阳分行500万“活水”润泽科技型小微企业
光大银行贵阳分行积极贯彻落实党中央、国务院关于普惠金融的重大战略部署,严格执行相关政策要求,致力于做好科技金融、普惠金融
2025-12-19 16:11:00
赫章农商银行辅处支行:关爱零距离,反诈护晚年
为提高老年人的金融素养,增强老年人的防诈意识,近日,赫章农商银行辅处支行走进辅处乡养老院,开展“关爱零距离,反诈护晚年”的金融知识宣教活动
2025-12-19 16:11:00
康师傅饮品投资公司更换法人代表、董事长
近日,康师傅饮品投资(中国)有限公司发生工商变更,蔡慈源卸任法定代表人、董事长,由邱世煌接任。企查查信息显示,该公司成立于2011年5月
2025-12-19 16:12:00
各地多举措激发冰雪消费活力
央视新闻客户端消息(新闻联播):这个冬天,各地以“冰雪+”为核心的新模式、新场景不断涌现,激发冰雪消费,释放市场活力。辽宁推出五条特色旅游线路
2025-12-19 16:33:00
今年冬至饺子馅创新十足!饺子馆相关企业多分布在华北地区
冬至临近,“吃饺子”这一习俗在北方深入民心。冬至吃饺子源于东汉张仲景“祛寒娇耳汤”的典故,至今北方仍流传“冬至不端饺子碗
2025-12-19 16:36:00
皇氏集团成立臻选供应链公司
近日,广西皇氏臻选供应链有限公司成立,法定代表人为杨锦坤,经营范围包含:供应链管理服务;食用农产品零售;食用农产品批发;农副产品销售;水产品零售;水产品批发等。企查查股权穿透显示
2025-12-19 16:36:00