• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
比尔·盖茨对话OpenAI CEO奥特曼:AI如何监管?白领和蓝领谁会更先失业?
...话中,两人谈到了人工智能发展、趋势和监管等问题。多模态、推理和个性化是趋势,成本正在快速下降盖茨表示,最初对OpenAI快速发展充满疑问,称没想到ChatGPT变得这么好,并不理解背后的逻辑。奥特曼认为,目前在AI可解释...……更多
高通aihub正式发布:支持75个ai模型
...示了全球首个在搭载第三代骁龙8的安卓手机上运行的多模态大模型(LMM)。在这一演示中,高通展示了一个超过70亿参数的LMM,其支持文本、语音和图像输入,并能够基于输入的内容进行多轮对话。同时高通还在搭载全新骁龙XEl...……更多
...新数据自动化标注、清洗、使用等方法,扩充高质量的多模态数据。科学布局人形机器人算力,加速大模型训练迭代和产品应用。开发控制人形机器人运动的“小脑”,搭建运动控制算法库,建立网络控制系统架构。面向特定应...……更多
...模型首次应用于城市交通精细化治理拥堵等场景,支持多模态指令(文字、语音、图像等)输入,超百种解决方案秒级生成。升级后的高德地图“评诊治”系统可满足日常交通管理需求和应用场景,并匹配搜索查询功能、系统学...……更多
讯飞星火:致力于成为每个人的AI助手
...能力明显提升、数学能力再升级;8月15日,代码能力、多模态交互能力升级;10月24日,实现中文能力超越,英文能力相当。升级后的讯飞星火认知大模型V3.0从文本生成、语言理解、知识问答,到逻辑推理、数学能力、代码能力...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感...……更多
华为开发者大会2024,仓颉首次亮相
...华为今天还发布了盘古大模型5.0,全面升级了全系列、多模态、强思维,并且推出了可以适配不同业务场景多种规格模型,包含十亿级、百亿级、千亿级以及万亿级参数版本,可以应对多类型的大模型使用需求。总的来说,Harmon...……更多
...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使用。据悉,CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统,实现了对图像、文本、...……更多
360智能门锁斩获“葵花奖”,引领智能家居安全新纪元
...竞争优势。360智能门锁在技术层面的一个重大突破在于跨模态信息的融合。360智能门锁成功将360视觉大模型、360安全大模型和360智脑大模型落地赋能其门锁系列产品,显著提升了智能门锁的性能和用户体验,这使得360智能门锁在...……更多
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni
...,无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示,Megrez-3B-Omni 是一个为端而生的全模态理解模型,同时具备图片、音频、文本三种模态数据的...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
OPPO AI 中心产品总监张峻:多模态和个性化是将要深耕的方向
...的主要方向,表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向,同时端云协同将是重点架构。“我们相信,在这些领域持续投入后,一定能为用户带来更加与众不同的体验。”张峻进一步说明,未来会...……更多
荣耀magic6搭载骁龙8gen3移动平台
...用户偏好的理解和感知,为用户提供个性化服务,结合多模态自然交互,荣耀Magic6对用户意图理解更精准更立体,能够认知学习图像、文本和复杂语义,带来千人千面的用户专属智慧服务。荣耀在峰会现场展示了包括智慧成片和...……更多
三证已齐全!vivo新一代顶级旗舰X200蓄势待发:将搭载最新蓝科技
...载全新进化的蓝心大模型,该模型融合了语音、视觉和多模态的大数据处理能力。全新的蓝心大模型将支持更自然流畅的交互体验,用户可以通过智能助手“蓝心小V”进行对话,享受个性化服务推荐。在办公、教育、健康等场...……更多
腾讯云公布多项大模型产品进展
...的回答表现上,数学、推理等能力上均有较大提升。在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
推动人形机器人规模化应用
...算力调度服务体系。支持头部企业积极引进业界知名的多模态大模型落地,围绕大模型基础架构、训练数据集构建、多模态学习算法等领域,开展算法创新和核心技术攻关,构建安全可控的技术体系,降低人工智能开发技术门槛...……更多
引领司法创新!迪博助力深圳法院上线AI辅助审判系统
...力,有效支撑“大模型+专用模型+知识库+RAG+智能体”多模态研发,为各行各业提供专业、先进、安全、可靠的整体解决方案。迪博自主可控大模型生态平台迪博大模型生态平台,从顶层架构到上层应用,全程坚持自主研发与创...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展...……更多
快于友商!vivo X200系列突然官宣,关键配置基本没悬念
...心大模型,这一模型融合了语音大模型、视觉大模型、多模态大模型等强大能力。这也意味着新的操作系统版本在智能化体验上会变得很好,这也是产品本身极具吸引力的关键要素之一了。还有就是vivo还计划在10月10日的开发者...……更多
AI观察|“人工智能+”行动,如何推动生产力深层次变革
...、未来生物等战略性新兴产业和未来产业新赛道,培育多模态人机交互、智能助手、工业理解计算及代码生成等有需求、有效益、有前景的创新应用,以产业高质量发展带动生产力深层次变革。 全国人大代表,美的副总裁、首...……更多
哪吒汽车北京车展“亮大招”,开启AI大模型定义汽车新时代
...A8775P)舱驾融合平台,结合哪吒汽车自研的多屏交互、多模态交互等功能,为用户带来了前所未有的驾乘、娱乐、舒适和安全体验。再融合哪吒汽车领先行业的端侧大模型技术,让智能驾驶系统的性能得到了显著提升,为用户提...……更多
...了大幅度增强,并实现了若干新功能的迭代升级,包括多模态大模型CogVLM的看图识语义功能,在10余个国际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代...……更多
更多关于科技的资讯:
山东移动成功入选2025年度山东省中小企业服务支撑机构
近日,山东省轻工联社发布《关于公布2025年度山东省中小企业服务支撑机构名单的通知》,山东移动成功入选。作为推动中小企业数字化转型的主力军
2025-09-27 08:11:00
南报网讯(记者卫凌云通讯员建萱)9月26日,2025南京河西中央科创区生态建设推进会举行,“大厂+大学+大所”创新平台揭牌
2025-09-27 09:53:00
山东移动淄博公司织就高速信息网络,筑牢“数字淄博”智慧生命线
在数字化浪潮席卷而来的今天,信息传输网络如同城市的“神经网络”,是智慧城市运转的核心支撑。作为这一无形“生命线”的守护者
2025-09-27 12:34:00
迭代焕新“吾悦经营五步法”,新城控股再启商业新篇
9月24日-25日,新城控股“2025第八届商业年会暨吾悦商管第一届悦链计划合伙人大会”在上海西岸美高梅酒店举行,新城控股集团董事长王晓松及公司高管
2025-09-27 12:37:00
25日上午,以“上山下山·食在晋安”为主题的晋安区“一县一桌菜”云上发布会举行,12道“云端”盛宴引爆味蕾。
2025-09-27 13:53:00
产业链协同驱动 新奥加速冲刺氢硼聚变
河北新闻网讯(张新)2025年,是我国“十四五”规划收官之年,也是“双碳”目标提出五周年。在此背景下,央视《东方时空》栏目近日推出“可控核聚变专题”
2025-09-27 14:45:00
9月25日,国网山西省电力公司发布消息,该公司成功完成配电网无人机电力北斗定位服务的全面应用,标志着该公司依托电力北斗高精度定位服务
2025-09-27 19:56:00
谢志强:从金融菁英到人才“伯乐”,以产学研融合破局就业困境
谢志强,现任中科汇理信息技术研究院党支部书记、秘书长、中科产学研合作一体化人才培育开发平台项目主任。历任中国银行总行风险管理部业务经理
2025-09-27 20:20:00
聚焦数贸会 | 工匠行:机器狗能听会说还会自主巡逻
在第四届全球数字博览会上,贵州工匠行科技有限公司展出的SomaSeek具身智能平台,让机器人彻底告别了遥控器,也能听会说
2025-09-27 22:17:00
企业新市场何处寻?潍坊这场产业国际精准对接会送来“及时雨”
齐鲁晚报·齐鲁壹点 胡晓雪 李国栋9月26日,2025潍坊纺织服装产业国际精准对接活动在奎文区成功举办,本次活动以“我帮企业组主场·我为企业找订单”为主题
2025-09-27 22:22:00
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00