• 我的订阅
  • 头条热搜
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
未来医院变形记:生成式AI将病历书写从8小时缩短至25分钟
...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术,老年患者通过文本或语音与AI陪诊师互动,就能获得清晰的语音版和文本版就医指导,缩短数字鸿沟。第二,服务流程复杂,患者晕头转向。就医过程中,...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
中信证券:谷歌Gemini模型发布 AI进入多模态时代 【中信证券:谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电,中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemi...……更多
恒生科技30ETF上涨2.08%,恒生科技指数强势走高
...超2%,苹果、谷歌涨超1%。国元证券指出,技术面上AI在多模态领域持续发展,9月底Meta、OpenAI陆续发布多模态版Llama2(AnyMAL)、GPT-4V,进一步推动AI在多模态领域持续进步和应用持续落地。国内应用虽然相比海外虽然存在一定代...……更多
...高精度3D形变算法、“算法+渲染+驱动”自动化流程、多模态网络模型等技术,可通过单张或多张照片生成面部相似度达到90%以上的高自然度虚拟数字人,拥有表情、文本、声音、肢体驱动等多模态交互能力。具有耗时短、成本...……更多
外媒:百度今年下半年将发布新一代人工智能模型
...5.0”进行升级,预计在多模型能力上实现显著改进。“多模态”人工智能可以处理文本、视频、图像和音频,并将它们组合在一起,也可以跨类别转换——例如,文本转换为视频,反之亦然。基础模型可以理解语言并执行广泛的...……更多
平安鹰眼系统十五年:一场专注风险减量的长跑
...0的灾害的预测、预警及灾中的响应时效。进入AI时代,多模态大模型为鹰眼系统3.0建设注入新动能。谢文峰表示,ChatGPT是聚焦语言处理,而多模态大模型把能力拓展到对音频、图像和声音等数据的处理,实现各种听说读写的能...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
千行百业加速拥抱大模型(AI前沿观察)
...语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB,包含超5亿个文本、2200万个图文交错文档、1000个影像视频。在11月举行的2023人工智能计算大会上,智源研究院联合阿里云、...……更多
富士康等代工厂开始试产iphone15系列
...弹窗通知系统,自动叠加在界面层之上,可小可大,可以模态也可非模态。在绝大多时候,灵动岛会向两边拉长作为基础的状态展示,通过图标和数据构建出一个典型的非模态的提示框:比如AirpodsPro的电量。值得注意的是,虽...……更多
全国首个面向场景的无人机AI数字调度员在宁发布
...空在无人机技术领域取得重大突破,成功推出行业首个多模态交互引擎。这一创新技术深度融合语音与文本控制功能,能够精准适应复杂多变的作业环境,为无人机操控带来前所未有的便捷与高效。“怎么说,就怎么飞”,这句...……更多
谷歌在AI赛道加速
...图像-文本预训练、视觉问答、图像描述、视觉推理、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高...……更多
...人:以名医形象,通过手机端提供视频、语音及文本等多模态服务,为术后患者定制个性化康复方案,实现名医陪伴长期眼健康管理。未来,爱尔眼科将实现每一名医生都能拥有一个属于自己的数字人账号。AI全面发力:“AI智...……更多
...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使用。据悉,CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统,实现了对图像、文本、...……更多
苹果发布mm1.5-ui模型
10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模...……更多
AI应用正面临能耗挑战?分布式算力提供新路径!
...术为医疗诊断、安全监控和娱乐行业提供了强大支持。多模态AI:使AI能够同时处理和理解来自不同来源的信息,如文本、图像、声音和视频等,多模态AI的发展使得机器能够感知、理解甚至预测需求,提供更加个性化和智能化的...……更多
激发数据要素赋能服务型制造发展潜力
...力在线加速处理,实现快速反馈。随着对高并发数据、多模态数据、多源异构数据等处理能力的持续增强,更多复杂场景的实时数据将被应用到产品运行阶段,进一步提高企业对现实场景变化的即时服务能力。通过连接聚合实现...……更多
浪潮科技三款平台产品或升级认可
...业智能体。其特点在于整合了超过150个大模型和20余个多模态模型,并通过对行业语料数据的处理,旨在提升模型在垂直场景中的应用效果。浪潮 TYJR 就业创业信息系统 V2.0统基于“政府主导、多方参与、联动共享”模式构建,...……更多
OPPO AI 中心产品总监张峻:多模态和个性化是将要深耕的方向
...的主要方向,表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向,同时端云协同将是重点架构。“我们相信,在这些领域持续投入后,一定能为用户带来更加与众不同的体验。”张峻进一步说明,未来会...……更多
阅读软件也应用AI,掌阅科技股价一字板后再迎涨停
...打造新的更具互动性、个性化的数字阅读业态。第三,多模态拓展,增加内容生产的多样性,将数字阅读行业的IP低成本、高质量、多模态衍生,从而提升IP的无形资产价值,并引领数字阅读从单一的文字向文字、图片、视频相...……更多
DeepSeek赋能企业研发:DevOps+AI新时代再升级
...挖掘与信息提取能力、高效的推理和智能推荐系统以及跨模态数据分析能力和高效的深度学习推理加速能力,在需求、任务、测试、持续集成、数据洞察等领域为团队提供多样化的解决方案与创意灵感,提升团队的研发效率与灵...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...场,隆重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
... 2024“人工智能+”标杆示范征集活动。联汇科技凭借在多模态大模型与智能体行业的突破性技术创新,以及在细分市场中的卓越表现,荣获2024人工智能隐形冠军企业标杆Top10。联汇科技拥有卓越的技术能力,其核心技术包括向量...……更多
...言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力7大能力上持续进化。最近一次8月15日发布的讯飞星火V2.0升级发布会上,代码能力和多模态能力升级。 商汤公司相关负责人介绍,公司此次开放服务的大模型“...……更多
...用户超千万。此次智能化升级后,DeepSeek的文本生成、多模态理解及知识检索能力,将深度嵌入华商网旗下华商头条、城事舆情智库、政企智慧帮、见证西安、童学会等核心产品,华商网将通过AI的快速生成事件背景分析、数据...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
...国内人工智能独角兽企业月之暗面(Kimi)发布新一代多模态思考模型k1.5。利用长短转化技术,以长链式思考技术改进短链式思考模型,在短链式推理性能测试中,k1.5模型在数学、代码等方面大幅超越GPT-4o、Claude 3.5 Sonnet 等全球...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
更多关于科技的资讯:
中国网12月16日讯 据网信中国微信公众号消息,党的二十届四中全会明确坚持扩大内需这个战略基点,强调要大力提振消费,要以新需求引领新供给
2025-12-16 16:06:00
近日,瑞众人寿唐山中支围绕客服节“拾光美好·瑞意相伴”核心主题,开展了2025年客服节健康生活系列活动。通过线上线下融合
2025-12-16 16:04:00
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00