• 我的订阅
  • 头条热搜
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。 同样的模型,也负责决定在机器人上运行哪些学习...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升,速度甚至达到了后者的两倍。支持图...……更多
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...请求时,响应可能会延迟或中断。此外,像视频生成、多模态识别这类复杂的任务也会消耗大量计算资源,导致暂时性宕机。目前,DeepSeek、OpenAI等企业正致力于设计人工智能专用芯片。这些芯片通过优化架构与信号传输效率,...……更多
以AI赋能数字电网发展(科技名家笔谈)
...术,具有带动性很强的“头雁”效应。未来一个时期,多模态大模型、联邦学习、边缘计算、智能体大脑、迁移学习、具身智能、强化学习等领域的科技创新将齐头并进。模型的推理成本、泛化能力、可解释性、复杂计算和仿真...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
...第一梯队。该岗位要求候选人兼具大模型预训练优化、多模态融合及行业解决方案设计能力。此前,小米集团相关人士在接受媒体采访时表示,其寻找的人才需要有计算机科学、人工智能、自然语言处理或相关领域的硕士或博士...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际...……更多
盘点Testin云测三大实操案例,AI测试为何成为头部企业首选?
...通过整合机器视觉与自然语言处理技术,该系统构建起多模态智能测试能力矩阵,为企业提供贯穿测试全链路的自动化、智能化 AI 测试解决方案。目前已成为金融、汽车、互联网等领域头部企业的战略选择,持续赋能行业数智化质...……更多
价格便宜75%!亚马逊推出全新大模型系列,3纳米自研芯片明年上市
...容。该系列包括六种型号,从纯文本模型Micro、低成本多模态模型Lite、高性能多模态模型Pro到预计于2025年第一季度推出的Premier,以及两款尚未确定发布时间的更先进模型Canvas和Reel。 据介绍,Nova 系列能够支持200种语言,Micro、L...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
AWE 2024的家电行业:离AI革命还远,距高端突围更近
...I领域的最新探索成果,包括AI立体双目视觉技术和NarGPT多模态语音大模型。AI立体双目视觉技术,主要是为了提升扫地机器人的精准识别能力,让其能够如同人类双目一般快速判断周边复杂环境。据介绍,该技术可以对周围环境...……更多
特斯联携手国际轻奢品牌BUTTONS发布首款通用智能体Hali
...合国际轻奢品牌BUTTONS发布了一款由特斯联AI技术驱动的多模态多智能体协作AI Agent——“Hali”。这意味着特斯联将业务触角,由过去的城市公共空间、社区、产业、能源等端领域的AIoT系统解决方案,进一步延伸到终端产品服务市场...……更多
...飒智智能尝试结合机器人与AI垂直模型,研发工业用类人双臂复合机器人。这类机器人能够利用垂直模型,生成基本动作元素,进而使用同一套算法串联双臂,协同完成模组装配等高难度作业任务,推进复合机器人在复杂工业场...……更多
钛媒体「年度潜在价值企业」、「年度前沿科技企业」榜单揭晓 | 2023 EDGE AWARDS
...致力于创造安全、普惠的通用 AI 技术,目前最新千亿多模态大模型Luca已完成备案。 【生数科技】作为国内最早布局多模态大模型的团队之一,生数科技由蚂蚁集团、BV百度风投和瑞莱智慧RealAI联合孵化,致力于打造可控多模态...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
星语智能醒辰:AI不需要会爱,只需要在你想发火时,给你递一杯“虚拟凉茶”
...家好! 我是星语智能的创始人醒辰,我和我的团队在多模态情感模型及应用赛道上已经摸爬滚打了三年,这三年经历的了模型技术的飞跃发展,经历了在AI情感陪伴赛道上探索和积累,更看到了生成式人工智能会给这个世界带来...……更多
...三年北京发展具身智能的施工图。他表示,北京将聚焦多模态融合感知技术、“大脑”大模型、“小脑”模型技能库、机器人运动控制、核心零部件、智能芯片等具身智能关键技术,促进产学研协同攻关;构建世界模型仿真、多...……更多
...新形态双协作机器人、多机协同技术、面向家庭场景的多模态大模型、环境仿真技术、材料科学和具身智能等方面进行大量布局和探索。年报显示,科沃斯在机器人技术的三维空间理解、交互能力、AI算力、多模态大模型和具身...……更多
ICRA 2025现场直击:戴盟全新视触觉传感器美国首秀即获业界盛赞!
...触时的形貌、纹理、软硬、滑移、按压力、切向力等多种模态信息,为夹爪等执行末端赋予类人触觉能力。现场还准备了“愤怒的小鸟”传感小游戏,通过按压DM-Tac W并改变不同位置的正压力和切向力,观众能够精准操控小鸟的...……更多
什么影响大模型安全?NeurIPS\'24新研究提出大模型越狱攻击新基准
...融等关键行业,评估并保障这些领域中LLMs的安全性。 多模态扩展:探索多模态数据的越狱评估,结合文本、图像、音频等多种数据类型,全面评估LLMs在多模态环境下的安全表现。 协作防御机制:开发基于多Agent的协作防御机...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
从工具控到创生者 2025AI用户进化中
...于AI产品的偏好方面,独立的AI应用App、对话式AI助手和多模态交互平台是最受欢迎的产品形态。其中,多模态交互平台融合了多种交互方式,如语音、图像、手势等,提供了更加丰富、高效的使用体验。责任编辑:孙妍(EN109) ……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
更多关于科技的资讯:
河北新闻网讯(王闯)一体化电机一台、组合开关一台……11月24日,开滦集团唐山矿业公司(简称“开滦山矿公司”)综采一区主管机电工作的副区长李振辉轻点鼠标
2025-12-01 18:13:00
鲁网12月1日讯泰安联通聚焦精品网络建设核心,持续深化云网融合能力、优化网络运维体系、升级服务保障机制,为区域数字经济发展筑牢通信底座
2025-12-01 13:35:00
冬日有暖意 服务联万家——泰安联通客户日打造贴心服务体验
鲁网12月1日讯初冬时节,寒意渐起,但服务的温度却未曾缺席。近日,泰安联通在全市各营业厅成功举办“联通客户日暖冬回馈季”主题活动
2025-12-01 13:37:00
王倩:以“法律+”思维,护航企业破局新生
巾帼不让须眉:年轻有为的破产破局者,王倩用专业赢得信任当企业陷入债务泥潭,当债权人与债务人的利益激烈碰撞,当投资人寻求危局中的机遇——破产业务从来不是简单的“清算注销”
2025-12-01 09:25:00
重塑健康增长范式,米连科技或将引领互联网发展新路径
在互联网行业经历深刻变革的今天,追求健康、可持续的增长模式已成为企业生存发展的关键。米连科技通过其独特的战略路径,向业界展示了一条超越“烧钱换规模”传统逻辑的新型发展道路
2025-12-01 09:55:00
《和平精英》地铁逃生「冰雪危途」全新赛季火热开启,这把雪赚到底!
列车一响,雪赚开场!《和平精英》地铁逃生全新赛季「冰雪危途」,11月29日,邀你雪赚启航!用创新玩法,拓宽地铁逃生摸金搜打撤的边界
2025-12-01 09:55:00
邮储银行唐山市分行以“政策落地+精准赋能”为主线,积极构建专业化科技金融服务体系,全力支持新质生产力发展。该行创新推出“网点深耕+全链服务”模式
2025-12-01 10:02:00
近日,人保财险唐山燕新路营销服务部组建专项服务小组,走进公司周边场所,开展“面对面、零距离”客户服务行动。活动现场,工作人员以客户需求为导向
2025-12-01 10:06:00
信息技术的迅速发展,尤其是大数据的广泛应用,正在推动医保体系发生深刻变革。传统的医保支付方式已经难以适应现代医疗服务的复杂性与多样化需求
2025-12-01 07:04:00
“一上午加了8位境外采购商”
本报讯(全媒体记者陈春伟、实习生罗家骏)“嘀”的一声,江西华昌竹业集团有限公司外贸经理严慧的微信好友列表里,又多了一位国际采购商
2025-12-01 07:05:00
11月16日,一艘装载邢台纳科诺尔精轧科技股份有限公司生产的辊压分切一体机的货轮,从天津港环球滚装码头启航驶往海外。至此
2025-11-30 07:36:00
坚定信心 勇挑大梁·产业新亮点丨“能址星图”如何全省率先把数据“变现”?
10月18日,在2025中国国际数字经济博览会上,秦皇岛市大数据有限公司展示“能址星图”数据产品。 石 勇摄“我们的‘能址星图’产品上架两三个月时间
2025-11-30 07:37:00
重磅!鸣望教育签约英国子午线英语,解锁中英教育合作新范式!
2025年11月20日,鸣望教育行业赋能第27届研讨峰会,达成一项重磅签约。鸣望教育与拥有46 年专业积淀的英国子午线英语学校(Meridian English)正式达成战略合作
2025-11-30 12:05:00
新生态、新平台、新增长|鲸鸿动能数智赋能品牌确定性增长
2025年,中国消费市场的竞争正从流量红利的浅层博弈,迈向以生态力为引擎、深度运营为核心的新阶段。在这一关键转折点,鲸鸿动能于11月28日成功举办“鸿蒙商业增长论坛·品牌营销沙龙”
2025-11-30 12:05:00
全运会宣传中惊现AI MV:谁在用算法谱写湾区之声?
第十五届全国运动会于11月21日圆满落下帷幕。记者从组委会了解到,一首全程由AI生成的原创宣传MV《向着光的方向》已被正式收录进本届赛事的官方宣传素材库
2025-11-30 12:06:00