• 我的订阅
  • 头条热搜
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...划协作模式。未来的研究可以深入探索高级意图推断、多模态输入输出,以及分析用户参与的影响,以优化人机协作的自适应能力。 图:路线图展示了自适应系统中的软件工程关键点(左侧)与 LLMs 在自适应系统中的应用挑战...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
华为云与乐聚联手打造“人形机器人”
...器人’的融合,机器人具备了自然语言和视觉/触觉的多模态交互能力、适应多场景的泛化能力,这是之前所不能想也做不到的事。华为云与乐聚此次基于工业、家庭典型真实场景的探索,对人形机器人推进到场景应用现实意义...……更多
...源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
AI视野:iPhone16将引入生成式AI;百度AI编程工具限时免费;
...演模式。????‍????????????聚焦开发者清华系ChatGLM3发布,多模态挑战GPT-4V智谱AI发布了清华系ChatGLM3,全自研、适配国产芯片,多模态模型挑战GPT-4V,搭载国产Code Interpreter,实现代码交互能力。元象大模型向全社会开放元象信息科...……更多
谷歌chrome地址栏整合gemini聊天机器人
...Gemini是谷歌Deepmind最新、最强大的AI模型。它原生支持多模态,具备跨模态推理能力,包括文本,图像,视频,音频和代码。Gemini分为三个版本Ultra-三个模型版本中功能最强大,适用于高度复杂的任务Pro-适用于广泛任务的最佳模...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
AI潮起 共筑数智之基
...大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能...……更多
全球首发!节卡机器人JAKA MAX系列工业协作机器人获2024 CIIF大奖
...全球首发首展。 JAKA K-1采用拟人型构造,集大脑、小脑、双臂、双足、力觉传感器和视觉系统等组件为一体,高1.8米,全身具有29个活动关节(不包含灵巧手),双臂共有14个自由度,拥有±0.1mm 重复定位精度。JAKA K-1在现场向观...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...r S在具身智能理应用等方面又迎来了新进展,在已有的多模态感知与运动控制能力上,通过接入文心大模型,获得了高级的意图理解能力和细粒度规划能力。从视频来看,接入了AI大模型的Walker S在语义理解与交互、智能任务管...……更多
...来回巡查的工作压力,完成许多任务。这样的能力需要多模态大模型和具身智能赋予。 此前,具身机器人智能化训练只能靠人工采集数据。以写字为例,工程师用遥控器操作机器人完成全过程,费时费力采集的数据有限,机器...……更多
WPS AI以“慢”制胜 金山办公36年技术积淀助力飞跃发展
...会上,熊龙飞展示了WPS AI专业应用领域的最新成果,如跨模态技术、高度可复用的引擎系统等方面的突破。这些技术成果不仅提升了文档处理的效率和准确性,更为用户带来了全新的智慧办公体验。在多模态技术在文档处理中的...……更多
入选高工人形机器人优质企业链,银牛微电子3D空间计算解决方案获高度认可
...现具身智能。该方案不仅融合了语音、文本和图像等基础模态,还加入了3D点云模态,通过强化的多模态关联技术,显著提升人形机器人的智能水平和逻辑自洽性。与此同时,银牛还拥有丰富的三维空间多模态大模型数据库,可...……更多
科大讯飞携手EX机器人,重塑人机交互新未来
...,面向物理世界、虚拟世界和元宇宙,以AI能力星云、多模态交互、大模型、模型训练、资产生成和软硬件接入为核心的机器人开发平台,帮助开发者快速搭建多场景适配、具有深厚知识底蕴以及擅长自我进化的实体机器人和虚...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
...等各种科技,基于数据沉淀和智能算法,它还开发出了多模态大模型等能力,能满足家庭的多元化需求。现场,身处“千行百业”中的机器人们在尽职尽责地工作。在飞象星球展区,一对一的人工智能作文辅导吸引不少观众。“...……更多
洗衣叠衣做早餐!人形机器人很能干
...。”乐聚一位员工告诉南都记者,旗下新推出的这款轮式双臂人形机器人,应用到3C、汽车、家电等行业的搬运场景已不成问题。搬运能力实景展示的还有逐际动力。该公司双足人形机器人CL-1能够完成负重深蹲和举起的动作,从...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
...联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型...……更多
探秘2024电博会机器人展示区,见证人工智能科技生活奇迹!
...交互的仿生机器人头,以其超仿生的机械结构和先进的多模态大模型,不仅能在娱乐导览、服务陪伴、心理治疗等场景中大放异彩,更象征着未来智能家庭生活的美好愿景。商汤科技的元萝卜AI下棋机器人,则巧妙地将中国传统...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
...内属于行业第一梯队水平。Walker S在人形机器人已有的多模态感知与运动控制能力上,通过接入文心大模型,获得高级的意图理解能力和细粒度规划能力。Walker S首次完成叠衣服这样的复杂柔性材料操作,展现出大模型赋能人形...……更多
更多关于科技的资讯:
河北消费者吐槽:手机国补激活流程太复杂
随着春节氛围日渐浓郁,政府推出的“国补”政策为众多消费者带来了实实在在的福利,特别是在手机购买方面。然而,尽管这一政策广受好评
2025-01-27 21:03:00
齐鲁晚报·齐鲁壹点 孔茜1月25日,济宁市手机等数码产品国补正式开启。政策实施期内,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元
2025-01-27 21:36:00
Nothing新机预热:三摄模块布局正式揭晓
快科技1月27日消息,Nothing公司宣布将于2025年3月4日发布其最新款智能手机,虽然官方尚未透露新机的具体名称
2025-01-27 22:06:00
苹果董事会将迎重大调整 库克有望接任董事长
据媒体报道,苹果公司董事会未来一年将迎来重大变动,两名成员将因到达退休年龄而离任,包括现任苹果董事长阿特·莱文森,而苹果CEO蒂姆·库克有望接任他的位置
2025-01-27 23:06:00
洛杉矶大火迎来天降甘霖 当地专家却苦笑:怕是一场“毒雨”
1月7日,洛杉矶突发大火,包括太平洋帕利塞德富人区在内的多个街区出现火灾灾情,而随后的圣安娜飓风更是让火势一发不可收拾
2025-01-27 23:06:00
549元!泰坦军团24.5英寸显示器开售:1080P 200Hz屏、1ms GTG响应
快科技1月27日消息,泰坦军团24.5英寸显示器P2510G2现已开售,售价仅为549元,性价比极高。这款显示器配备1920×1080分辨率的原生200Hz Fast IPS面板
2025-01-27 23:06:00
辽宁春晚开播:又能听见冯巩我想死你们了
1月27日消息,据媒体报道,今晚辽宁卫视春晚开播,整台晚会秉承着“以情动人,以文铸魂”的创作宗旨,用文艺的力量抒写家的故事
2025-01-27 23:06:00
就算降价也得忍 三大理由劝你春节别买iPhone 16
在春节即将到来之前,苹果官网全面降价了iPhone 16系列新机。这次降价不光是官网和直营店上了优惠,各大电商平台也都同步了
2025-01-27 23:06:00
DeepSeek预测春节档票房冠军是哪吒:预计在45-50亿元
1月27日消息,有网友就“2025春节档电影票房情况预测”提问DeepSeek。DeepSeek给出回答:总票房预测有望创历史新高
2025-01-28 00:06:00
打通淘宝!钉钉上线“小礼物”功能:将在大年初一全量开放
快科技1月27日消息,钉钉悄然上线了“小礼物”功能,并打通淘宝,可为用户提供丰富的送礼选择。目前,钉钉“小礼物”正逐步灰度中
2025-01-27 12:36:00
中美为AI拼了!美国拿出5000亿美元 中国砸1万亿元
快科技1月27日消息,近日,中国银行发布《支持人工智能产业链发展行动方案》,宣布将在未来五年内,为AI全产业链提供不低于1万亿元的专项金融支持
2025-01-27 12:36:00
京东方将进军半导体!计划2026年量产CPU玻璃基板
快科技1月27日消息,据TomsHardware报道,国内显示技术巨头京东方将进军半导体领域,计划开发用于CPU的玻璃基板
2025-01-27 12:36:00
Linux也变屎山!内核代码突破4000万行 10年膨胀一倍
快科技1月27日消息,今年初,Linux 1.3版内核正式发布,代码数量达到39819522行,而最新的Linux 6
2025-01-27 12:36:00
新能源汽车遇到寒潮、雨雪怎么办!为了家人 一定要看
1月23日中央气象台发布寒潮蓝色预警,这是今年来首个寒潮预警。这几天,寒潮天气过程持续影响我国,许多地方都出现了大幅降温
2025-01-27 12:36:00
苹果AI功能遇冷:三成iPhone用户拒绝升级iOS 18
快科技1月27日消息,苹果推出iOS 18系统,新增“Apple Intelligence”等AI功能,但用户升级热情低于预期
2025-01-27 12:36:00