• 我的订阅
  • 头条热搜
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...RecDiff团队计划将RecDiff拓展到更多推荐场景中,并结合多模态信息,进一步探索该模型的潜力和应用价值。论文:http://github.com/HKUDS/RecDiff源代码:https://github.com/HKUDS/RecDiff港大数据智能实验室:https://sit……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
硅谷顶级VC的最新洞察:AI公司应该专注用户需求,而非模型构建
...司,直到ChatGPT的飞速增长引起了广泛关注。我认为不同模态的模型或模型应用领域存在机会,比如视频领域、生物技术、临床医学等。我认为我的基金将大部分投资于应用方向,但目前还投资了一些基础模型公司。Elad Gil:我非...……更多
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
...通用机器人算法体系。今年5月,该团队还发布了具身多模态大模型Grounded 3D-LLM,能够自动化生成物体到局部区域的场景描述与具身对话数据,有效缓解了目前三维场景理解的局限性。论文地址:https://arxiv.org/abs/2407.10943GitHub地址...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
小模型正在成为AI界的新宠
...源的 GLM-130B 模型,具有 1.3 万亿参数。 M6:达摩院的多模态预训练模型 M6,拥有 10 万亿参数。 然而这种大模型之间的军备竞赛,令业内十分担忧。参数量的增加,就一定能带来显著的性能提升吗?不一定。大模型带来的问题...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
又热闹了!OpenAI的加强版“Her”正式开放,压过了Gemini的“生产级”大升级…
...然语音对话获得了实时解答。目前,OpenAI尚未提供这项多模态功能的推出时间表。此外高级语音模式也暂时不对欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放。尽管如此,终于能亲自上手OpenAI版的“her”,对已经混AI...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...场,隆重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能(AI)领...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...年 4 月。 定制化:GPT3 16k、GPT4 微调、定制模型服务。 多模态:Dall-E 3、GPT4-V 和 TTS 模型现已在 API 中。 Whisper V3 开源(即将推出 API)。 与开发者分享收益的 Agent 商店。 GPT4 Turbo 的价格约是 GPT4 的 1/3……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...在走。机器之心:这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是?统一具身模型的技术方向,既完全不同于传统机器人学习的小模型技术,也完全不同于以往语言、多模态大模型的技术。首先...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...,最后就可以完成用户任务。可见,想要把类似GPT-4V的多模态大模型应用于操作系统上,模型还需要具备强大的屏幕解析能力,主要包括两方面:1、准确地识别用户界面中的可交互图标;2、理解屏幕截图中各种元素的语义,并...……更多
生成式AI:手机厂商高端梦最后的希望
...搬上手机?Amon认为,目前大模型正朝着“轻量化”“多模态”方向发展,以云端作为AI大脑,边缘端和终端作为小脑,这样一种云+端的“混合AI”模式成为技术发展的主要趋势。如何将AI大模型搬到手机上,手机厂商应充分考虑...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...更加符合预期的结果。整体来看,缺乏交互式数据分析的基准——是本次研究面临的最大问题之一。为了解决这一问题,他们以“斯坦福小镇”项目为启发,创建了“DECISION COMPANY”。“DECISION COMPANY”是数据分析领域的首个多代...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...示,在接下来的几个月中,他们预计将推出新功能(如多模态)、更长的上下文窗口、更多不同大小版本的模型和更强的性能,以及 Llama 3 研究论文。另外,Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM Wats.……更多
马斯克的AI大模型登场
...用户每天为推特生产包括文本、图像、视频在内的巨大多模态数据库。在算力方面,之前有消息称,马斯克一次性从英伟达购买了1万个处理大型AI模型数据的GPU,总费用达数千万美元,或许就是为了xAI。xAI官网信息也显示,“xAI...……更多
2023-11-06 09:22:00马斯克的AI大模型登场
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
...认为,该成果具有广泛的应用潜力,可以推广到文音视图模态的不同任务上,包括多模态理解、生成基座模型等。5. 写在最后团队关注底层问题,尤其在 LLMs 和多模态方面,期望实现更多突破。更多团队技术研究进展,可以通过...……更多
姚班天才组队开发《完蛋!我被大模型包围了》续作!专为摸鱼爱好者打造
...子工作室”,还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后,现在上线微信小程序,搜索头号做题家,人人都能玩。好奇,自家后浪能把前浪拍死在沙滩上不? 来揭开《我把大...……更多
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...和平台的发展:1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;2、弥合 System 1(负责低级控制)和 System 2(负责高.……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
更多关于科技的资讯:
苹果AI功能通知摘要屡次翻车:新闻机构向苹果投诉
快科技1月6日消息,英国一家新闻媒体机构向苹果公司投诉Apple Intelligence的通知摘要功能。作为Apple Intelligence功能的一部分
2025-01-06 00:46:00
不到7mm!苹果三星杀入超薄手机赛道
快科技1月6日消息,据媒体报道,苹果三星两家公司今年开始进入超薄手机赛道,苹果将在下半年发布iPhone 17 Air
2025-01-06 01:16:00
本文转自:人民日报海外版人工智能背景下,对影像真实再思考第十四届中国纪录片学院奖颁奖《人民日报海外版》(2025年01月06日第 07 版)本报电 (记者徐嘉伟)日前
2025-01-06 05:01:00
“小潮玩”撬动海外大市场(专家解读)
本文转自:人民日报海外版■ 受访专家:中国社会科学院财经战略研究院研究员 李勇坚《人民日报海外版》(2025年01月06日第 10 版)2024年的东莞漫博会上
2025-01-06 05:08:00
本文转自:人民日报《人民日报》(2025年01月06日第 11 版)本报北京1月5日电 (记者金歆)记者从中央网信办获悉
2025-01-06 05:42:00
本文转自:人民日报自动充绒精度达零点零一克,面料覆盖十五微米厚高分子膜羽绒服里的“科技范”(身边的创新)本报记者 王伟健《人民日报》(2025年01月06日第 02 版)寒冬已至
2025-01-06 05:42:00
二〇二五,这些科技热点值得期待(科技视点)
本文转自:人民日报图①:位于四川省甘孜藏族自治州稻城县海子山上的高海拔宇宙线观测站“拉索”。刘学懿摄(影像中国)图②:2024年12月5日
2025-01-06 05:57:00
本文转自:人民日报杨清越以深度学习为核心的当代人工智能正越来越多地应用于考古学研究领域。考古学与人工智能,一个在飞扬的尘土中艰苦发掘
2025-01-06 05:58:00
食贫道《人间喜剧》获2024百大UP主年度最佳栏目
快科技1月6日消息,在昨晚举办的B站2024百大UP主颁奖典礼上,食贫道的《人间喜剧》获得2024UP100百大UP主单项奖-年度最佳栏目
2025-01-06 07:16:00
如果人类都起源于非洲 那不同肤色是怎么出现的
众所周知,深色皮肤的遗传性很强,无论白种人还是黄种人,只要和黑种人结婚,他们的孩子肤色就会很黑。因此很多人可能会有疑问
2025-01-06 07:16:00
工信部、国家广播电视总局、国家知识产权局近日公布2024年度视听系统典型案例名单。山西汉威激光科技股份有限公司研发的激光大屏背投可拼接显示器位列其中
2025-01-06 07:02:00
无人机操纵员人才缺口达100万 月薪最高到两三万元
快科技1月6日消息,随着低空经济的蓬勃发展,相关行业对飞行员、飞控手以及飞行器研发等专业人才的需求呈现出显著增长趋势。据业内估算
2025-01-06 07:16:00
创业是条不归路!段永平:如果重来 我就找份工作好好享受人生
快科技1月6日消息,之前周鸿祎公开表示,打工可以赚钱,但不可能赚大钱发大财的。“不论你多努力工作,也只能就是养家糊口,没有人可以通过打工赚到财富自由的钱
2025-01-06 07:16:00
本文转自:环球时报年头岁尾往往是手机厂商打折促销的一个小高峰,今年在各厂商之外,消费者更迎来了官方的“福利”。日前,国家发展改革委宣布将对个人消费者购买手机
2025-01-06 06:53:00
青藏高原重大发现:铜矿资源量2000余万吨
快科技1月6日消息,据报道,我国在青藏高原取得找矿重大突破,新发现铜矿资源量2000余万吨。据介绍,青藏高原上,玉龙、多龙
2025-01-06 07:16:00