• 我的订阅
  • 头条热搜
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
...通用机器人算法体系。今年5月,该团队还发布了具身多模态大模型Grounded 3D-LLM,能够自动化生成物体到局部区域的场景描述与具身对话数据,有效缓解了目前三维场景理解的局限性。论文地址:https://arxiv.org/abs/2407.10943GitHub地址...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
硅谷顶级VC的最新洞察:AI公司应该专注用户需求,而非模型构建
...司,直到ChatGPT的飞速增长引起了广泛关注。我认为不同模态的模型或模型应用领域存在机会,比如视频领域、生物技术、临床医学等。我认为我的基金将大部分投资于应用方向,但目前还投资了一些基础模型公司。Elad Gil:我非...……更多
小模型正在成为AI界的新宠
...源的 GLM-130B 模型,具有 1.3 万亿参数。 M6:达摩院的多模态预训练模型 M6,拥有 10 万亿参数。 然而这种大模型之间的军备竞赛,令业内十分担忧。参数量的增加,就一定能带来显著的性能提升吗?不一定。大模型带来的问题...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
又热闹了!OpenAI的加强版“Her”正式开放,压过了Gemini的“生产级”大升级…
...然语音对话获得了实时解答。目前,OpenAI尚未提供这项多模态功能的推出时间表。此外高级语音模式也暂时不对欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放。尽管如此,终于能亲自上手OpenAI版的“her”,对已经混AI...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...场,隆重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能(AI)领...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...年 4 月。 定制化:GPT3 16k、GPT4 微调、定制模型服务。 多模态:Dall-E 3、GPT4-V 和 TTS 模型现已在 API 中。 Whisper V3 开源(即将推出 API)。 与开发者分享收益的 Agent 商店。 GPT4 Turbo 的价格约是 GPT4 的 1/3……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...更加符合预期的结果。整体来看,缺乏交互式数据分析的基准——是本次研究面临的最大问题之一。为了解决这一问题,他们以“斯坦福小镇”项目为启发,创建了“DECISION COMPANY”。“DECISION COMPANY”是数据分析领域的首个多代...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...,最后就可以完成用户任务。可见,想要把类似GPT-4V的多模态大模型应用于操作系统上,模型还需要具备强大的屏幕解析能力,主要包括两方面:1、准确地识别用户界面中的可交互图标;2、理解屏幕截图中各种元素的语义,并...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...在走。机器之心:这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是?统一具身模型的技术方向,既完全不同于传统机器人学习的小模型技术,也完全不同于以往语言、多模态大模型的技术。首先...……更多
生成式AI:手机厂商高端梦最后的希望
...搬上手机?Amon认为,目前大模型正朝着“轻量化”“多模态”方向发展,以云端作为AI大脑,边缘端和终端作为小脑,这样一种云+端的“混合AI”模式成为技术发展的主要趋势。如何将AI大模型搬到手机上,手机厂商应充分考虑...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...示,在接下来的几个月中,他们预计将推出新功能(如多模态)、更长的上下文窗口、更多不同大小版本的模型和更强的性能,以及 Llama 3 研究论文。另外,Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM Wats.……更多
马斯克的AI大模型登场
...用户每天为推特生产包括文本、图像、视频在内的巨大多模态数据库。在算力方面,之前有消息称,马斯克一次性从英伟达购买了1万个处理大型AI模型数据的GPU,总费用达数千万美元,或许就是为了xAI。xAI官网信息也显示,“xAI...……更多
2023-11-06 09:22:00马斯克的AI大模型登场
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...和平台的发展:1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;2、弥合 System 1(负责低级控制)和 System 2(负责高.……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
...认为,该成果具有广泛的应用潜力,可以推广到文音视图模态的不同任务上,包括多模态理解、生成基座模型等。5. 写在最后团队关注底层问题,尤其在 LLMs 和多模态方面,期望实现更多突破。更多团队技术研究进展,可以通过...……更多
姚班天才组队开发《完蛋!我被大模型包围了》续作!专为摸鱼爱好者打造
...子工作室”,还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后,现在上线微信小程序,搜索头号做题家,人人都能玩。好奇,自家后浪能把前浪拍死在沙滩上不? 来揭开《我把大...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...像与人类互动。由此,谷歌追随者高呼:“Gemini让原生多模态(即文本、声音、视频等模态)真正做到丝滑融合,发展原生多模态将成为未来主流路径!”视频发布不到一天,这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多
更多关于科技的资讯:
抢先一步来体验吧!华为小艺网页版上线啦
快科技2月28日消息,今天真是个好日子,继原生鸿蒙版小艺App上架后,华为小艺网页版也迎来了上架!据了解,小艺网页版是一款功能丰富的人工智能在线服务平台
2025-02-28 11:07:00
一举打破六项记录!ROG Astral夜神RTX 5090频率狂飙3.45GHz
快科技2月28日消息,日前华硕宣布,其ROG Astral GeForce RTX 5090 OC Edition显卡成功打破了6项超频纪录
2025-02-28 11:07:00
人人买得起!努比亚Flip 2定档3月4日:国民小折叠
快科技2月28日消息,努比亚Flip 2今天正式官宣,将于3月4日发布,定位国民小折叠。据悉,前代努比亚Flip定价只要2999元
2025-02-28 11:07:00
玄铁最高性能处理器!阿里达摩院玄铁首款服务器级CPU下月交付
快科技2月28日消息,在今天达摩院举办的2025玄铁RISC-V生态大会上,官方宣布玄铁最高性能处理器C930即将在3月开启交付
2025-02-28 11:07:00
理想首款纯电SUV i8更多官曝:座椅样式大更新
快科技2月28日消息,理想汽车公布了首款纯电SUV车型i8的更多官图,展示了新配色,并且可以看到内饰部分细节。不同于前两次发布的白色
2025-02-28 11:07:00
女网红顾茜茜多平台被禁言!曾自曝躺床上什么也没干一天收入30万 骂声越大赚得越多
快科技2月28日消息,近日,自曝“躺床上什么也没干一天收入30万元”的网红顾茜茜引发极大争议。最新消息显示,其多平台账号已被禁言
2025-02-28 11:07:00
积极拥抱DeepSeek 烟台高新区驶入数智化发展快车道
鲁网2月28日讯(记者 魏萱)新年伊始,国产开源大模型DeepSeek火热出圈,引发各行业用户追捧。走在科技前沿的烟台高新区紧跟潮流
2025-02-28 11:16:00
民营经济迎利好!10年服饰老厂在SHEIN“爆单”上岸
所谓衣食住行,衣为先,潮州老板宋骏一直在服饰制造这个赛道上摸爬滚打。在这一领域里,经验丰富的大厂商、大品牌们早已布局多年
2025-02-28 11:23:00
本文转自:人民网人民网北京2月28日电 (记者赵竹青)记者从中国科学院获悉,2月28日,国家重大科技基础设施“冷泉生态系统研究装置”(以下简称“冷泉装置”)在广州市全面启动建设
2025-02-28 11:36:00
罕见!极氪汽车:祝贺小米SU7 Ultra成功发布
快科技2月28日消息,车圈儿罕见的一幕发生了!就在刚刚,极氪汽车发布微博称“祝贺小米SU7 Ultra 成功发布”,而配图则是一台正在赛道上驰骋的极氪001 FR
2025-02-28 11:37:00
4499元开卖!iPhone 16e黑、白两色真机图一览:黑边宽到窒息
快科技2月28日消息,如果你有4000+预算,你会毫不犹豫的买iPhone 16e吗,暂且不说单摄、256GB这些落伍的配置
2025-02-28 11:37:00
中国科大郭光灿院士团队量子研究有新进展
大皖新闻讯 据中国科学技术大学官网消息,该校郭光灿院士团队在多体量子非局域性研究方面取得重要进展。该团队李传锋、黄运锋
2025-02-28 11:38:00
康士伯数字携手客户共赢共生,共绘数字化转型新蓝图
一场意义非凡的历史性盛会近日,康士伯数字成功举办了一场意义非凡的历史性盛会——“明日秀”。此次展会汇聚了来自各行各业的领袖与专业人士
2025-02-28 11:45:00
FIBBR菲伯尔镀银DP80电竞线 | 次世代显卡的理想伙伴
近期,万众期待的RTX5070Ti终于上市了,这次50系显卡也更新的DP接口,升级成了DP2.1,以满足高分辨率和高刷新率的游戏及专业应用需求
2025-02-28 11:45:00
漫评丨公共规则面前,没有明星特权
□潘宁 史博文 廉征近日,一男团在深圳宝安机场插队登机,引发现场群众不满。这一事件再次将“明星特权”推向公众视野,这不仅暴露了个别群体的规则失范
2025-02-28 11:56:00