• 我的订阅
  • 头条热搜
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...的认知上面,还是完全空白的。进入到 3.0 时代,随着多模态模型的产生,开放词汇感知模型的进化,以及大语言模型、基础模型的革新,我们可以看到机器人开始逐步解锁更多样化的场景,甚至是能够在多种场景执行多种任务...……更多
网易有道周枫:AI PC将是工作、学习、生活的个人全能助理
...模型具备全科知识整合能力,知识覆盖面广。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。“AI PC将为产业及生态带来巨大的发展机会。”他在演讲时进一步表...……更多
...提到,现阶段大模型的发展主要停留在语言层面,随着多模态大模型的不断深入,以“具身机器人”为代表的未来人工智能应用会越来越广泛,成熟的AGI 能够更好地学习、模拟人类的情绪、创造力、图形结构等方面的认知,对...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
由厦门市人民政府主办的第五届中国人工智能大赛正式启动
...生成式人工智能技术快速发展,人工智能生成内容具有多模态、高品质、主题丰富等特点,迅速在多个领域得到广泛应用,但其潜在的滥用和版权等风险也受到国家高度重视。为应对风险,可通过在内容生成过程中添加显式水印...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
智能呼叫系统哪家不错呢
...案提供商。通过自主研发的领域大模型、大数据分析、多模态交互三大核心技术,打造了数字化洞察与营销、数字化服务与运营、数“智”底座三大产品矩阵,全面升级云呼叫中心、智能客服、智能外呼、质检陪练、智能音视频...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
【V观京津冀 新质铸辉煌】AI如何让工作更加高效便利?
...经历,而在该AI数字人的背后,是“360智脑4.0”强大的多模态能力的支撑。AI数字人具有诸多应用场景,可以代替人发言,担任主持人、讲师、旅游大使等工作。除了AI数字人,360科创园还向记者展示了可以帮助分析视频、论文的...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
...域的应用大多还停留在自然语言交互的阶段,尚未走到多模态级别。”王挺坦言,“除此之外,我们在工业软件、控制器、网络结构等方面存在的短板也会影响大模型在工业领域的落地速度。”作为底层硬件与上层应用之间的桥...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...精力进行解析,能够识别出其中的文本、图表、图片等多模态内容,同时将这些图表、图片信息做了相应的检索库。此外,天工AI还构建并搭载了分钟级的信源收录系统,能够更快地收集全网高价值信息;构建了自研搜索引擎、...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...个性化,能够更准确地理解和满足用户的需求。同时,多模态的交互体验包括语音、手势、虚拟现实等,将在可预见的未来与办公场景深度融合,用户可以通过更自然、直观的方式与AI助手进行沟通和操作,提升使用的便捷性和...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
更多关于科技的资讯:
美团无人机获得迪拜首张无人机配送商业运营资质证书
IT之家 12 月 18 日消息,美团无人机今日宣布,迪拜王储、阿联酋副总理兼国防部长、迪拜未来基金会(DFF)董事会主席谢赫・哈曼丹・本・穆罕默德于 12 月 17 日在迪拜无人机物流商业化运营启动仪式上
2024-12-19 09:35:00
极氪汽车CES 2025上隆重推出三款纯电车型
12月18日,极氪汽车宣布,将于2025年国际消费电子展(CES2025)上,展示其先进的电动汽车技术,并隆重推出三款纯电车型
2024-12-19 00:14:00
为啥你拼命存的资源 最后又不想点开了
你有数字囤积癖吗?世超有。症状是这样的: 只要在互联网上刷到了感兴趣的工具、影视、学习资源,我都第一时间保存。听着很正常
2024-12-19 00:21:00
能看风水 夸我有情趣 Kimi现在都这么野了吗
最近,差评君发现了个新鲜玩意儿。喂给 AI 一张图,它就能给你推测出一个人的性格。光靠歌单,就能把人最近的心理状态推测个七七八八
2024-12-19 00:21:00
旅行博主上街要钱13天要到6800块:没尽力 尽力能要到1万
快科技12月18日消息,青春没有售价,要饭也能要到拉萨。日前,旅游博主“但行万里路”发视频称,这两天没有努力工作,最近13天把整个大理古城要了个遍
2024-12-19 00:51:00
字节跳动旗下即梦ai图片模型2.1正式上线
12月18日,字节跳动旗下即梦AI宣布,全新图片模型2.1正式上线,支持用户通过简单指令控制文字的颜色、位置等元素,快速生成中英文图像海报
2024-12-19 01:16:00
谷歌发布新型ai图像生成工具
12月17日,谷歌发布了一款名为Whisk的新型AI图像生成工具。Whisk的最大亮点在于,用户无需编写冗长的文本提示
2024-12-19 01:46:00
英伟达推出全新游戏优化应用“英伟达应用”
近日,英伟达推出的全新游戏优化应用“英伟达应用”(NvidiaApp),旨在取代原有的GeForceExperience
2024-12-19 01:48:00
iphone17系列渲染图曝光
12月18日消息,有博主基于曝光的信息绘制了iPhone17系列渲染图,对比iPhone16系列,17系列最大变化是采用横置相机模组
2024-12-19 01:51:00
飞利浦“能量块”五合一充电宝上架
在当今快节奏的生活中,移动设备如手机、平板电脑、蓝牙耳机等已成为人们生活中不可或缺的一部分。然而,这些设备的电池续航能力往往无法满足人们旅行期间的电量需求
2024-12-19 02:39:00
一加ace5pro旁路供电功能曝光
12月17日,据爆料称5系列将于本周官宣、下周发布。一加Ace5Pro最大的亮点是支持旁路供电功能。这项技术允许外部电源直接为设备供电和充电
2024-12-19 02:44:00
meta-banmeta智能眼镜v11更新
12月17日,Meta公司对其Ray-BanMeta智能眼镜进行了v11更新。本次更新的最大亮点是“实时AI”(LiveAI)功能
2024-12-19 02:47:00
一加 Ace 5系列内存配置和硬件配置全面曝光
12月17日消息,一加Ace5系列内存配置和硬件配置全面曝光,一加Ace5和一加Ace5Pro两款机型的硬件差异主要是处理器
2024-12-19 02:49:00
微信又上新功能,这次有定制音色了
据微信派公众号18日消息,微信最近上线了“作者朗读音色”新能力,用户点击“听全文”,就能够“听”到作者音色朗读的公众号文章
2024-12-19 02:58:00
宝马公司叫停1000kw电动m1继任者开发计划
近日,爆料称宝马由于盈利能力、技术可行性以及电动汽车市场销售放缓等多重因素,公司决定叫停1000kW电动M1继任者的开发计划
2024-12-19 03:19:00