• 我的订阅
  • 头条热搜
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
人工智能应用场景不断拓展
...业大模型占比七成。大模型已具备文本、语言、视觉的多模态能力,成为推动产业发展与社会进步的重要变量。在阶跃星辰创始人兼首席执行官姜大昕看来,通用人工智能的实现路径可以划分为模拟世界、探索世界和归纳世界3...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
OpenAI没有放弃的机器人梦想
...捕捉到的语音转录文本,输入到一个由OpenAI训练的大型多模态模型中,然后由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。“同样的模型,也负责决定在机器人上运行哪些学习的...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...麦克风捕捉的语音,转录为文本输入到由OpenAI预训练的多模态大模型中,模型能够理解图像和文本。模型会处理整个对话的历史记录,包括以往的图像,以生成语言响应,再通过文本到语音的方式向人类回话。△Figure 01训练方法...……更多
...要物理世界数字化,实现知识找人,能够陪伴执行。而跨模态大模型是其中的技术关键。(记者 黄心怡) ……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
苹果发布mm1.5-ui模型
10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模...……更多
...机、PC等,张雪薇看好相关产业链机遇。 大模型正在向多模态发展,由之前的文本、语音到现在的图片,包括未来视频,不同的媒介会诞生出新的应用,会把模型通用化能力提升,未来比如广告推荐、用户画像都会像大模型靠拢...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...来,于今年3、4月陆续推出了Grok-1.5大语言模型和首个多模态模型Grok-1.5 Vision,整体迭代速度已足够惊人。但要超越当前所有AI大模型,Grok-2要面对的问题或许远没想象中简单。所有指标超越当前AI大模型,真的假的?2023年11月,x...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...模和处理,提升模型的准确性和专业能力,更好地适应多模态数据及复杂/特定任务计算。二是根据任务的需求灵活选择并组合适宜的专家模型,使得模型能够动态地适应不同的输入样本和任务场景,提高模型的灵活性、可解释...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...文件上传,而此前是只能进行文字输入,也就是新增了多模态理解,不过网页搜索功能仍未上线,这点倒是让人感到遗憾。对于o1满血版的提升,OpenAI的CEO奥特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...两个非常重要的特性:首先,语言区域表现出输入和输出模态的独立性,这是表征抽象性的关键特征。主要表现为在理解过程中,这些大脑区域对跨模态(口头、书面或手语)的语言输入做出反应。同样,在语言生成过程中,无...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...题。此外还有一个更加实际问题是,与现有的 GPT-4 等多模态模型相比,据称「草莓」仍然缺乏多模态处理能力,这也意味着它在处理图像、视频等复杂数据时可能面临局限性。 还有价格。首先要说明的是,在官方还未发布甚至...……更多
...化以及推理部署验证,包括语言大模型、视觉大模型和多模态大模型。让大模型通过知识学习和技能学习,快速应用于用户的业务场景中。民生证券最新研报指出,昇腾AI一体机是国内AI软硬件技术的黄金交点。乐观预计,2027年G...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...ified Autonomous Driving)的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示通用人工智能(AGI)技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...)创新性地推出了“一体两翼”产品矩阵,包括自研的多模态知识引擎与行业通用智能体平台,致力于构建未来通用人工智能(AGI)时代的核心数据基础设施,为企业提供大模型与知识引擎双轮驱动的解决方案。枫清·天枢多模...……更多
豆包再降价,字节“饱和式”进攻仍在继续
...AGI更进一步,大家都在加速。实际上,字节对视觉化、多模态模型的重视度肉眼可见的提升。12月11日,据智能涌现报道,字节提升了即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。字节计划后续把更多资源向更多模...……更多
更多关于科技的资讯:
2025开年首款新机!REDMI Turbo 4开启预约:首发天玑8400-Ultra
快科技12月23日消息,REDMI Turbo 4目前已经正式开启预约,该机将于2025年1月发布,是2025开年首款新机
2024-12-23 18:33:00
韩国学术界呼吁效仿台积电成立KSMC:维持半导体领导地位
快科技12月23日消息,据媒体报道,韩国国家工程院(NAEK)近日在首尔举行的研讨会上,讨论了效仿台积电成立韩国半导体制造公司(KSMC)的计划
2024-12-23 18:33:00
央视曝光智能门锁突然自燃失火原因!看完速转发给家人
快科技12月23日消息,据央视报道,日前,贵州贵阳一小区位于13层的住宅发生火情,消防员到场后发现,房屋门锁紧闭,无人员在内
2024-12-23 18:33:00
小米SU7最新版本OTA推送:正式接入VLM视觉语言大模型
快科技12月23日消息,小米汽车官方宣布,小米SU7汽车已接收到Xiaomi HyperOS 1.4.5版本的OTA更新
2024-12-23 18:33:00
近日,中新经纬小编跟随搬家师傅体验了“搬家小哥”的一天。曹师傅表示:“老手平均一个月挣一万四五没问题,单王也能到两万。也有挣几千的
2024-12-23 18:47:00
雷克萨斯ES200高速上追尾气囊未弹 车主:当时时速已经到100km/h了
快科技12月23日消息,据博主“拜托了老司机”透露,近日,一位雷克萨斯ES200车主向其反映,他车在高速上发生追尾事故
2024-12-23 19:03:00
能载人、会托马斯全旋!年度最强国产四轮足机器人来袭
快科技12月23日消息,今日下午,宇树科技官方发布消息称:在发布量产一年后,Unitree B2-W工业轮足,觉醒了更多极限天赋技能
2024-12-23 19:03:00
渔民捕到205斤野生石斑鱼引围观:售价达5位数
据悉,这条石斑鱼重量达205斤,目击者称这样的大鱼还是第一次见,65一斤卖了1万多元。据视频显示,这条石斑鱼的体重惊人
2024-12-23 19:03:00
新疆精梳长绒棉:南极人纯棉保暖内衣套装29元发车
天猫南极人时尚旗舰店,南极人纯棉保暖内衣套装日常售价59元,下单领30元优惠券,到手价29元。共有10款可选,包含圆领款
2024-12-23 19:03:00
本田CEO:与日产合并不是在救助日产 而是本田在扩张
快科技12月23日消息,据报道,本田和日产在今日举行了记者会,讨论经营统合(经营整合)的事宜。本田和日产声明:欲通过潜在合并实现30万亿日元的联合销售目标
2024-12-23 19:03:00
照着迈巴赫:造不出一台中国行政旗舰
2016年10月,纽博格林北环赛道的圈速榜上,第一次有中国品牌的身影。蔚来的纯电超跑EP9,空运到德国后,遇上雨天,只用三圈机会就创下纽北最快电动汽车圈速纪录
2024-12-23 19:03:00
还能再涨23%!AI宠儿NVIDIA成大摩明年首选
快科技12月23日消息,据报道,摩根士丹利(Morgan Stanley)最新报告指出,NVIDIA仍是其明年的“首选股”
2024-12-23 19:03:00
主美术罕见谈《仙剑4》:酒色财气4大迷宫最初都有 砍掉2个并非没钱
快科技12月23日消息,《仙剑奇侠传四:重制版》的先导PV预告一经发布,便迅速点燃了无数仙剑粉丝的热情与期待。特别是对于那些曾让无数人魂牵梦绕的琼华派“须臾幻境”中的“酒色财气”四大考验
2024-12-23 19:03:00
苹果正在开发一种新的智能门铃摄像头
12月22日消息,据彭博社MarkGurman(马克・古尔曼)今日爆料,苹果正在开发一种新的智能门铃摄像头,支持使用FaceID解锁
2024-12-23 19:24:00
张继科下场做直播了:199元乒乓球录播课3小时卖了25万!
快科技12月23日消息,据媒体综合报道,近日,乒乓球奥运冠军张继科在“张指导乒乓”账号开播。12月20日,张继科直播时不仅介绍了自己新代言的运动品牌
2024-12-23 19:33:00