• 我的订阅
  • 头条热搜
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
阿里云开源通义千问多模态大模型Qwen-VL 【阿里云开源通义千问多模态大模型Qwen-VL】《科创板日报》25日讯,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
格灵深瞳:对多模态大模型以及生成式AI的重视程度已经提升到战略层面 【格灵深瞳:对多模态大模型以及生成式AI的重视程度已经提升到战略层面】财联社8月2日电,格灵深瞳披露投资者关系活动记录表显示,公司对多模态大...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
...器人视觉观测和自身状态向量输出运动轨迹,将端到端多模态模型置于模仿学习框架下,并结合数据回收系统,让机器人具备拟人的双臂操作能力。Cyan 青心意创表示,OrcaⅠ 从操作模型、多模态处理能力、数据及传感器等方方...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
入选高工人形机器人优质企业链,银牛微电子3D空间计算解决方案获高度认可
...现具身智能。该方案不仅融合了语音、文本和图像等基础模态,还加入了3D点云模态,通过强化的多模态关联技术,显著提升人形机器人的智能水平和逻辑自洽性。与此同时,银牛还拥有丰富的三维空间多模态大模型数据库,可...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
北京:促进研发自然语言、多模态、认知等超大规模智能模型 【北京:促进研发自然语言、多模态、认知等超大规模智能模型】财联社7月5日电,中共北京市委、北京市人民政府日前印发《关于更好发挥数据要素作用进一步加...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
meta将于下周预告两款llama3ai模型
...的消息来源称,该公司可能会在下周推出两款小型、非多模态版本的Llama3,然后在今年夏天发布最大的Llama3型号(将是多模态的)。MetaCEO马克・扎克伯格今年1月就在Instagram视频中宣布,MetaAI已经开始训练Llama3。 ……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
...流,发现14%的创业者聚焦于底层技术,57%的创业者聚焦多模态应用,29%的创业者聚焦于语言类应用。3个月后的跟踪数据显示,底层技术创业的占比提升到29%,多模态应用下降到44%,语言类应用维持在27%的水平。这意味着,能够...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
...介绍,流畅的人机交互离不开其自主研发的人形机器人多模态交互系统,接入AI大模型能够更好赋能人形机器人,让机器人具备更强的智能化和泛化能力。展会上,达闼首次展示人形双足机器人“七仙女”小紫,它搭载海睿云端...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...ified Autonomous Driving)的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示通用人工智能(AGI)技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未...……更多
“沪企通”政策大模型亮相2025世界人工智能大会,数喆数据联合上海数据集团打造AI政务新标杆
...程指引、材料清单,让政策申报实现“掌上速办”。 多模态识别智能体:通过多模态图像识别技术,识别申报表单、政策文本,补全用户意图并匹配政策。依托多模态图像识别技术(覆盖表单照片、模糊政策图片等复杂场景)...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
更多关于科技的资讯:
7月25日,位于邢台市沙河市的河北德金玻璃有限公司三线生产车间,两条生产线上不同规格的玻璃从自动传送带缓缓下线,一台台机械臂来回抓取新鲜出炉的玻璃原片
2025-08-17 07:29:00
90后寒门CEO,帮了雷军一个大忙
小米汽车YU7爆单后,车越欠越多,根本交付不完。即便雷军7月10日称小米汽车交付已超过30万台,但后面还有小米YU7迫在眉睫的24万个新订单
2025-08-16 15:53:00
用AI帮中小企业傻瓜式获客,这个营销Agent收入每月增长150%
文|邓咏仪编辑|苏建勋2024年中离开阿里,开始在Agent赛道创业时,郭振宇面临不少质疑:到底是做AutoAgent(自主代理
2025-08-17 02:24:00
“产业链上的山东好品牌”青岛市系列现场媒体见面会|现代轻工产业链专场——利和味道(青岛)食品产业股份有限公司
鲁网8月16日讯8月15日,在青岛鑫复盛集团有限公司,青岛市政府新闻办举行“产业链上的山东好品牌”青岛市系列现场媒体见面会第三场——现代轻工产业链专场
2025-08-16 09:40:00
通讯员 张汶宁8月14日,山东泰安举办“产业链上的山东好品牌”泰安企业家系列记者见面会首场活动。泰开集团、泰和电力、山东瑞福锂业
2025-08-16 09:56:00
聚焦长春农博会 |流量经济直播间首秀 “千万销量”引爆“线上农博”
8月15日,第二十四届长春农博会开幕首日,长春农博园3号馆内气氛热烈,吉林省流量经济赋能电商直播首场活动正式拉开帷幕。联合抖音
2025-08-16 10:29:00
首店经济引爆消费热潮,万达“提质提级”重构齐鲁商业生态
8月15日,盒马鲁中首店于淄博富力万达广场盛大开业。这不仅标志着盒马成功布局山东第七城,其开业即火爆的盛况,更凸显了“首店经济”在激发区域消费活力中的关键引擎作用
2025-08-16 10:30:00
新闻发布在一线|产业链上的“枣庄辣子鸡”串起富民增收路年销售额突破50亿元
鲁网8月16日讯近日,“产业链上的山东好品牌”枣庄市新型商贸物流产业链专场记者见面会在枣庄辣子鸡博物馆举行。见面会聚焦枣庄辣子鸡产业
2025-08-16 12:01:00
助力乡土好物跃上云端 汇丰海传媒助农电商平台正式成立
鲁网8月16日讯(记者 于胜涛)8月15日,位于即墨区龙润卓越中心的青岛汇丰海文化传媒有限公司正式开业,由其打造的助农电商平台同步启动
2025-08-16 13:12:00
潍坊昌乐培茁种业:数字赋能,“慧”就现代农业“新蓝图”
大众网记者 王帅 潍坊报道在潍坊昌乐这片被誉为“中国西瓜之乡”的热土上,一座占地4.5万平方米的现代农业科技创新高地正在改写传统农业的基因
2025-08-16 16:01:00
京东收购佳宝超市:全港三天八折,还有6万份长者月饼礼盒暖人心
8月16日,继昨日官宣完成对香港佳宝食品超级市场(以下简称“佳宝”)的收购后,京东在香港佳宝门店举行记者见面会,宣布将通过自身的供应链优势
2025-08-16 16:28:00
“窝囊蹦极”“窝囊爬山”“窝囊漂流”,这个夏天,“窝囊废旅游三件套”在社交平台刷屏。浙江安吉龙出没大峡谷的“躺平漂流”单日门票销售额逼近40万元
2025-08-16 16:55:00
临沂职业学院成功试运行宠云行至圆通无人机物流航线
齐鲁晚报·齐鲁壹点 通讯员 张琳近日,临沂职业学院无人机物流航线开通飞行仪式在临沂商贸物流城举行。学院自主研发的无人机满载货物由宠云行智慧云仓起飞
2025-08-16 17:15:00
2025手机消费观察:七成用户关注折叠屏手机 多形态多场景融合是核心吸引力
手机已经从通讯工具成为了生活的集成入口,消费者对手机功能的需求和选择也在不断发生变化,近日,京东消费及产业发展研究院联合京洞察发起调研
2025-08-16 20:23:00
聚焦长春农博会 |达人带队“云逛展”!展位直售实时互动
8月16日,2025吉林农博会进入第二天,热度持续飙升!吉林省流量经济赋能电商直播达人罗凤魁农博现场化身“农博导游”,深入选品会合作企业展位
2025-08-16 22:00:00