• 我的订阅
  • 头条热搜
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...社交音乐舞蹈类AIGC应用 具体来说,鹦鹉人是一款基于多模态AI大模型PARO构建的,聚焦虚拟数字人形象、虚拟唱歌、虚拟舞蹈、虚拟陪伴和语聊的消费级AIGC应用。用户上传照片后,即可在鹦鹉人APP中生成个性化的3D虚拟形象。系...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI
(图片来源:林志佳拍摄)国内活跃度最高的AI大模型应用正走向“多元化”。12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...或者语音的交互。这促使我们思考:如何构建具有更丰富模态的3D自主角色呢?要实现这个目标,主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息,并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多
自主研制!我国发布“全球首个”
...。 “空天·灵眸”2022年首次推出,是我国:首个面向多模态遥感数据生成式基础模型;首个专为遥感领域打造的专业基础模型。今年3月起,研究团队基于中国算力网“鹏城云脑II”枢纽节点,历时数月攻关完成了在4亿张国产化...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...模和处理,提升模型的准确性和专业能力,更好地适应多模态数据及复杂/特定任务计算。二是根据任务的需求灵活选择并组合适宜的专家模型,使得模型能够动态地适应不同的输入样本和任务场景,提高模型的灵活性、可解释...……更多
...大模型则是 OpenCSG 算法团队正在研发中的开源大模型、多模态大模型和垂类模型系列,优势在于开源协议友好、工具链完整,并针对特定垂类场景进行优化。除了建设开源社区,OpenCSG过去数月还在多个行业推出大模型应用解决...……更多
依图科技“天问”大模型赋能安防,智慧应急跨越式发展
...防行业正经历着前所未有的变革。作为应用人工智能和多模态大模型的先锋领域,安防行业不仅展示了其强大的产业基础,更在发展新质生产力方面彰显出卓越的能力和潜力。依图科技,作为AI领域的先行者和创新者,多年来一...……更多
让甲骨文“开口说话”:AI技术赋能文化传承
...)发布博文,宣布该校团队正尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的甲骨文考释工作。甲骨文简介IT之家援引博文介绍,甲骨文也被称作“殷墟文字”,距今已有三...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
大模型到了该「验收」的时候
...最后,以Stable Diffusion为首的技术突破也使得大模型在多模态内容创作生成上表现极佳。抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
2月十大牛股出炉:克来机电超207%涨幅问鼎榜首
...。维海德在回复深交所关注函中表示,公司自主研发的多模态白平衡算法,并非是当前市场关注的与OpenAI相关的多模态AI大模型,多模态白平衡算法与多模态AI大模型存在本质区别。资料显示,维海德主要从事高清及超高清视频...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...能(GMAI):GMAI 是指能够广泛应用于不同医疗场景下的多模态人工智能模型,其中大型语言模型常作为人机交互的纽带。采用多语言的医疗模型,替代以往以英语为中心的模型,能够充分利用全球多种语言的数据资源,从而扩展...……更多
烟台毓璜顶医院毛宁:大数据与人工智能帮他开“慧眼”,让疾病无处遁逃
...佛多了一双“慧眼”,在面对疾病时更得心应手。建立多模态数据库,借助影像人工智能技术来预测肿瘤分期及预后情况,并利用多种成像方式分析大脑结构、功能和代谢等生理变化与精神疾病的关联,毛宁和团队正致力于推动...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
“智汇行动·概念验证创新大赛”人工智能专场路演活动举行
...题。活动现场,“AI人形机器人数据解决方案”“基于多模态数据融合的车载辅助驾驶系统”“医疗大模型驱动的科普数字人”等项目负责人相继进行路演分享,现场评委针对项目的技术水平、行业及市场前景、团队等方面进行...……更多
...脏污,从而实现干湿分离清洁。同时,新品搭载的云鲸多模态大模型NarGPT大幅提升了语音助手精准理解和自然交互的能力,开启了AI全智能清洁时代。据介绍,新品配备了两颗视场角高达136度的超高清RGB摄像头,使得机器人在清...……更多
麻省理工学院研发出多模态织物,能高效过滤声音
...,来自麻省理工学院(MIT)的科研团队成功研发出一种多模态织物,能高效过滤声音,相关成果发表在《先进材料》(AdvancedMaterials)杂志上。MIT团队早前创造了一种可以充当麦克风并放大声音的丝绸织物,而最新研究基于这项...……更多
...原生HTAP数据库,支持包括向量数据、时序数据在内的多模态数据管理和检索能。MatrixOne不仅实现了向量类型、向量搜索和向量索引功能,还通过其MatrixGenesis产品提供大模型托管和多模态检索服务,为企业搭建一站式生成式AI应...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一,甚至还支持国风水墨,支持在图片生成过程中,增加汉字...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...型也有局限性。首先,OpenAI o1模型(至少目前)还不是多模态大模型,同时在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面,GPT-4o依然是更胜一筹的选择。当然,OpenAI明确表示未来会给这个模...……更多
什么影响大模型安全?NeurIPS\'24新研究提出大模型越狱攻击新基准
...融等关键行业,评估并保障这些领域中LLMs的安全性。 多模态扩展:探索多模态数据的越狱评估,结合文本、图像、音频等多种数据类型,全面评估LLMs在多模态环境下的安全表现。 协作防御机制:开发基于多Agent的协作防御机...……更多
苹果大模型,不藏了
...模型领域的步伐。上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内...……更多
多模态AI午前大涨,游戏ETF半日涨幅近4%
今日午前,多模态AI题材午前崛起,Sora方向领涨,其中,游戏ETF(516010)和游戏ETF(159869)半日涨幅分别达到3.95%和3.93%,领涨整个ETF市场。投资逻辑方面,日前,谷歌发布了基础世界模型Genie,Genie是一个110亿参数的基础世界模...……更多
应用端加速落地 AI板块掀“多模态”热潮 【应用端加速落地 AI板块掀“多模态”热潮】财联社12月13日电,昨日A股市场AI赛道个股走势有所分化,但“多模态”AI板块持续走高。本轮AI板块行情的热潮似乎冲劲未减,应用端场景...……更多
更多关于社会的资讯:
大河网讯 9月23—24日,由中华人民共和国商务部主办、河南工业大学承办的两场意义非凡的援外培训项目结业典礼在郑州相继举行
2025-09-25 22:01:00
近日,吉林省公安厅交通管理总队高速公路吉林支队巡逻三大队民警在吉林南收费站执勤时,发现一辆危险化学品运输车内异常——一只未拴绳
2025-09-25 22:22:00
剧烈运动后喝下一瓶冰饮料让人直呼“过瘾”,但你可能想不到,这么一个小小的习惯,有时却藏着致命的危险。最近就有一个让人心疼的消息
2025-09-25 22:24:00
国庆中秋假期,针对外地来榕游玩车辆驾驶人,对路况不熟悉等情况,福州交警将采取人性化交通管理措施。轻微交通违法且未造成拥堵的,将以教育、提醒、纠正为主,不予处罚。
2025-09-25 22:35:00
说好免费领6个鸡蛋,却“花”了20000多元
齐鲁晚报·齐鲁壹点 李国栋“昨天刚发的工资,并且半年都没支取过,可卡里余额变成0了,这可怎么办啊!”赵女士在建设银行潍坊寒亭丰华支行营业网点拉住大堂经理刘大正急切的求助着
2025-09-25 22:04:00
夯实教学素养基础,新桥墩头小学举办教师基本功比赛
齐鲁晚报·齐鲁壹点 通讯员 高欣为加强教师队伍建设,提升教学基本素养,新桥墩头小学于9月24日组织举办“锤炼基本功 教师展风采”教师基本功比赛
2025-09-25 22:04:00
大皖新闻讯 9月25日,亳州市公安局谯城分局公布了谯城警方近日成功破获的利用诈骗资金购买黄金的洗钱案件,两名嫌疑人落网后
2025-09-25 21:56:00
家中飞入“不速之客” 消防员徒手抓蝙蝠
9月13日14时28分,长春市消防救援支队公主岭大队接到居民报警求助,位于公主岭市光明岗附近一户居民家中飞进蝙蝠,主人吓得不轻
2025-09-25 21:20:00
公交车变“消防车”!荣成公交司机秒变“救火勇士”,三轮车起火现场化险为夷
鲁网9月25日讯日前,荣成公交集团鲁K03889D驾驶员袁育强正驾驶公交车行驶在开往成山头景区的路上,当车辆行至蒲家泊路北路段时
2025-09-25 16:09:00
中途退学被告知学校未收到学费,鲁网记者介入后已收到应退款项
鲁网9月25日讯(记者 杨成喜 孟娅琦)9月22日,临沂市民林先生致电鲁网民生帮办,反映自己孩子在临沂市兰山区国华学校(以下简称临沂国华学校)退学后申请退费时遇阻
2025-09-25 16:08:00
世界生物圈保护区大会首次落地中国,“AI保护长江江豚”成亮点
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)9月22-27日,由联合国教科文组织主办、中国科学院与浙江省人民政府承办的第五届世界生物圈保护区大会
2025-09-25 16:07:00
《穹天玉宇》圆满落幕:沉浸式中国藻井数字艺术展精彩回顾
“穹天玉宇——沉浸式中国藻井数字艺术展”(简称“穹天玉宇”)以中国古建筑藻井艺术为核心,融合前沿数字技术打造出一场独具特色的新媒体艺术体验
2025-09-25 13:38:00
“忆江南”浙江省非物质文化遗产展走进马耳他
2025年9月19日,由浙江省文化广电和旅游厅与马耳他中国文化中心共同主办,浙江省非物质文化遗产保护中心承办的“忆江南”浙江省非物质文化遗产展在马耳他中国文化中心开幕
2025-09-25 13:38:00
张清清“查无此人” 原是张湛清跑出了暖心“加速度”
大皖新闻讯 “张清清?咱们南站哪有人叫张清清哦!”9月24日,望着旅客王先生刚寄来的一封表扬张清清的感谢信,蚌埠南站雷锋服务台里的三人面面相觑
2025-09-25 13:13:00
蚌埠国庆节当天正常办理结婚登记 详细地点公布
大皖新闻讯 9月25日,记者从蚌埠市民政局获悉,为满足新人们国庆节婚姻登记需求,进一步提升婚姻登记便民服务水平,该市部分婚姻登记处将于10月1日上午正常办理结婚登记业务
2025-09-25 13:11:00