• 我的订阅
  • 头条热搜
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
商汤科技:创新驱动,赋能多行业发展新活力
...与成果有目共睹。今年4月,其重磅推出全新升级的原生多模态通用大模型日日新SenseNova V6。该模型通过多模态长思维链训练、全局记忆、强化学习等技术突破,形成了领先的多模态推理能力,并且成功突破成本边界,为大规模应用奠...……更多
...代面向智慧园区场景的智能服务器AIS 4.0。集成领先的多模态大模型能力,实现软硬件全面国产化,为各类园区综合管理效能提升提供更安全、更智能、更易用的AI新智引擎。自2019年首版推出以来,商汤星云AIS智能服务器以算法...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
他用AI让交通“更懂你”
...乘客进行线路、票价等信息查询和快速购票,同时基于多模态大模型TransCore-M则能对站内的拥堵、异常情况进行实时判断,为相应的站内管控和车辆调度提供辅助决策和应急处置。通过完成这一系列乘客从进站到出站的全流程举...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
荣耀Magic V5发布,一文看懂YOYO到底有多强大
...2016年即开始布局AI大模型与智能体技术,通过持续强化多模态感知、个性化推理、自动化执行和生态化工具四大核心能力,实现全栈个人知识库、全域多智能体协同、全品牌终端互联,能够精准理解用户需求,为用户提供全方位...……更多
“星汉”大模型深圳发布
...决,现有技术和自身积累实现偏“难+慢”。大模型、多模态等新技术应用,尤其是行业大模型让AI算法从个性走向通用,从准确走向精准,从静态走向动态,从识别走向理解,大大降低海量应用场景开发的周期和成本,让数字经...……更多
北京经开区:加快打造AI原生产业创新高地,每年发放1亿元...
...系3.构建“1+N”高效协同创新体系。支持头部企业开展多模态通用大模型关键技术攻关,围绕多模态通用模型基础架构、训练数据集构建、多模态学习算法、高效并行训练、对齐调优、具身智能等领域,开展算法创新和核心技术...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
文博会观察:大模型为文化产业发展提供新机遇
...前来互动。“面向文化创作领域,腾讯混元正积极发展多模态模型,以进一步加强文生图、文生3D以及文或图生视频能力。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏举例子表示,面对内容制作行业多样化需求,腾讯混元在...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
华为、百度、阿里云等发起“大模型基础设施高质量发展行动计划”
...Law)不断演进,无论是在进行 CKPT 的并行保存与加载、多模态数据的收集与清洗、全局数据的 Shuffle(混洗)与模态对齐,还是 AI 算法的调优以及大规模集群的运维诊断跟踪,都迫切需要一个全局对等共享、单一命名空间、且具...……更多
“齐鲁文化大模型”写入2025年山东省政府工作报告
...底座、以自建山东文化数据库为核心训练语料、以自研多模态内容风控平台为安全保障的,完全可控的多模态生成式人工智能模型。其作为全省文化数字化的数据和技术基座,是落实文化数字化战略的重要基础工程,是数字化时...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...混元API服务调用,可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初,腾讯混元就宣布在国内率先采用MoE架构模型,总体性能比上一代密集模型提升50%。此后,腾讯混...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
理想发布史上最大更新:「理想老师」能写会画,无人泊车即将推送
...赋予理想同学的新定位。OTA 5.0 下的理想同学,拥有了多模态感知能力。通过覆盖全车多音区的数字硅麦、3D ToF 摄像头、IR 传感器,以及基于空间多模态感知-3M 技术,理想同学可以充分感知舱内空间的多模态信息。简单来说就...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
建好AI训练“优质数据粮仓”|贵阳大数据交易所发布939个高质量数据集
...多样性和系统性——涵盖文字、音频、图片、视频等多种模态,以及TTS(文本转语音)、OCR(光学字符识别)等跨模态数据,使模型能够学习更复杂的语义关联,显著提升多轮对话、图像生成等任务的准确性,构建的“预训练集...……更多
更多关于科技的资讯:
济宁能源融汇数易:为客户提供一站式数字服务
鲁网12月22日讯(记者 徐景春 周正杰)近日,记者来到济宁能源融汇数易采访,在融汇数易供应链综合服务平台监控中心,大屏幕上实时跳动着物流订单
2025-12-22 11:45:00
章剑华散文集《人生简史》新书出版分享会在南京召开
近日,由江苏散文学会主办的章剑华散文集《人生简史》新书出版分享会在南京召开,作家出版社有限公司董事长、社长鲍坚,江苏省作家协会原一级巡视员
2025-12-22 11:59:00
让AI有“情商” 具身情感智能平台在合肥发布
大皖新闻讯 随着人工智能技术的发展,“人机共生”已成必然。但是,当前绝大多数AI都严重缺乏“情商”,成为“人机共生”核心瓶颈之一
2025-12-22 12:04:00
从南京先锋书店的牛皮纸袋,到直播间里一句“想要治愈系书单”的即时回应,再到书店老板用盲盒一夜清空库存——图书盲盒作为将“纸质书”与“盲盒经济”糅合的产物
2025-12-22 12:14:00
友成基金会“香橙妈妈守艺计划”非遗创变营圆满落幕
2025年12月10日,友成基金会“香橙妈妈守艺计划”非遗焕新创变营在成都红仓·萌想星球107文创产业园开营。来自全国12个省市18区县的18位非遗受益人齐聚
2025-12-22 12:20:00
密切警企协作,米连科技以技术风控守护用户安全
在网络诈骗手段花样翻新、线上安全成为社会普遍关切的当下,营造清朗的网络空间需要社会各方的协同努力。作为在线情感社交领域的参与者
2025-12-22 13:20:00
景秀游戏《偃武》联动昆明市博物馆 让古滇文明触手可及
近日,景秀游戏旗下三国题材策略游戏《偃武》与昆明市博物馆正式启动“古滇文明数字复兴”计划,作为深耕数字娱乐领域的企业,景秀游戏始终希望以游戏为载体
2025-12-22 13:20:00
[摘要]随着人工智能技术的迅猛发展,高等教育正在经历深刻变革。这就要求高校在研究生培养模式上深化改革,大胆创新,积极推动人工智能(AI)技术在研究生培养中的融合路径与实践
2025-12-22 11:10:00
据媒体报道,今年以来,杭州知名“网红大楼”丽晶国际大厦——这座巅峰时期汇聚了近两万名主播与从业者、“一栋楼的GDP堪比一个县”的楼宇
2025-12-22 08:18:00
味蕾实验TASTELAB首次亮相引领零食行业科学化升级新征程
2025年12月20日,全新零食品牌味蕾实验TASTELAB在上海正式举办品牌发布会。本次活动以“让味觉被看见”为核心主题
2025-12-22 08:49:00
乌江榨菜全民创意共创:深度对话Z世代的品牌焕新
当传统品牌纷纷叩响年轻化的大门,仅靠历史底蕴已不足以触动Z世代的心。作为榨菜行业的领军者,乌江榨菜早已展开前瞻布局:从早年携手B站打破次元壁
2025-12-22 08:49:00
在保险行业向专业化、精细化、集约化发展的背景下,富德生命人寿以科技引领创新,积极布局集约化运营模式,构建起以总部为核心的全国理赔集中运营格局
2025-12-22 10:32:00
彰显实力!大咖素质训练营荣获“2025年度影响力教育品牌”奖项
近日,由新浪教育与微博教育联合主办的“新浪&微博 2025 教育盛典”于北京圆满落幕。大咖素质训练营凭借在素质教育领域的深耕积淀
2025-12-22 10:49:00
不用提前抢,西湖消费券带火实体商户:3天,星巴克黄龙广场店增收50%
作为促消费的首创实践,杭州西湖区“疯狂碰友日・西湖首发季”交出亮眼成绩单:首期三天,21 万市民参与“即碰即用”消费券活动
2025-12-22 10:49:00
近日,深耕青少年语言教育领域近十年的创业者徐萌,凭借其专业的课程体系与显著的教学成效,受到教育界广泛关注。徐萌毕业于中国传媒大学播音与主持专业
2025-12-22 08:49:00