• 我的订阅
  • 头条热搜
华为小艺的ai智能交互体验
...实名认证活体检测图库图文翻译/多主体识别、智慧搜索自然语言搜索等控件功能等,大幅提升华为自有应用的使用体验。此外,HarmonyOSNEXT针对基础、高频和创新场景,开放控件,控件AI化后,开发者能够“零成本”实现应用的AI...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...g up 显著推动了大语言模型(LLMs)研究的发展,展示了在自然语言处理(NLP)中推理和泛化能力的显著进步。为了理解多模态信息,多模态大语言模型(MLLMs)应运而生,赋予 LLMs 视觉指令跟随和场景理解的能力。受 MLLMs 在通用...……更多
把大模型装进手机,总共分几步?
...然只有短短的一两分钟,但我专门发了一条朋友圈,看好自然语言交互能力在手机上的应用。当时我就有预感,大语言模型跟手机结合,应该会很快。时间拉回到现在,苹果、三星,以及“华米OV”国产手机厂商,都先后宣布了...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者。”4月16日,百度(Nasdaq:BIDU,09888.HK)创始人、董事长兼首席执行官李彦宏在2024百度AI开发者大会上发表主题演讲,他指出,AI(人工智能)...……更多
云鼎科技:基于DeepSeek,打造垂域矿山大模型
...中,云鼎科技打造煤矿安全生产知识助手,支持用户通过自然语言快速精准获取安全生产、生产数据、设备信息、创伤急救等知识,煤矿安全生产信息获取效率提升80%以上,设备故障排查和处置知识传递效率提升70%以上。在通用...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...0余个行业,提供了50多个大模型行业解决方案。华为旗下盘古大模型,更是可以提供5个基础大模型+N个行业大模型+X个场景模型的三层解耦架构,目前已经应用到了铁路、矿山、能源、气象、政务等诸多领域。阿里云更是对外开...……更多
竞逐发力“智算”打造全新引擎 前沿领域“智算”需求快速增长
...截至2023年5月,中国已发布的10亿参数以上大模型达79个,自然语言处理、机器视觉、多模态等技术取得重要突破。云算、智算、超算等协同发展,算力规模持续保持全球第二。据不完全统计,全国已投运的智算中心达到25个,目...……更多
...次出任财跃星辰首席科学家,其在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验。据介绍,财跃F1金融大模型目前具备三大能力:金融知识问答能力,即理解和回答关于金融领域的各种问题...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
...天气,以往可能需要上千台服务器耗费数小时……目前,盘古大模型等AI大模型已广泛应用于各个行业,为矿山、铁路、交通、医药、气象等领域带来了质的飞跃。随着“人工智能+”首次被写入政府工作报告,AI产业机遇也在加...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...集成学习方法,用于提升模型预测性能,如谷歌将MoE引入自然语言处理领域,提升机器翻译性能。2020年,谷歌Gshard首次将MoE引入Transformer构建分布式并行计算架构,打开MoE发展新思路。之后,MoE逐渐进入规模发展阶段,作为一种...……更多
AI相关板块集体延续回调,人工智能AIETF跌2.61%
...百万流入。消息面上,华为HDC大会持续打造生态,鸿蒙OS+盘古大模型5.0有望加速AI端侧应用。截至目前,鸿蒙生态设备已超过9亿台,HarmonyOS开发者人数超过254万。同时发布盘古大模型5.0版本,标志着人工智能技术在全系列、多模...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...依赖简单的分类标签,CLIP 基于图文对的对比学习,通过自然语言的描述获得了更丰富的视觉特征,更加符合人类对于视觉信号的定义。这种监督信号不仅仅是一个标签,而是一个富有层次的信息集合,从而让 CLIP 拥有更加细腻...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
多模态能力的进化,是AI眼镜成为生活必需品的关键
AI 浪潮下,多模态能力成为 AI 领域,特别是 AI 眼镜行业的高频热词。不少专家坚信,这项技术是突破单一交互局限的关键,有望重塑 AI 眼镜的使用体验。所谓多模态能力,即整合视觉、听觉、语言、触觉等多维度感官数据,...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...资源层:“首先我们的模型完全自研,且团队在多模态、自然语言处理领域拥有深厚的积累,凝聚了数十位国家级领军人才和青年人才,团队人才密度高,专业性强。其次,作为哈尔滨工业大学深圳校区孵化的校属企业,学校鼓...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...轨迹显得尤为重要。如今,具身智能涵盖了计算机视觉、自然语言处理和机器人技术等多个关键技术,其中最具代表性的是具身感知、具身交互、具身智能体和虚拟到现实的迁移。在具身任务中,具身智能体必须充分理解语言指...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...RT2 为代表的第二代模型尝试整合 LLM 与视觉 Transformer,将自然语言与现实世界更紧密地结合起来。不过,即便如此在构建四维世界模型、有效预测未来行为、以及在复杂交互场景中进行灵活推理等方面仍然面临挑战。图丨谷歌 Pa...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
华为云盘古媒体大模型:三大技术创新重塑数字内容生产与应用
...月21日举行的华为开发者大会(HDC2024)上,华为云推出了盘古媒体大模型,通过在语音生成、视频生成和AI翻译三方面的技术创新,重塑了内容生产和应用的新模式。盘古媒体大模型在视频生成方面取得了显著成果。通过盘古,...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
... GPT4o,引起全球轰动。其中 GPT4o 展现出了与人类相近的自然语言交互能力,实现了 AI 能同时读懂人类语音中的内容及情绪,并实时做出反馈。同时,GPT4o 也给众多语音研究人员带来「新的春天」,语音文本多模态大模型成为热...……更多
...宝”是首个面向矿山从业人员的AI助手。它可以轻松理解自然语言指令,完成工作人员下达的任务。生成式平行智能数据体系GenDS是首个针对矿区的数据体系,能够指数级生成高质量数据。端到端自动驾驶大模型GenAD可赋予自动驾...……更多
...方面,为了解决通用大模型专业能力不强的问题,除上线自然语言、计算机视觉与预测分析三个基础大模型外,还提供了制造知识和制造视觉两大行业大模型,以便覆盖通用+行业专业知识,满足东莞制造产业需求。 尤鹏表示,...……更多
实探第二届全球数贸会前沿趋势馆,见证大模型“赋能千行百业”
...。号称“只做事,不作诗”的华为,在本次展馆中呈现了盘古NLP大模型、CV大模型、多模态大模型等多款大模型。这些模型迄今已经在10余个行业的400多个业务场景进行了探索。以盘古矿山大模型为例。煤炭是我国能源的主要来...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...型一般有个问题,就是为了多模态的性能而牺牲了本身的自然语言性能,之前英伟达的NVLM 1.0也谈到了这点。Pixtral本次也是成功避开了这个缺陷,单单比较文本模型的性能,也在同等尺寸的模型中居于前列。另一点与大多数模型...……更多
事关上市公司!华为再发力钢铁大模型
...药板块合作。在华为开发者大会2023上,张平安表示华为盘古大模型“不作诗,只做事”,强调了其重点面向B端市场,金融、政务、矿山、气象等行业是盘古大模型落地的重点。《科创板日报》注意到,2024年以来,华为盘古大模...……更多
浪潮数字企业三款大模型产品入选济南市首批人工智能大模型推荐名录
...工过程中涉及表格、文本、设计图纸、音视频等在内的多模态数据,支撑铁路工程施工知识进一步加工、梳理,进一步强化工程项目施工的标准与规范。浪潮海岳矿山大模型主要面向矿山场景下全过程智能化管理,包括行业专业...……更多
更多关于科技的资讯:
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00
2025年11月8日窪田制药控股株式会社为应对全球日益严重的“近视”问题,作为眼科医疗解决方案公司,窪田制药控股株式会社(总部
2025-11-19 20:39:00
三大核心价值赋能,浪潮海岳智能服务平台为企业运维保驾护航
在数智化转型加速推进的今天,企业运维正面临前所未有的挑战。传统运维模式响应慢、协作难、效率低,难以支撑业务的快速发展;运维环节中的流程堵点与系统孤岛
2025-11-19 22:02:00