• 我的订阅
  • 头条热搜
...范围内率先提出并实现了“图文音(视觉-文本-语音)三模态训练模型”及多模态技术的实际应用,并在智能机器人和智能芯片领域形成了从原始创新、核心技术研发、商业转化到最终产品的批量化生产的全产业链的打造和全领...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
...处理得十分优秀,极大地提升了真实感。Sora模型推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,AI赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。 ……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一,甚至还支持国风水墨,支持在图片生成过程中,增加汉字...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型,在一系列多模态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新闻稿在chatGPT发布一周年之际,谷歌通过 Gemini 赶了个晚集,想要再度...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...源研究院院长王仲远介绍了智源研究院在语言大模型、多模态大模型、具身大模型和生物计算大模型的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远表示,未来,大模型将以数字智能体的形...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
AI大模型应用商机:“AI+”还是“+AI”
...nAI公司最新发布的GPT-4o,就通过对文本、音频和视觉三种模态统一进行混合训练,带来了更大的泛化能力,可实时对音频、视觉和文本进行推理,标志着AI大模型应用向更自然的人机交互持续迈进。GPT-4o的推出进一步推动了AI应...……更多
...出前10详情见下表: 三、机构观点① 游戏新品上线+AI多模态模型赋能,游戏板块或迎来业绩与估值双轮驱动开源证券认为,海外科技巨头基于AI多模态大模型的竞争日趋激烈,或驱动大模型多模态底层能力不断突破,叠加GPTs的...……更多
谷歌Gemini引领多模态AI大模型热潮 云鼎科技、佳都科技等最新回应多模态具体事宜 科创信息等5家上市公司回应无相关业务
谷歌Gemini引领多模态AI大模型热潮 云鼎科技、佳都科技等最新回应多模态具体事宜 科创信息等5家上市公司回应无相关业务 【谷歌Gemini引领多模态AI大模型热潮 云鼎科技、佳都科技等最新回应多模态具体事宜 科创信息等5家上市...……更多
他用AI让交通“更懂你”
...乘客进行线路、票价等信息查询和快速购票,同时基于多模态大模型TransCore-M则能对站内的拥堵、异常情况进行实时判断,为相应的站内管控和车辆调度提供辅助决策和应急处置。通过完成这一系列乘客从进站到出站的全流程举...……更多
智能产业探新记丨AI赋能,大模型的下一个“风口”在哪?
...言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等核心功能,已在教育、医疗、金融、工业等领域落地。近年来,人工智能引领的新一轮技术革命加速演进,科大讯飞股份有限公司也在大模型研发之路上不断探...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
千亿级神经元数字孪生脑平台在沪发布,为治疗抑郁症等打开思路
...器人领域发布了全球首个具备动态双目立体视觉和视听多模态控制的机器头脑,满足机器在未知环境下自主移动及人机协作应用需求。千亿级神经元数字孪生脑平台以复杂的人脑为原型,实现了人脑全尺度千亿级神经元功能的精...……更多
“不要卷模型,要卷应用!”李彦宏谈AI:大模型公司热衷于写高考作文,价值不大
...,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多模态操控,全身多达43个主动自由度,最大关节峰值扭矩400N.m,算力支持400TOPs。 图片来源:上海证券报运动能力上,“青龙”人...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...rcoPolo由此诞生。 并且,实现了更低成本更优效果。在多模态方面,多模态大模型MarcoPolo-VL能够用「眼睛」精准识别,进行推荐。还有团队最新发布的多模态大模型Ovi,直接拿下开源第一。在ICCV 2023顶会上,一向低调的阿里国际...……更多
AI智能双录系统服务,提升会议效率的利器
...案提供商。通过自主研发的领域大模型、大数据分析、多模态交互三大核心技术,打造了数字化洞察与营销、数字化服务与运营、数“智”底座三大产品矩阵,全面升级云呼叫中心、智能客服、智能外呼、质检陪练、智能音视频...……更多
4.1release版本改进
...、TextArea、List、Grid、Search、CheckBox、Slider、Image、Menu、半模态弹窗等组件的样式、交互和动效增强。弹窗类和导航类自定义能力增强。提供全新Style样式对象和组件Style样式属性方法,支持样式复用和动态切换能力。Web新增支持We...……更多
聊聊ChatGPT:百度阿里京东齐齐下场 谁能赢得三国杀
...,不仅能通过文字与人对话,甚至还具备“AI绘画”等多模态任务能力。据透露,新产品可实现的功能包括知识问答、AI绘画、代码生成、小说续写、文案撰写、写诗作词等。和百度一样,阿里在该领域并不是零基矗自2021年起,...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...选择基于扩散模型、文本和掩码的图像编辑方法、以及多模态大型语言模型(MLLMs) 进行实现,并设计了简约实用的用户界面。MagicQuill的具体构成一起来看看MagicQuill系统的具体构成是什么样的。主要分为3个部分:1.编辑处理器...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
工业新篇,智能领航——中国移动九天·工业行业大模型正式发布
...是面向工业安全生产监测场景打造的智能体应用,通过多模态大模型,实现安监场景的高泛化理解,现已覆盖超50大类的工业安监场景,提升企业安全监管效率,为工业安全生产保驾护航。AI+工业质检针对工艺升级快、换型频繁...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
全新的coloros15正式登场,新系统带来全面提升
...而OPPO的一键问屏功能却可以做到边看边说,实现同步多模态的交互。这就意味着用户在浏览内容时,可以立即询问或发出指令,AI能够实时响应,用户不再需要在不同模态之间来回切换操作。OPPO的目标是让AI助理像真人助理一样...……更多
烟台毓璜顶医院毛宁:大数据与人工智能帮他开“慧眼”,让疾病无处遁逃
...佛多了一双“慧眼”,在面对疾病时更得心应手。建立多模态数据库,借助影像人工智能技术来预测肿瘤分期及预后情况,并利用多种成像方式分析大脑结构、功能和代谢等生理变化与精神疾病的关联,毛宁和团队正致力于推动...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
齐鲁文化大模型通过国家网信办备案
...率。此外,如数字人对话、基于NLP的知识问答和搜索、多模态知识图谱生成、AIGC文生图自动标注、画作鉴真、长视频拆条自动处理等功能,都可以帮助文化机构在多个应用场景高效完成各种工作,行业需求巨大。据了解,齐鲁...……更多
更多关于科技的资讯:
冬至有念,云端相见
“物联思念”让思念不再受距离限制冬至,是中国人心中一个极具温度的节气。在古人眼中,冬至不仅是昼夜交替的重要节点。在当下
2025-12-18 08:16:00
2025商业节能照明品牌盘点:四大品牌解锁绿色降耗新路径
在“双碳”目标的推动下,商业建筑照明能耗优化成为行业关注焦点。据住建部统计,商业建筑能耗中照明系统占比高达35%,年耗电量超2000亿度
2025-12-18 08:17:00
「星」罗万象,「鉴」微知著!中威电子推出星鉴大模型产品,助力千行百业加速智能化落地
当前,人工智能浪潮席卷全球,正以空前的速度、广度与深度重塑生产生活方式。语言大模型、多模态大模型等领域的突破性创新,推动人工智能迈入通用智能初始阶段
2025-12-18 08:47:00
这样抢票的你见过吗?在各类高并发抢票或秒杀场景中,如春运火车票、演唱会门票等,我们往往会遇到网页长时间加载、按钮无法点击
2025-12-18 09:39:00
AOSCITECH全自动间断化学分析仪:革新化学分析,降本增效新标杆
在化学分析领域,传统分析方法因其依赖人工操作、试剂消耗量大等问题,逐渐难以满足现代工业对高效、环保、经济的迫切需求。AOSCITECH全自动间断化学分析仪凭借其卓越的技术创新
2025-12-18 10:05:00
育兵近日,一项涉及数据安全和个人隐私的关键国家标准正式发布——《数据安全技术电子产品信息清除技术要求》强制性国家标准将于2027年1月1日起实施
2025-12-18 10:48:00
王志高据媒体报道,随着《疯狂动物城2》热映,IP衍生品消费再次掀起热潮,从盲盒公仔到联名杯套,年轻人为爱“氪金”,为情买单
2025-12-18 10:48:00
内外兼修,价值为王:从中粮餐饮福掌柜的“双轮驱动”看餐饮供应链的品牌升维
在竞争日趋白热化的餐饮供应链市场,品牌如何超越周期,持续赢得B端客户与终端消费者的双重信赖?这已不再是单靠价格或渠道就能解答的命题
2025-12-18 12:35:00
河北新闻网讯(张莉)盐山县紧扣食品安全“四个最严”要求,以数字化破解校园食材采购管理难题,今年以来创新打造“阳光采购监管平台”
2025-12-18 13:43:00
迎战年终物流高峰!骆驼驻车空调锂电显实力
每年年底,随着各大电商大促、年货节接踵而至,快递业务也不断迎来高峰,全国公路货运压力显著增大。根据中国物流与采购联合会预测
2025-12-18 13:49:00
腾讯智慧零售与生活产业:锚定AI、出海、全域经营,助力伙伴发掘增长新机
12月17日,腾讯智慧零售与生活产业2025年度生态合作伙伴大会暨“千域计划”年度颁奖盛典在上海举办,超百位生态服务商到场探讨产业生态的新机遇
2025-12-18 13:49:00
金螳螂23年蝉联中国建筑装饰百强企业第一
近日,“2024年度中国建筑装饰行业综合数据统计”榜单揭晓,金螳螂连续23年荣获装饰类第1名,同时荣获设计类第1名。未来
2025-12-18 14:18:00
沙利文白皮书重磅发布 ,GUTX益次方引领益生菌4.0时代
2025年,全球知名咨询机构沙利文正式发布《中国益生菌市场白皮书》,全景式解析了中国益生菌行业发展脉络与未来航向。白皮书显示
2025-12-18 14:19:00
上海国际网文周发布出海报告:拉美市场崛起,IP引领文旅价值升维
12月18日,第四届上海国际网络文学周正式开幕,来自14个国家和地区的网络文学作家、学者和企业代表齐聚上海,共同参与这一全球文化交流盛会
2025-12-18 14:21:00
从影石破局到思锐打破垄断,看中国光学影像品牌的自主技术之路
当影石Insta360发布首款全景无人机时,在影像圈激起不少水花。面对质疑和限制,影石以自主创新突破了技术困境,成功推出了革命性产品
2025-12-18 14:22:00