• 我的订阅
  • 头条热搜
空间智能产业化加速 一线企业集体锚定百度智能云
...实现了图像、语音等多模态数据的毫秒级响应,通过语音指令、视觉反馈等,满足百科问答、地图导航、实时翻译、图像识别、会议纪要等场景需求,实现前所未有的穿戴体验。今年5月,国内AI+AR领域创新企业李未可科技在新品...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式...……更多
阿里万相视频生成大模型重磅开源!消费级显卡也能运行
...ggingFace、魔搭社区下载体验。据介绍,14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。1.3B...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...销月的销量是上一代的432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命...……更多
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni
...今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示,Megrez-3B-Omni 是一个为端而生的全模态理解模型,同时具备图片、音频、文本三种模态数据的处理能力:...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...全同时提高通行效率。 此外,LPLM 还增强了对自然语言指令的理解和执行能力。谈及这项能力重要的原因,陈俊波举例说道:“为什么目前的各类 Robo-taxi 虽然可用,但依然无法取代司机?原因之一在于,当我们提供一些比较模...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...Pro等顶级模型相当,代码运行没有问题,但没有严格遵循指令,生成的可视化内容因太小而难以阅读。此外,多位用户还提到,Qwen3存在过度思考的问题,导致思考过程太长,而且默认的思维模式对更复杂的任务来说非常不可用...……更多
打开大模型的无限可能,云栖通道看AI产业应用
...待。 ” 开源大模型灵活运用,给AI机器人注入灵魂一个指令,人形机器人就能完成唱跳RAP、搬运货物、巡线避障、花式足球等高难度动作。在云栖大会计算馆的通义灵码展位,“素人”都能掌控的小型机器人,吸引了众多观众...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...”的Gemini,究竟有什么杀手锏?拿出一张世界地图,发出指令,“根据你现在所见,想一个游戏,还要用emoji表情呈现。”Gemini即刻给出回答,“我们可以玩一个叫做‘猜国家’的游戏”,然后为你提供几个线索“考拉”、“袋...……更多
国产“Sora”亮相中关村,文生视频相关个股有哪些
就在昨日,我国人工智能大模型领域又迎来重大突破,AGI的真正连锁反应或将从视频开始。4月27日上午,“2024中关村论坛-未来人工智能先锋论坛”在北京正式举办,本次平行论坛由科学技术部、北京市人民政府主办,旨在进一...……更多
中国科技创新“乘”数直上
...2023第二届全球数字贸易博览会上了解华为研发的盘古大模型的应用。 龙 巍摄(人民图片)当今时代,数据已成为重要的创新要素。人工智能大模型、新材料创制、生物育种、基础科学研究等都离不开数据的支撑。国家数据局...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...化。此外,与现有模型相比,它更加用户友好,可以通过指令完成复杂的任务,而不需要冗长的处理步骤和额外的模块 (如 ControlNet 或 IP-Adapter),从而大大简化了工作流程。 知识迁移:受益于统一格式的学习,OmniGen 有效地跨不...……更多
昆仑万维SkyReels团队正式发布并开源SkyReels-V2
...ch包含1020个文本提示词,系统性地评估了四个关键维度:指令遵循、运动质量、一致性和视觉质量。该基准旨在评估文本到视频(T2V)和图像到视频(I2V)生成模型,提供跨不同生成范式的全面评估。在SkyReels-Bench评估中,SkyReels-V2在...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...如音乐中包含哪些乐器等。后者指的是不仅可以根据用户指令生成音乐,比如生成一段吉他弹奏的音乐,还能根据用户输入的图像或视频生成音乐。图丨通过 M2Ugen 大模型进行多模态音乐理解和生成(来源:arXiv) 近日,相关论...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的自研大模型创造了机会,同时也将迎来更为拥挤的竞争,5月大厂大模型们价格大战后让中国大模型的商业模式...……更多
千行百业加速拥抱大模型(AI前沿观察)
...术创新快 应用渗透强 国际竞争激烈千行百业加速拥抱大模型(AI前沿观察)潘旭涛 陈斯达《 人民日报海外版 》( 2023年12月22日 第 08 版)在湖南省长沙市举办的2023世界计算大会专题展上,参观者在了解AI大模型。新华社记者 ...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...作研究,构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
...GLM-4 All Tools实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。 Tims天好咖啡与申通地铁达成合作36氪获悉,连锁咖啡品牌Tim Hortons中国业务...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...新的AI战略“蓝心智能”,同时发布了升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)等多项新产品和技术升级。vivo高级副总裁、首席技术官施玉坚首先登台,他提到,在过去三年和今年前三季度,v...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言画”全方位...……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...体互动和一致性难题此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人...……更多
本文转自:中国新闻网只需要一段文字指令就能生成一段60秒精致细腻的视频——今年2月起,文生视频大模型Sora曾在全球人工智能业内外引发震动。近日,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学...……更多
荣耀Magic V5发布,一文看懂YOYO到底有多强大
...只需在浏览财经APP时,对YOYO下发“分析黄金投资前景”指令,便可以在左边屏幕继续刷实时行情,YOYO会在右边屏幕同步调取国际金价走势、国际利率变化等海量数据,通过AI算法拆解“影响金价的三大核心因素”,甚至算出不...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...番,有以下几点发现:1、简短的提示词效果更好,复杂指令下会丢失细节。2、人手仍是重灾区,容易出现画面闪烁的现象。3、生成很快,但加上排队等待时间仍达到1-2分钟。4、相比图生视频,文生视频的稳定性更高。当然,...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...训练过程模型的训练主要分为两个阶段:多任务预训练和指令微调训练。多任务预训练阶段主要使用动作-文本、语音-文本相关的数据集进行训练,训练任务包括 text-to-speech, automatic speech recognition,speech-to-speech,motion under……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...ench)的新基准测试,风格与纯文本的MT-Bench类似,以评估指令调整的多模态模型的性能。 MM-MT-Bench总共包含92个对话(单回合对话69个,2回合对话18个,3回合对话4个,4回合对话1个),涵盖了广泛的实际使用案例,包括五类图像...……更多
智谱落地模力社区,助力浦东构建大模型产业生态圈
...)正式签署战略合作,双方联合发布“模力社区-智谱大模型MaaS平台”。未来“模力社区”的企业可以更低成本、更便捷地使用大模型服务。浦东新区副区长李慧表示,浦东新区始终站在技术创新的潮头,积极拥抱新兴赛道和未...……更多
2023开年热词「大模型」「出海」,现在怎么样了?
...如提供大量的写作模板和AI工具包,不需要学习 Prompt 和指令拆解,就可以傻瓜式填空轻松上手,对于已有的文件也可以导入后进行二次AI创作处理,这一本土化改进也为AI写作市场下沉提供了良好的亲民形象。讯飞写作 产品页面...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...言和意图、以及多模态环境的能力,当机器人接收到任务指令时,模型能够感知多模态环境,对任务进行多粒度拆解,将上一步的输出作为下一步的输入,形成一个循环的时间序列规划执行。这样,即使遇到意料之外的情况,机...……更多
更多关于科技的资讯:
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00
今年双十一,A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”,在社交平台引发热议,同时也揭露了线上服装行业的信任危机
2025-12-05 17:00:00