• 我的订阅
  • 头条热搜
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...端到端的 VLA 策略模型,它可以接受图像输入并配合语言指令进行下一步动作的预测。与以 token 形式输出文本内容的大语言模型不同,在 VLA 模型中,算法需要实时处理视觉环境中的动作,快速准确地面对外界做出连续的动作反...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...销月的销量是上一代的432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...全同时提高通行效率。 此外,LPLM 还增强了对自然语言指令的理解和执行能力。谈及这项能力重要的原因,陈俊波举例说道:“为什么目前的各类 Robo-taxi 虽然可用,但依然无法取代司机?原因之一在于,当我们提供一些比较模...……更多
打开大模型的无限可能,云栖通道看AI产业应用
...待。 ” 开源大模型灵活运用,给AI机器人注入灵魂一个指令,人形机器人就能完成唱跳RAP、搬运货物、巡线避障、花式足球等高难度动作。在云栖大会计算馆的通义灵码展位,“素人”都能掌控的小型机器人,吸引了众多观众...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...”的Gemini,究竟有什么杀手锏?拿出一张世界地图,发出指令,“根据你现在所见,想一个游戏,还要用emoji表情呈现。”Gemini即刻给出回答,“我们可以玩一个叫做‘猜国家’的游戏”,然后为你提供几个线索“考拉”、“袋...……更多
国产“Sora”亮相中关村,文生视频相关个股有哪些
就在昨日,我国人工智能大模型领域又迎来重大突破,AGI的真正连锁反应或将从视频开始。4月27日上午,“2024中关村论坛-未来人工智能先锋论坛”在北京正式举办,本次平行论坛由科学技术部、北京市人民政府主办,旨在进一...……更多
中国科技创新“乘”数直上
...2023第二届全球数字贸易博览会上了解华为研发的盘古大模型的应用。 龙 巍摄(人民图片)当今时代,数据已成为重要的创新要素。人工智能大模型、新材料创制、生物育种、基础科学研究等都离不开数据的支撑。国家数据局...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...化。此外,与现有模型相比,它更加用户友好,可以通过指令完成复杂的任务,而不需要冗长的处理步骤和额外的模块 (如 ControlNet 或 IP-Adapter),从而大大简化了工作流程。 知识迁移:受益于统一格式的学习,OmniGen 有效地跨不...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...如音乐中包含哪些乐器等。后者指的是不仅可以根据用户指令生成音乐,比如生成一段吉他弹奏的音乐,还能根据用户输入的图像或视频生成音乐。图丨通过 M2Ugen 大模型进行多模态音乐理解和生成(来源:arXiv) 近日,相关论...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的自研大模型创造了机会,同时也将迎来更为拥挤的竞争,5月大厂大模型们价格大战后让中国大模型的商业模式...……更多
千行百业加速拥抱大模型(AI前沿观察)
...术创新快 应用渗透强 国际竞争激烈千行百业加速拥抱大模型(AI前沿观察)潘旭涛 陈斯达《 人民日报海外版 》( 2023年12月22日 第 08 版)在湖南省长沙市举办的2023世界计算大会专题展上,参观者在了解AI大模型。新华社记者 ...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...作研究,构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
...GLM-4 All Tools实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。 Tims天好咖啡与申通地铁达成合作36氪获悉,连锁咖啡品牌Tim Hortons中国业务...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...新的AI战略“蓝心智能”,同时发布了升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)等多项新产品和技术升级。vivo高级副总裁、首席技术官施玉坚首先登台,他提到,在过去三年和今年前三季度,v...……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...体互动和一致性难题此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言画”全方位...……更多
本文转自:中国新闻网只需要一段文字指令就能生成一段60秒精致细腻的视频——今年2月起,文生视频大模型Sora曾在全球人工智能业内外引发震动。近日,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...番,有以下几点发现:1、简短的提示词效果更好,复杂指令下会丢失细节。2、人手仍是重灾区,容易出现画面闪烁的现象。3、生成很快,但加上排队等待时间仍达到1-2分钟。4、相比图生视频,文生视频的稳定性更高。当然,...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...ench)的新基准测试,风格与纯文本的MT-Bench类似,以评估指令调整的多模态模型的性能。 MM-MT-Bench总共包含92个对话(单回合对话69个,2回合对话18个,3回合对话4个,4回合对话1个),涵盖了广泛的实际使用案例,包括五类图像...……更多
2023开年热词「大模型」「出海」,现在怎么样了?
...如提供大量的写作模板和AI工具包,不需要学习 Prompt 和指令拆解,就可以傻瓜式填空轻松上手,对于已有的文件也可以导入后进行二次AI创作处理,这一本土化改进也为AI写作市场下沉提供了良好的亲民形象。讯飞写作 产品页面...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...言和意图、以及多模态环境的能力,当机器人接收到任务指令时,模型能够感知多模态环境,对任务进行多粒度拆解,将上一步的输出作为下一步的输入,形成一个循环的时间序列规划执行。这样,即使遇到意料之外的情况,机...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
智东西6月3日消息,大模型“套壳”的回旋镖,这次扎到了美国科研团队身上。最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...有所欠缺。在人机交互中,用户有时不单单需要 AI 遵循指令完成任务,还要它们提供足够的情绪价值,满足情感需求。从功能「基操」到情感「进阶」,AI 要掌握的技能就要升级了。因此,多模态情感识别成为 AI 领域的活跃研...……更多
讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型
...大讯飞发布讯飞星火V3.5更新版本,首发星火图文识别大模型,赋予大模型感知现实世界的能力。这标志着国产大模型在支持图文输入领域的一次重要突破。事实上,尽管先进的大模型在语言交互方面展现出了卓越的能力,但它...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
想象一下当你躺在沙发上,只需要不假思索地说出指令,机器人就能帮你干活,是不是听起来就十分惬意?如今这种科幻电影中的场景正在变为现实,来自北京大学的助理教授、博士生导师董豪团队近日提出首个通用指令导航...……更多
手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?
...出在这里。对普通用户来说,要完整地组织语言发出一条指令,编写一条prompt,是一个成本很高的行为。智能手机相比 ChatGPT 这种没有任何数据基础的 AI 应用,最大的优势在于,很多数据其实已经在手机上了,不应该再让用户...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...大厂支出指引AIcapex占比继续提升,国内受政策驱动及大模型参数对标海外升级,全球智能算力预计维持高景气,未来5年中国智能算力规模CAGR预计52.3%。主线二,数据侧:数据要素三次价值释放元年,会计入表推动数据价值“显...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...在其前身的简约设计和数据效率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 ...……更多
更多关于科技的资讯:
2025青岛虚拟现实创新大会要来:北航青岛研究院以科创助推产业跃升2.0时代
鲁网11月18日讯一副简约的框架眼镜,镜片后可能隐藏着快速滚动的信息流;一间平平无奇的房间,戴上头显后,就能摇身变为绚丽仙境……当科幻电影中的沉浸式场景逐渐成为现实
2025-11-18 15:45:00
大皖新闻讯 11月18日,记者从合肥市政府新闻办召开的新闻发布会获悉,近年来,合肥市围绕科技创新与产业升级需求,大胆改革科技金融政策机制
2025-11-18 15:44:00
AI赋能千行百业一线故事(十六):数智驱动,唤醒高校“沉睡”的专利
数智驱动,唤醒高校“沉睡”的专利——AI赋能千行百业一线故事(十六)10月24日,邯郸职业技术学院知识产权学院工作人员演示AI+专利转化运用生态服务平台
2025-11-18 08:42:00
市场监管总局11月15日发布《互联网平台反垄断合规指引(征求意见稿)》,向社会公开征求意见。征求意见稿坚持问题导向,针对平台经济领域竞争行为的特点和趋势
2025-11-18 08:44:00
厦门网讯(厦门日报记者 林露虹 通讯员 郭文晨)美资企业安费诺加码投资厦门。近日,位于厦门创新创业园的安费诺(厦门)高速线缆有限公司新工厂正式投产
2025-11-18 09:03:00
“‘一带一路’——我们共同的路”全球故事征集活动启动 扫码阅读手机版
11月18日,由天津市政府新闻办指导,津云新媒体主办的“‘一带一路’——我们共同的路”全球故事征集活动启动。活动以高质量共建“一带一路”八项行动为指引
2025-11-18 09:06:00
中新经纬11月18日电 题:“它走得太像人了”——为什么必须由车企来完成这一步?作者 陈兵 南开大学法学院副院长、教授
2025-11-18 13:00:00
OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁
11月18日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)
2025-11-18 13:21:00
全面满足用户本地生活服务需求,京东外卖App、点评、真榜、七鲜咖啡多箭齐发
11月17日晚,第三场京东品酒会在三亚保利瑰丽酒店举办。活动现场,京东宣布在本地生活领域密集落地一系列举措:推出京东外卖App
2025-11-18 13:21:00
安杰莱科技闪耀高交会:以科技赋能康复公益,斩获科技创新大奖
11月14日至16日,以“科技赋能产业,融合共创未来”为主旨的第二十七届中国国际高新技术成果交易会在深圳隆重举行。作为展现我国对外开放深度与广度的重要平台
2025-11-18 11:48:00
7×24小时自主巡检,杭州萧山机场添智能驱鸟装备
在航空运输业快速发展的今天,机场安全运行始终是行业关注的重点。鸟类撞击飞机的事件虽不常见,但一旦发生,可能对飞机引擎、机身结构造成损害
2025-11-18 10:47:00
“产业炬光灯”聚焦元之道生物科技
“产业炬光灯”聚焦厦门元之道生物科技有限公司。扫码看视频厦门网讯(厦门日报记者 李晓平)小小微生物,蕴藏着改变健康的大能量
2025-11-18 09:03:00
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00