• 我的订阅
  • 头条热搜
...游部重点实验室资助项目立项名单,包括城市旅游场景多模态数据分析与研究、民歌数字资源库建设及创新展演研究、沉浸式交互演艺系统设计——以“剑书”为例、云锦数字化解构与智能设计等9个项目入选,旨在促进文化和...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
云从科技从容大模型荣登中国大模型第一梯队
...有力证明。 云从科技在综合评测权威平台OpenCompass的多模态评测领域中也取得了重大进展。最新评测结果显示,从容大模型在该体系中的平均得分为65.5,这一成绩使其跻身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,仅次于GPT...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,近期推出了“大模型0元Go”计划,凡是“日日新”的新注册用户,都可获得涉及调...……更多
广东“大模型”赋能文化产业落地发展
...型“大瓦特”是电力行业首个基于自主可控算力研发的跨模态大模型,也是首个在电力行业应用最广的大模型。南方电网人工智能公司技术经理林全郴告诉记者,目前,该模型以通用训练语料和电力行业专业知识数据为基础,覆...……更多
CHINC2024丨史文钊:大模型时代 神州医疗全面领跑医疗AI行业
...作为医疗大数据AI行业领军者,神州医疗依托大数据及多模态等核心技术,倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型,赋能医疗领域多场景应用。同时,史文钊强调医学研...……更多
国内首款多模态AI交互四足机器人BabyAlpha A2发布,售价不到万元
...人新品 BabyAlpha A2,聚焦家庭场景,这是国内首款具备多模态交互能力的 AI 机器人,产品售价低至 1 万元以内。此次公布的蔚蓝全新 BabyAlpha A2,是一款具身智能四足机器人,可定制、支持绘本功能,支持多模态音视频通话、远程...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...十年,AI将无所不在大模型始于文本,未来将拓展至“全模态”。跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需...……更多
“什么值得买”助力提升海螺AI消费决策体验:输出垂类能力,建设融合生态
...自行研发的万亿参数大模型abab6.5,面向C端用户打造的多模态智能产品,支持文本、音频和图像的自由交流。海螺AI不仅具备强大的长文本处理能力和多格式文件支持,其高效大模型支持和多模态技术方向更能为用户提供多种服...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型,使用MENTOR数据库进行训练,该数据库中包含超过80万名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多
“不要卷模型,要卷应用!”李彦宏谈AI:大模型公司热衷于写高考作文,价值不大
...,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多模态操控,全身多达43个主动自由度,最大关节峰值扭矩400N.m,算力支持400TOPs。 图片来源:上海证券报运动能力上,“青龙”人...……更多
...大模型则是 OpenCSG 算法团队正在研发中的开源大模型、多模态大模型和垂类模型系列,优势在于开源协议友好、工具链完整,并针对特定垂类场景进行优化。除了建设开源社区,OpenCSG过去数月还在多个行业推出大模型应用解决...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
AI顶会自动驾驶挑战赛:无图小米汽车 全球第二
...自动驾驶世界模型占用网络与光流的运动预测具身智能多模态3D视觉定位CARLA自动驾驶挑战LLM在自动驾驶的应用无图自动驾驶CVPR主办方介绍说,LLM与世界模型的出现,给自动驾驶带来巨大潜力,可解释的端到端模型将是未来。 ...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一,甚至还支持国风水墨,支持在图片生成过程中,增加汉字...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
...机、PC等,张雪薇看好相关产业链机遇。 大模型正在向多模态发展,由之前的文本、语音到现在的图片,包括未来视频,不同的媒介会诞生出新的应用,会把模型通用化能力提升,未来比如广告推荐、用户画像都会像大模型靠拢...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
大华股份:自研星汉大模型,推动智慧应用商业落地
...(002236)。事件:近日大华股份发布公告,公司发布了多模态融合的行业视觉大模型——大华星汉大模型,通过融合图像、点云、文本、语音等多模态数据,显著提升了视觉解析能力。点评:机器视觉垂类龙头厂商,业绩持续高...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
中科视语亮相2024中关村论坛,共论大模型驱动行业创新与发展
...点实验室孵化的一家人工智能企业,代表性核心技术“多模态混合感知与细粒度识别技术”取得了国际领先的成果,不仅实现将多模态混合感知与细粒度识别核心技术与多个行业应用深度融合,而且在智慧交通、智能制造、智慧...……更多
英诺天使基金:“明年或是AI应用元年”,AI创新将在C端爆发
...24年或是AI应用的真正元年,AI终端重构、算力国产化与多模态引领AI应用这三大新方向孕育了重要机遇。王晟进一步说明,AI和产业的结合并非刚刚开始,大模型只是拓宽了融合可能,但在业务模式未改变的情况下,这种进步依...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
多模态AI概念股震荡走高 因赛集团涨超10% 【多模态AI概念股震荡走高 因赛集团涨超10%】财联社12月19日电,因赛集团涨超10%,天娱数科涨停,思特奇、软通动力涨超5%,润和软件、宣亚国际、开普云、万兴科技等跟涨。中信证券...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
OpenAI「草莓」两周内发布?网传不是多模态,反应慢了10多秒
...图片,这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的,这似乎是「草莓」一个明显缺点。大家比较关心的还有定价问题。「草莓」的定价可能与 OpenAI 的聊天机器人不同,后者有...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
更多关于科技的资讯:
手捧“创业安徽”金奖 “上海南七里”奔赴“合肥南七里”
大皖新闻讯 日前,第四届创业安徽大赛决赛在合肥举办,来自国内外的21个创新创业项目获奖,分享270万元奖金。其中,10个优质项目还现场签署协议
2025-12-13 19:14:00
杭州日报讯 12月12日,第十届中国设计智造大奖(Design Intelligence Award,下文简称“DIA”)颁奖盛典在中国美术学院良渚校区举行
2025-12-14 07:04:00
在全球制造业加速迈向智能化与数字化的今天,构建高效、可靠且面向未来的自动化系统,已成为企业提升核心竞争力、应对市场不确定性的战略基石
2025-12-13 22:48:00
潮聚湾区 创玩未来——《广州潮玩产业招商研究报告》发布会暨行业主题研讨会在荔湾成功举办
为精准把握潮玩产业蓬勃发展的时代脉搏,助力广州建设具有全球影响力的潮玩产业高地,12月11日,由广州市投资发展委员会办公室主办
2025-12-13 16:43:00
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00