• 我的订阅
  • 头条热搜
...基智能基于双模型架构打造,融合炎帝大模型与DUIXONE多模态大模型的技术优势。“炎帝大模型提供了底层技术架构,通过数十万字领域专属数据进行深度训练和模型微调,形成了面向政务场景的定制化知识库模型,能理解复杂...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
外滩大会观察:AI产业实践呈现六大趋势 下一代超级应用是智能体
...的发展走向。端智能成 AI 应用的关键引擎。更专业的多模态小模型,在行业应用中取得比通用大模型更好的效果,硬件设备集成小模型,端侧AI逐步成熟,为超级应用的出现创造条件。异构算力助力抢跑大模型应用之战。AI时代...……更多
...好用”。5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,相较于4月发布的GPT-4Turbo速度更快、价格更便宜;5月15日,谷歌在I/O 开发者大会上发布了通用AI新模型Project Astra,可实现跨文本、音频、视频多模态实时推理...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
...游部重点实验室资助项目立项名单,包括城市旅游场景多模态数据分析与研究、民歌数字资源库建设及创新展演研究、沉浸式交互演艺系统设计——以“剑书”为例、云锦数字化解构与智能设计等9个项目入选,旨在促进文化和...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
云从科技从容大模型荣登中国大模型第一梯队
...有力证明。 云从科技在综合评测权威平台OpenCompass的多模态评测领域中也取得了重大进展。最新评测结果显示,从容大模型在该体系中的平均得分为65.5,这一成绩使其跻身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v,仅次于GPT...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,近期推出了“大模型0元Go”计划,凡是“日日新”的新注册用户,都可获得涉及调...……更多
广东“大模型”赋能文化产业落地发展
...型“大瓦特”是电力行业首个基于自主可控算力研发的跨模态大模型,也是首个在电力行业应用最广的大模型。南方电网人工智能公司技术经理林全郴告诉记者,目前,该模型以通用训练语料和电力行业专业知识数据为基础,覆...……更多
CHINC2024丨史文钊:大模型时代 神州医疗全面领跑医疗AI行业
...作为医疗大数据AI行业领军者,神州医疗依托大数据及多模态等核心技术,倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型,赋能医疗领域多场景应用。同时,史文钊强调医学研...……更多
让手机、PC、汽车、AIoT等“终端”都用好AI,搞定统一生态这事太重要了
...大模型,AI大模型的迭代再进一步,从文本到图像、从多模态到视频,大模型的发展快得令人不敢眨眼。一个不留神,可能就会掉队。随着超大规模的基座大语言模型不再持续狂飙,大模型向着边缘和端侧下沉的趋势日益明显,A...……更多
国内首款多模态AI交互四足机器人BabyAlpha A2发布,售价不到万元
...人新品 BabyAlpha A2,聚焦家庭场景,这是国内首款具备多模态交互能力的 AI 机器人,产品售价低至 1 万元以内。此次公布的蔚蓝全新 BabyAlpha A2,是一款具身智能四足机器人,可定制、支持绘本功能,支持多模态音视频通话、远程...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...十年,AI将无所不在大模型始于文本,未来将拓展至“全模态”。跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需...……更多
“什么值得买”助力提升海螺AI消费决策体验:输出垂类能力,建设融合生态
...自行研发的万亿参数大模型abab6.5,面向C端用户打造的多模态智能产品,支持文本、音频和图像的自由交流。海螺AI不仅具备强大的长文本处理能力和多格式文件支持,其高效大模型支持和多模态技术方向更能为用户提供多种服...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
骁龙 8 至尊版到底有多强?我们总结了三大关键问题
...程,减少游戏中1%fps卡村,同时改善手机发热的状况。多模态AI支持有什么意义? 简单来说,指令无需预处理,响应更快速。在骁龙8至尊版中,高通通过升级的HexagonNPU和AI引擎,进一步增强了设备端AI的多模态处理能力。这意味...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型,使用MENTOR数据库进行训练,该数据库中包含超过80万名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多
“不要卷模型,要卷应用!”李彦宏谈AI:大模型公司热衷于写高考作文,价值不大
...,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多模态操控,全身多达43个主动自由度,最大关节峰值扭矩400N.m,算力支持400TOPs。 图片来源:上海证券报运动能力上,“青龙”人...……更多
...大模型则是 OpenCSG 算法团队正在研发中的开源大模型、多模态大模型和垂类模型系列,优势在于开源协议友好、工具链完整,并针对特定垂类场景进行优化。除了建设开源社区,OpenCSG过去数月还在多个行业推出大模型应用解决...……更多
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
AI顶会自动驾驶挑战赛:无图小米汽车 全球第二
...自动驾驶世界模型占用网络与光流的运动预测具身智能多模态3D视觉定位CARLA自动驾驶挑战LLM在自动驾驶的应用无图自动驾驶CVPR主办方介绍说,LLM与世界模型的出现,给自动驾驶带来巨大潜力,可解释的端到端模型将是未来。 ...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一,甚至还支持国风水墨,支持在图片生成过程中,增加汉字...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
...机、PC等,张雪薇看好相关产业链机遇。 大模型正在向多模态发展,由之前的文本、语音到现在的图片,包括未来视频,不同的媒介会诞生出新的应用,会把模型通用化能力提升,未来比如广告推荐、用户画像都会像大模型靠拢...……更多
让甲骨文“开口说话”:AI技术赋能文化传承
...)发布博文,宣布该校团队正尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,辅助专家进行更高效的甲骨文考释工作。甲骨文简介IT之家援引博文介绍,甲骨文也被称作“殷墟文字”,距今已有三...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
更多关于科技的资讯:
潮聚湾区 创玩未来——《广州潮玩产业招商研究报告》发布会暨行业主题研讨会在荔湾成功举办
为精准把握潮玩产业蓬勃发展的时代脉搏,助力广州建设具有全球影响力的潮玩产业高地,12月11日,由广州市投资发展委员会办公室主办
2025-12-13 16:43:00
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00
长白时评评论员 刘颂寒声称“下载App必得大额红包”,旁边又用小字解释“仅限新人或以实际情况为准”;宣称“全场5折”,又在大大的“5折”后面跟个极小的“起”字……在日常的消费中
2025-12-12 10:56:00
在当前行业竞争加剧与市场环境多变的背景下,虎丘支公司持续推动降本增效工作,这既是应对挑战的必要举措,也是实现长期稳健经营的重要保障
2025-12-12 10:58:00
劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知,自2026年1月1日起全面禁止生产含汞体温计产品
2025-12-12 11:01:00