• 我的订阅
  • 头条热搜
科大讯飞携手EX机器人,重塑人机交互新未来
...,面向物理世界、虚拟世界和元宇宙,以AI能力星云、多模态交互、大模型、模型训练、资产生成和软硬件接入为核心的机器人开发平台,帮助开发者快速搭建多场景适配、具有深厚知识底蕴以及擅长自我进化的实体机器人和虚...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
openai发布gpt-4o多模态大模型
...5月14日凌晨1点,OpenAI举行春季发布会,发布最新GPT-4o多模态大模型,GPT-4o能读取人类情绪,另外,相较于GPT-4Trubo速度更快、价格也更便宜。OpenAI称,GPT-4o可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求Cha...……更多
浪潮智慧医疗荣获山东电子学会科学技术二等奖
...审结果,浪潮智慧医疗打造的“面向新一代信息技术的多模态医疗大数据智能平台”荣获科学技术二等奖。山东电子学会科学技术奖,是由山东电子学会根据《关于进一步鼓励和规范山东省社会力量设立科学技术奖的指导意见》...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
...补充提到,中国科学院香港创新院AI中心今年又研发了多模态手术大模型CARES Copilot,该系统能够与智能医疗设备高度集成,并可快速精确地提取手术教材、专家指南、医学论文等专业文档的信息,并保持高达95%的准确率,就像手...……更多
外滩大会观察:AI产业实践呈现六大趋势 下一代超级应用是智能体
...的发展走向。端智能成 AI 应用的关键引擎。更专业的多模态小模型,在行业应用中取得比通用大模型更好的效果,硬件设备集成小模型,端侧AI逐步成熟,为超级应用的出现创造条件。异构算力助力抢跑大模型应用之战。AI时代...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
松鼠Ai智适应教育大模型全新升级
...与科技融合的盛宴。松鼠Ai举行发布会,不仅展示了其多模态智适应教育大模型及系统的全方位升级,还推出了多款前沿的智适应教育硬件产品,为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
支付宝推出ai毛发自测工具帮用户快速识别脱发类型与级别
...市一医院脱发专科门诊医生共同研发,融合了蚂蚁百灵多模态大模型识别技术、人工智能与医学图像处理技术,使得脱发检测变得更为便捷与精准。用户只需在支付宝App中搜索“毛发检测”,上传自己的头皮照片,系统即可在半...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
...出前10详情见下表: 三、机构观点① 游戏新品上线+AI多模态模型赋能,游戏板块或迎来业绩与估值双轮驱动开源证券认为,海外科技巨头基于AI多模态大模型的竞争日趋激烈,或驱动大模型多模态底层能力不断突破,叠加GPTs的...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
OpenAI「草莓」两周内发布?网传不是多模态,反应慢了10多秒
...图片,这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的,这似乎是「草莓」一个明显缺点。大家比较关心的还有定价问题。「草莓」的定价可能与 OpenAI 的聊天机器人不同,后者有...……更多
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
...联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,蚂蚁依托知识图谱、密态计算等技术,构建了大规模...……更多
更多关于科技的资讯:
蚂蚁集团大动作!“阿福”APP来了:新增健康陪伴功能 问答能力升级
12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布APP新版本,升级健康问答、健康陪伴、健康服务三大功能
2025-12-17 10:18:00
项目卡壳90%是资源管理“掉链子” ?易趋教你四步破局
“张总,研发部李工被临时抽去支持紧急项目,咱们的核心模块开发得延期了”,“设备组反馈,原定下周到位的测试服务器,现在还在另一个项目组占用着”
2025-12-17 11:10:00
远见协同:解码米连科技稳健发展的深层动能
在互联网行业潮起潮落、监管环境持续完善的背景下,一家企业如何锚定航向,实现可持续的稳健增长?这不仅考验着创始团队的初心
2025-12-17 11:10:00
赋能印度农业现代化丨潍柴雷沃亮相第33届印度浦那国际农业展
鲁网12月17日讯日前,第33届印度浦那国际农业展KISAN在浦那国际展览中心举办。作为印度西部规模最大、最具影响力的农业展会
2025-12-17 11:18:00
面对“哪些中国企业全球化做的不错?”这一问题,联想集团无疑是具有代表性的答案之一。作为出海时间早、全球化程度深的中国企业
2025-12-17 11:52:00
京东产发与日日顺达成全球战略合作 共建超级供应链新生态
近日,京东产发与日日顺供应链正式达成全球战略合作,建立共创共赢的生态战略合作关系。 双方在物流基础设施、仓配网络、供应链管理等良好的合作基础上
2025-12-17 10:11:00
【宅男财经|专家面对面】当前许多年轻人热衷于“谷子”、棉花娃娃等小众二次元文化产品。针对年轻人为何更偏爱此类小众消费,中国广告协会会长
2025-12-17 10:12:00
“我喜欢我”:vivo S50系列携“告白”美学与长焦Live,开启自我表达新旅程
2025年12月15日,vivo正式发布全新 vivo S50系列,包括 vivo S50 与 vivo S50 Pro mini 两款新品
2025-12-17 10:18:00
聚焦企业福祉与跨境管理 百年人寿协办德国商会专题论坛共话创新解决方案
2025年12月5日,一场聚焦于在华企业福利创新与人力资源挑战的高端论坛于北京成功举行。本次活动由中国德国商会与安顾方胜联合主办
2025-12-17 10:18:00
为积极响应全民消费热潮,充分发挥金融服务实体经济的重要作用,江苏银行围绕 “双十二” 消费节点,精心部署多项线上促消费举措
2025-12-17 10:18:00
王志顺最近,社交平台被一批“装修博主”刷屏了——清一色的夫妻站在新家门口微笑合影,有的怀里还抱着婴儿,配文都是“装修已定”“聊聊感受”
2025-12-17 10:40:00
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00