• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...疗等领域,持续放大技术普惠。通用大模型“全尺寸、全模态”开源,“通义舞王”爆火本季度,阿里云发布开源大模型通义千问Qwen-72B,该模型10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,也标志着阿...……更多
从云栖大会,看阿里的科技本色
...模型之外,阿里巴巴在 7 月还曾经发布过「通义万相」多模态绘画模型。此次发布中,基于通义千问和通义万相,阿里巴巴又进一步升级了通义大模型家族,提出了 8 个行业模型。其中包括在 8 月已经发布过的听悟,目前累计用...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
阿里大模型,再次开源大放送
...版让不少人都迫不及待想试试。并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。 01Qwen1.5开源此次...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...大模型以及丰富第三方模型(如Llama、百川等)。支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中,通义方面发布了最强开源模...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...rcoPolo由此诞生。 并且,实现了更低成本更优效果。在多模态方面,多模态大模型MarcoPolo-VL能够用「眼睛」精准识别,进行推荐。还有团队最新发布的多模态大模型Ovi,直接拿下开源第一。在ICCV 2023顶会上,一向低调的阿里国际...……更多
...,通义宣布加入开源行列,随之启动开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。大模型的训练和迭代成本极高,开源模式让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
“AI全家福”集中亮相数贸会 50多个大模型同场竞技
...相。围绕机器深度学习、自然语言处理、认知大模型、多模态大模型技术等一系列AIGC技术进行展示,体现智能化浪潮正如何改变我们的工作和生活。在阿里巴巴展区,“通义家族”AI大模型应用一字排开。基于阿里自研的“通义...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...研大模型夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
阿里夸克发布自研大模型,应用于搜索、医疗健康、教育等场景
...据介绍,夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。以最新推出的小米汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗...……更多
共话数智健康未来:赫力昂携行业专家聚焦健康产业新趋势
...示,AI大模型在健康服务领域展现着巨大潜力,例如,多模态的能力可以生成健康科普知识,提升公众健康素养;自然语义的技术将助力更多特殊群体消费者;智能体分身技术可以帮助减轻医护人员负担,提高服务效率等。垂直...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类...……更多
...今日观点:腾讯刘煜宏:腾讯混元大模型正在积极发展多模态模型及应用腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,多模态大模型将重构内容产业,基于多模态的应用也会百花齐放。他介绍,腾讯混元大模型技术架构已...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先...……更多
更多关于科技的资讯:
百秒说两会②|两会新词包听懂
百秒说两会,今天说两会新词。“投资于人”“未来产业”“瞪羚企业”没有听过吧,没听过就对了。这些是出现在2025年政府工作报告中的新词热词
2025-03-08 02:11:00
河北医科大学第一医院智慧医院建设部主任赵鹏:让人工智能助力诊疗质效双提升政府工作报告提出,促进优质医疗资源扩容下沉和区域均衡布局
2025-03-08 08:06:00
华为粉丝36小时推荐订车305台:余承东亲临直播间在线感谢
快科技3月8日消息,鸿蒙智行有个别家羡慕无比的特殊能力,那就是背靠华为,用户粉丝黏度非常高。不少老车主会自发成为野生销售员帮助推荐卖车
2025-03-08 08:15:00
智商堪忧!理想汽车高管再辟谣是力帆代工:每一辆都是自建工厂下线
快科技3月8日消息,不知道从什么时候开始,一直有网友表示理想汽车就是力帆代工的,这也让前者非常的不爽。理想汽车第一产品线总裁汤靖再次发文辟谣
2025-03-08 08:15:00
宇树机器人首次亮相李佳琪直播间 平台声明:不售卖只为义务推广
快科技3月8日消息,昨晚8点,宇树机器人G1与机器狗Go2惊艳亮相淘宝李佳琦直播间,引发广泛关注。在直播中,这两款机器人展现了惊人的交互能力
2025-03-08 08:15:00
大乌龙!170人还没登机:飞机空载就飞走了
快科技3月8日消息,日子久了,什么奇葩事都有可能发生。媒体报道,近日,一起航班乌龙事件导致170名韩国旅客滞留菲律宾,而原因也很简单
2025-03-08 08:15:00
博主韩路拿100克金子打了个“are you ok”气门嘴 网友:敢偷就是三年以上
快科技3月6日消息,汽车博主韩路今日发文称,他用100.39克金子,7万元做了个SU7 Ultra最贵副厂零件:小米are u OK气门嘴帽
2025-03-06 14:43:00
【大国重器】贵州轮胎:从0到1,跻身全球“灯塔工厂”
编者按:在贵州百万座大山的褶皱深处,沉睡千年的喀斯特峰林正悄然化作科技创新的摇篮。桥梁工程师们以贵州钢绳为笔,在花江大峡谷上书写“横竖都是第一”的当代神话
2025-03-06 14:43:00
鸿蒙智行再交成绩单!问界M8破3.6万台 全新M9破1.8万台
快科技3月7日消息,鸿蒙智行公布了问界M8和2025款问界M9的36小时小订“成绩单”。其中,问界M8小订量突破3.6万台
2025-03-08 00:15:00
站雷军背后的海尔总裁周云杰走红:可爱表情被网友拍下
3月7日消息,据媒体报道,在代表通道上,小米创始人、董事长兼首席执行官雷军人气高涨,人群中不停响起“雷总好”,雷军多次微笑挥手回应
2025-03-08 00:15:00
本文转自:人民日报3月5日,习近平总书记在参加江苏代表团审议时指出,科技创新和产业创新,是发展新质生产力的基本路径。政府工作报告提出
2025-03-08 06:26:00
谷雨  自研美白原料极光甘草  打造优质国货护肤品牌
本文转自:人民日报在化妆品行业蓬勃发展的浪潮中,在消费者对美白产品的需求日益增长的趋势中,美白护肤品已成为行业的重要细分赛道
2025-03-08 06:29:00
国补真香!平板销额上涨21% 手表/手环暴涨51%
快科技3月7日消息,今年1月20日,手机、平板等数码产品国家补贴在全国各地陆续上线,极大的带动了国内市场。根据洛图科技(RUNTO)数据显示
2025-03-08 07:15:00
酵母菌:微生物世界里手握核武的超级杀手
如果我们把水果或者谷物密封起来,那么过一段时间,我们再打开时就会闻到酒的清香,这是因为酵母菌将糖转化成了酒精和二氧化碳
2025-03-08 07:45:00
2025全国两会天津北方网讯:上线7天,能聊天、会推理的“DeepSeek”下载量已经破亿,当全球科技圈还在为它狂欢时
2025-03-08 08:03:00