• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...疗等领域,持续放大技术普惠。通用大模型“全尺寸、全模态”开源,“通义舞王”爆火本季度,阿里云发布开源大模型通义千问Qwen-72B,该模型10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,也标志着阿...……更多
从云栖大会,看阿里的科技本色
...模型之外,阿里巴巴在 7 月还曾经发布过「通义万相」多模态绘画模型。此次发布中,基于通义千问和通义万相,阿里巴巴又进一步升级了通义大模型家族,提出了 8 个行业模型。其中包括在 8 月已经发布过的听悟,目前累计用...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
阿里大模型,再次开源大放送
...版让不少人都迫不及待想试试。并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。 01Qwen1.5开源此次...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...大模型以及丰富第三方模型(如Llama、百川等)。支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中,通义方面发布了最强开源模...……更多
...,通义宣布加入开源行列,随之启动开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。大模型的训练和迭代成本极高,开源模式让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
“AI全家福”集中亮相数贸会 50多个大模型同场竞技
...相。围绕机器深度学习、自然语言处理、认知大模型、多模态大模型技术等一系列AIGC技术进行展示,体现智能化浪潮正如何改变我们的工作和生活。在阿里巴巴展区,“通义家族”AI大模型应用一字排开。基于阿里自研的“通义...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
激战千亿大模型 “国产ChatGPT”背水一战
...言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。 紧接着, 在3月27日,百度又正式推出了“文心千帆”大模型平台。文心千帆大模型平台整合了百度全套文心大模型、相应的开发工...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...研大模型夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
ChatGPT模型“大跃进”,各大电商平台重金入场有何变局?
...金投入AI技术。早在2020年初,阿里达摩院就启动了中文多模态预训练模型M6项目,同年6月推出3亿参数的基础模型。2021年1月,模型参数就达到了百亿量级,成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
阿里夸克发布自研大模型,应用于搜索、医疗健康、教育等场景
...据介绍,夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
雷军杀入大模型
...同分享了微软小冰当年在自然语言处理、语音学研究、多模态生成等领域研究进展。彼时,栾剑以《小冰唱歌技术进展》为题演讲。他提到,微软小冰团队“在语音合成领域大方面的东西可能已经解决,但语义理解方面,可能还...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。以最新推出的小米汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗...……更多
聊聊ChatGPT:百度阿里京东齐齐下场 谁能赢得三国杀
...,不仅能通过文字与人对话,甚至还具备“AI绘画”等多模态任务能力。据透露,新产品可实现的功能包括知识问答、AI绘画、代码生成、小说续写、文案撰写、写诗作词等。和百度一样,阿里在该领域并不是零基矗自2021年起,...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类...……更多
更多关于科技的资讯:
魅族基于领克 Z10,打造了领克 Z10 电竞定制版
ZAKER科技9月25日消息,星纪魅族在发布会上宣布在领克Z10的基础上打造了领克Z10电竞定制版。最神奇的是这款车的车机系统为windows系统
2024-09-25 18:41:00
第三届数贸会在杭州举行,重庆代表团组团参会
第三届全球数字贸易博览会(以下简称数贸会)于2024年9月25日至29日在杭州大会展中心举办。本届数贸会以“数字贸易 商通全球”为主题
2024-09-25 19:43:00
大皖新闻讯 9月25日,大皖新闻记者从蚌埠机场建设投资有限公司获悉,为方便统一对外衔接工作,简洁明了展示机场形象,该公司现面向公众广泛征集机场形象标识(LOGO)设计方案
2024-09-25 20:11:00
十堰广电讯(全媒体记者 陈林 通讯员 黄兴林)随着高层建筑数量的不断增加,火灾救援难度日益加大。十堰湖北一专汽车股份有限公司成功研发出一款携带大型无人机系统的
2024-09-25 20:47:00
涌金楼丨浙江数商,是什么商
潮新闻讯 浙江数商,来了!9月25日下午,在第三届全球数字贸易博览会(下称“数贸会”)期间举行的数据要素治理与市场化交流活动上
2024-09-25 20:47:00
寻找“环岛奇游大玩家”活动启动 海南旅投出境免单游等你来赢
南海网9月25日消息(记者 丁文文)国庆假期临近,准备好迎接一场环岛奇遇了吗?9月25日,记者从海南旅投获悉,寻找“环岛奇游大玩家”活动启动
2024-09-25 21:07:00
世界经理人发布2024年亚洲10大超级豪宅排行榜
2024年(第十五届)“亚洲10大超级豪宅”排行榜于9月25日在中国香港揭晓。印度的安蒂拉位居第一,阿联酋的大理石宫殿排名第二
2024-09-25 21:11:00
本文转自:人民网人民网记者 黄盛“世界前沿科技大会.网址”“成都大运会.网址”“蓉宝.网址”“中国科学院.网址”“故宫博物院
2024-09-25 20:45:00
本文转自:人民网-河北频道9月25日上午,在国网唐山供电公司检储配一体化基地,随着仓管员田殿雄在中控大厅内输入入库指令
2024-09-25 20:51:00
华为苹果新机热销背后,消费电子卷向新战场
又是一年华为苹果大战,可以说消费电子市场再度上演火星碰地球。华为的三折叠和苹果的16系列是最近最为热门的新机,满网都充斥着排队
2024-09-25 17:18:00
iOS 18 / 17.7 续航测试出炉,这功能被限制
本月中旬,苹果接连发布了 iOS 18 和 iOS 17.7 两个正式版更新。iOS 18 中新增了不少新功能,而 iOS 17
2024-09-25 17:18:00
vivo高管暗示今年新机或将涨价 小米OPPO也扛不住
【CNMO科技消息】vivo将于10月14日举办新品活动。虽然官方暂时没有宣布,但外界普遍猜测vivo X200系列将于此次活动上亮相
2024-09-25 17:18:00
刘作虎分享手机摄像头凸起对比图,直言新机“有潜望”
IT之家 9 月 25 日消息,OPPO 首席产品官、一加创始人刘作虎今日在微博分享了一张手机摄像头凸起对比图,并直言“别慌
2024-09-25 17:18:00
苹果iOS17.7深度评测:续航信号终于完美,发热极致优化
苹果iOS17.7为什么如此火爆呢?很多iPhone用户认为此版本或将是iOS17最后的版本,另外这个版本有着极致的优化
2024-09-25 17:19:00