• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...疗等领域,持续放大技术普惠。通用大模型“全尺寸、全模态”开源,“通义舞王”爆火本季度,阿里云发布开源大模型通义千问Qwen-72B,该模型10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,也标志着阿...……更多
从云栖大会,看阿里的科技本色
...模型之外,阿里巴巴在 7 月还曾经发布过「通义万相」多模态绘画模型。此次发布中,基于通义千问和通义万相,阿里巴巴又进一步升级了通义大模型家族,提出了 8 个行业模型。其中包括在 8 月已经发布过的听悟,目前累计用...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
阿里大模型,再次开源大放送
...版让不少人都迫不及待想试试。并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。 01Qwen1.5开源此次...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...大模型以及丰富第三方模型(如Llama、百川等)。支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中,通义方面发布了最强开源模...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...rcoPolo由此诞生。 并且,实现了更低成本更优效果。在多模态方面,多模态大模型MarcoPolo-VL能够用「眼睛」精准识别,进行推荐。还有团队最新发布的多模态大模型Ovi,直接拿下开源第一。在ICCV 2023顶会上,一向低调的阿里国际...……更多
...,通义宣布加入开源行列,随之启动开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。大模型的训练和迭代成本极高,开源模式让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
“AI全家福”集中亮相数贸会 50多个大模型同场竞技
...相。围绕机器深度学习、自然语言处理、认知大模型、多模态大模型技术等一系列AIGC技术进行展示,体现智能化浪潮正如何改变我们的工作和生活。在阿里巴巴展区,“通义家族”AI大模型应用一字排开。基于阿里自研的“通义...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...研大模型夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
阿里夸克发布自研大模型,应用于搜索、医疗健康、教育等场景
...据介绍,夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。以最新推出的小米汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗...……更多
共话数智健康未来:赫力昂携行业专家聚焦健康产业新趋势
...示,AI大模型在健康服务领域展现着巨大潜力,例如,多模态的能力可以生成健康科普知识,提升公众健康素养;自然语义的技术将助力更多特殊群体消费者;智能体分身技术可以帮助减轻医护人员负担,提高服务效率等。垂直...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类...……更多
...今日观点:腾讯刘煜宏:腾讯混元大模型正在积极发展多模态模型及应用腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,多模态大模型将重构内容产业,基于多模态的应用也会百花齐放。他介绍,腾讯混元大模型技术架构已...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先...……更多
更多关于科技的资讯:
英伟达再次出手收购以色列公司,已通过欧盟委员会反垄断审核
前脚 AMD 苏姿丰刚刚完成针对 AI 初创企业 Liquid AI 的投资,后脚英伟达黄仁勋针对 AI 初创企业 Run:ai 的收购亦通过了欧盟委员会的审核
2024-12-23 09:16:00
高德地图联合蔚来行政旗舰ET9首发全域车道级导航 路网数据天级更新,以AI构建全场景导航体验
12月21日,一年一度的蔚来NIODAY上,高德地图全域车道级导航携手国产新能源明星车型蔚来智能电动行政旗舰ET9合作亮相
2024-12-23 09:16:00
创造能量分辨率新纪录,科学家为磁性超导体存在提供直接实验证据
近年来,超导因无损耗传输电能的特性而备受关注,其在磁悬浮列车、医学成像(例如核磁共振成像)、量子计算等领域具有广阔的应用前景
2024-12-23 09:17:00
苦等大半年,苹果 iOS 19 可算有了好消息
从 6 月 11 日在苹果 WWDC24 中登场,到 7 月 16 日首个公测版上线,再到 9 月 17 日正式版发布
2024-12-23 09:18:00
汤姆猫推出 AI 童伴机器人:支持主动聊天、情绪识别,1499 元起
IT之家 12 月 22 日消息,汤姆猫昨日在京东等平台推出 AI 童伴机器人,共有经典款、豪华款、尊享款三个版本,售价分别为 1499 元
2024-12-23 09:19:00
因需求过高,ASML 取消非员工订购的 High-NA EUV 光刻机乐高模型
IT之家 12 月 23 日消息,X(原推特)用户 @jonmasters 发现,光刻机制造商阿斯麦(ASML)正在取消非员工订购的限量版 Twinscan EXE:5000 乐高模型订单
2024-12-23 09:19:00
腾讯 QQ 更新 Windows 9.9.17、macOS 6.9.63、Linux 3.2.15
IT之家 12 月 23 日消息,腾讯 QQ 于 12 月 20 日更新 Windows 9.9.17、macOS 6
2024-12-23 09:19:00
OPPO 首款高分子玻纤背板由 A5 Pro 手机首发
IT之家 12 月 22 日消息,OPPO A5 Pro 手机将于 12 月 24 日 14:30 发布,新机采用居中大圆相机模组设计
2024-12-23 09:21:00
一加 Ace 5 Pro 手机支持「超远距灵动蓝牙」
IT之家 12 月 22 日消息,一加 Ace 5 系列手机发布会已官宣定档 12 月 26 日 14:30,届时还将带来一加平板
2024-12-23 09:22:00
iCar:大量水军对iCar V23高频恶意攻击、网暴车主,已收集证据
IT之家 12 月 22 日消息,今日奇瑞旗下 iCar 汽车官方在微博发布公告称,近期大量水军账号利用虚假信息,通过单一账号重复发布
2024-12-23 09:22:00
荣耀 Magic7 RSR 保时捷设计手机上线官网,最高 24GB+1TB
IT之家 12 月 22 日消息,荣耀 Magic7RSR 保时捷设计及影像技术发布会定档 12 月 23 日 14:00
2024-12-23 09:22:00
Meta 首席技术官:无线计算单元并非独立 VR 头显的“灵丹妙药”
IT之家 12 月 22 日消息,本周 Meta 首席技术官兼 Reality Labs XR 团队负责人安德鲁・博斯沃思在其 Instagram 问答环节中
2024-12-23 09:22:00
红魔游戏手机官宣:“至尊超大杯”12月23日见
IT之家 12 月 22 日消息,红魔游戏手机官方今日宣布,“红魔至尊超大杯即将来袭”,明天见。红魔游戏手机称:“谁说性能
2024-12-23 09:23:00
填补国内空白,首颗自研 AVS3 视觉智算芯片 SPARK RE3200 发布
IT之家 12 月 22 日消息,博雅睿视宣布,在 AVS 工作组第 91 次会议期间,发布了自主研发的首颗支持 AVS3 / SVAC 编码的端侧视觉智算 SoC 芯片 SPARK RE3200
2024-12-23 09:23:00
华硕电脑惊现“圣诞花环”,用户误以为感染病毒
IT之家 12 月 22 日消息,近日部分华硕电脑用户在 Windows 11 系统下遭遇了一次令人不安的经历:屏幕底部突然出现一个占据屏幕约三分之一的圣诞花环横幅
2024-12-23 09:24:00