• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...疗等领域,持续放大技术普惠。通用大模型“全尺寸、全模态”开源,“通义舞王”爆火本季度,阿里云发布开源大模型通义千问Qwen-72B,该模型10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,也标志着阿...……更多
从云栖大会,看阿里的科技本色
...模型之外,阿里巴巴在 7 月还曾经发布过「通义万相」多模态绘画模型。此次发布中,基于通义千问和通义万相,阿里巴巴又进一步升级了通义大模型家族,提出了 8 个行业模型。其中包括在 8 月已经发布过的听悟,目前累计用...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
阿里大模型,再次开源大放送
...版让不少人都迫不及待想试试。并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。 01Qwen1.5开源此次...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...大模型以及丰富第三方模型(如Llama、百川等)。支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中,通义方面发布了最强开源模...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...rcoPolo由此诞生。 并且,实现了更低成本更优效果。在多模态方面,多模态大模型MarcoPolo-VL能够用「眼睛」精准识别,进行推荐。还有团队最新发布的多模态大模型Ovi,直接拿下开源第一。在ICCV 2023顶会上,一向低调的阿里国际...……更多
...,通义宣布加入开源行列,随之启动开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。大模型的训练和迭代成本极高,开源模式让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
“AI全家福”集中亮相数贸会 50多个大模型同场竞技
...相。围绕机器深度学习、自然语言处理、认知大模型、多模态大模型技术等一系列AIGC技术进行展示,体现智能化浪潮正如何改变我们的工作和生活。在阿里巴巴展区,“通义家族”AI大模型应用一字排开。基于阿里自研的“通义...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...研大模型夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
阿里夸克发布自研大模型,应用于搜索、医疗健康、教育等场景
...据介绍,夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供A...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。以最新推出的小米汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗...……更多
共话数智健康未来:赫力昂携行业专家聚焦健康产业新趋势
...示,AI大模型在健康服务领域展现着巨大潜力,例如,多模态的能力可以生成健康科普知识,提升公众健康素养;自然语义的技术将助力更多特殊群体消费者;智能体分身技术可以帮助减轻医护人员负担,提高服务效率等。垂直...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类...……更多
...今日观点:腾讯刘煜宏:腾讯混元大模型正在积极发展多模态模型及应用腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,多模态大模型将重构内容产业,基于多模态的应用也会百花齐放。他介绍,腾讯混元大模型技术架构已...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先...……更多
更多关于科技的资讯:
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
来自卡内基梅隆大学、马里兰大学、哥伦比亚大学、斯坦福大学、麻省理工学院、清华、北大、港大等全球 AI 顶尖高校和 Nvdia 等研究机构的华人团队
2024-12-20 09:22:00
送礼物,微信电商的关键一枪
微信开放“送礼物”,会改变电商行业格局吗?这或许是近些年来,微信最大胆的一步。12月17日,微信小店运营团队发布公告称
2024-12-20 09:24:00
豆包再降价,字节“饱和式”进攻仍在继续
大模型应用大战即将一年整,竞争依然激烈。12月18日的火山引擎Force冬季大会上,字节跳动“豆包全家桶”又迎来了新成员
2024-12-20 09:25:00
三星和世嘉合作推出索尼克主题 PRO Plus microSD 卡
IT之家 12 月 20 日消息,科技媒体 thefpsreview 昨日(12 月 19 日)发布博文,报道称三星和世嘉合作
2024-12-20 09:26:00
第六代联想ThinkBook Plus卷轴屏笔电渲染图曝光,或CES 2025发布
IT之家 12 月 20 日消息,北京时间今天凌晨,爆料人 Evan Blass 发布了其所称的“第六代联想 ThinkBook Plus”笔记本的图片
2024-12-20 09:27:00
八位堂海外推出 Ultimate Mini 有线游戏手柄,紧凑 Xbox 布局
IT之家 12 月 20 日消息,八位堂现已在海外推出一款型号为 Ultimate Mini 的游戏手柄,号称专门为青少年或小手玩家打造
2024-12-20 09:27:00
OnexPlayer G1壹号mini游戏本预热:搭载AMD锐龙AI9 HX 370处理器
IT之家 12 月 19 日消息,除 OnexPlayer X1 Pro 外,壹号本科技还预热了另一款搭载 AMD 锐龙 AI 9 HX 370 处理器的新机 ——OnexPlayer G1
2024-12-20 09:28:00
谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3
2024-12-20 09:28:00
闪极 S4 唱片充电器 65W 发布:透明设计、自带伸缩线,249 元
IT之家 12 月 19 日消息,在今晚举行的 AI 眼镜发布会上,闪极还公布了一款 S4 唱片充电器 65W ,现已在京东平台上架并开售
2024-12-20 09:29:00
闪极 AI“拍拍镜”智能眼镜发布:接入数十家大模型,售 999 元起
IT之家 12 月 19 日消息,闪极今晚正式发布新款 AI 智能眼镜 —— 闪极 AI「拍拍镜」,零售价 1499 元
2024-12-20 09:29:00
中国大陆首条 TFT 基 Micro LED 量产线及首台量产产品点亮
IT之家 12 月 19 日消息,成都辰显光电有限公司今日发文宣布,在四川省成都市今日举行的 2024 世界显示产业创新发展大会开幕式上
2024-12-20 09:30:00
全球首款遇冷变色手机 realme 14 Pro 外观公布
IT之家 12 月 19 日消息,realme 14 Pro 率先在印度官宣,同时该系列机型外观设计也正式公布,该系列机型将于明年 1 月正式发布
2024-12-20 09:30:00
快手可灵 1.6 模型发布
IT之家 12 月 19 日消息,快手今日宣布视频生成推出可灵 1.6 模型,文本响应度、画面美感及运动合理性,均有明显提升
2024-12-20 09:30:00
xMEMS Labs 预告 CES 2025 首度公开展示扬声器、芯片上风扇新品
IT之家 12 月 19 日消息,MEMS 微电子机械系统设备制造商 xMEMS Labs 表示,将于明年 1 月初的 CES 2025 消费电子展上首度公开展示其基于 MEMS
2024-12-20 09:32:00
微星首款 DP 2.1 显示器 MPG 322URX QD-OLED 亮相
IT之家 12 月 19 日消息,微星首款搭载 DP 2.1 接口的显示器 MPG 322URX QD-OLED即将上市
2024-12-20 09:32:00