• 我的订阅
  • 头条热搜
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...竟发生了 180° 转变。昨天,谷歌在 X 上展示 Gemini 原生多模态能力的 6 分半钟视频下,几乎是清一色的赞扬:而到了今天,Gemini 还是那个 Gemini,但网友已经不买账了:发生了什么,才会让人们的态度一夜转变?原因在于那个 6 ...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...“文心百中”。去年,阿里达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破。其中使用 512 卡 V100 GPU 实现全球最大规模 10 万亿参数多模态大模型 M6,同等参...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...供互联网实时资讯问答以及更好的数学计算等服务。在多模态大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
... 3D 版 ControlNet,极简的架构使它能够高效地支持各种不同模态的条件 (Condition)控制。他们实现了几种用户可以轻松提供的示例条件,包括文本(原生支持),以及图像 / 草图、体素 (Voxel)、多视图图像(Multiview Images)、点云...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...社交音乐舞蹈类AIGC应用 具体来说,鹦鹉人是一款基于多模态AI大模型PARO构建的,聚焦虚拟数字人形象、虚拟唱歌、虚拟舞蹈、虚拟陪伴和语聊的消费级AIGC应用。用户上传照片后,即可在鹦鹉人APP中生成个性化的3D虚拟形象。系...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...到新高度 ;Andrej:从 Tesla 回归的创始成员和 CV 大牛,多模态的加速器 ;Mira:新晋 CTO,AI 人机交互领域最重要的 PM 之一;Lilian Weng:前沿技术和应用研究的桥梁;Jakub Pachocki:GPT-4预训练的核心 Lead;等等几乎是硅谷甚至是全球.……更多
本周(4.8-4.14)AI界发生了什么?
...源:论文论文链接:AI界前线马斯克旗下xAI发布其首款多模态大模型4月13日消息,马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外,Grok现在可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
全球同频变现最快,AI赋能广告营销的道与术
...i正式发布,作为Google迄今为止规模最大、能力最强的AI多模态模型,业内认为Gemini将对整个广告营销行业带来巨大的变化。目前,微软也正通过与OpenAI的密切合作,去抢占未来数字广告市场。比如基于必应搜索中的微软广告创建...……更多
AIGC按下昆仑万维的全球化加速度
...yText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。有意思的是,昆仑天工起先源于规...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
不要小看「实而不华」的腾讯 AI
...未来的战略思路。01模型侧:基础模型能力升级,构建多模态能力首先是基础模型方面,5 月 17 日的峰会上,腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在 1B、3B、7B、13B 等不同参数量...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...并得到最终反馈标签。之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Trans...……更多
“Sora目前仍不够可靠,应用场景受限”
...事。韩冀中告诉南都记者,Diffusion网络的提出,催生了跨模态内容生成,使AI可以用文字生成视频,虽然生成的水平不及Sora。而且,目前Sora的应用场景还很有限。“生成式AI从文本到影像世界,还没有到跨越式发展的程度。”腾...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...、知识更新鲜,而且能一次性输入一整本书。2、开放新模态API:包括接受图像输入的GPT-4 Turbo、文生图模型DALL·E 3、 文本转语音模型TTS,不久后还将支持自动语音识别模型Whisper v3。 3、GPT定制化服务:支持用户5分钟内、无代码...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
meta推出两款基于ai的图像编辑工具
...编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多样性。据悉,EmuEdit号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务...……更多
RTX 40系GPU AI性能首测
...IAACE技术Demo,它突破了游戏中NPC角色互动的界限,采用多模态方法来展示NPC,将认知、感知和行为系统集成在一起,以实现身临其境的叙事效果。在活动现场NVIDIA也展示了新版本的ChatRTX,增加了更多的功能,在新版本中它加入...……更多
...为,从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI(通用人工智能)的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多
更多关于科技的资讯:
全国第一人!残障玩家用嘴打过《黑神话:悟空》虎先锋:刷了61次
快科技8月26日消息,最近《黑神话:悟空》大火,很多玩家在游戏里受虐,尤其是前期几个boss,幽魂、白衣秀士、虎先锋,都是虐人的一把好手
2024-08-26 17:59:00
余承东口中25万级最好的SUV!问界新M7 Pro一图看懂
快科技8月26日消息,今日下午,问界新M7 Pro正式上市,共推出四款配置车型,售价区间为24.98-28.98万元。余承东表示
2024-08-26 17:59:00
人脸识别智能门锁销量激增126%!终端市场均价下降近5成
快科技8月26日消息,洛图科技(RUNTO)线上监测最新数据显示,2024年1-7月,人脸识别门锁在线上市场的销量同比上涨了125
2024-08-26 17:59:00
全球最轻!VAIO Vision+ 14便携显示器上市:仅重325克
快科技8月26日消息,VAIO Vision+ 14便携显示器目前已经上市开售,首发价为3999元。据悉,新款显示器的尺寸为312 x 211 x 12
2024-08-26 18:29:00
钾含量7倍于香蕉!抗炎、抗氧化、保护心血管的蔬菜 很多人都没吃过
水晶冰菜,算得上是比较小众的蔬菜了,它具有独特的魅力,叶子上长满了“小冰晶”,近年来逐渐走进了大众的视野,成为了餐桌上的新宠
2024-08-26 18:29:00
国内知名豪车经销商持续亏损!董事长工资打对折全员降薪
快科技8月26日消息,近期,国内豪华和超豪华汽车经销商集团和谐汽车全员降薪的消息引起关注。和谐汽车官方回应表示,降薪是公司为适应市场大环境而采取的阶段性措施
2024-08-26 18:29:00
AMD RX 8000显卡首次现身!只略强于RX 7700 XT
快科技8月26日消息,GeekBench里第一次出现了AMD下一代显卡,显示核心编号为gfx1201,正好对应RDNA 4架构
2024-08-26 18:29:00
砍掉激光雷达 华为高阶智驾基础版能力一览:不支持城区NCA
快科技8月26日消息,今日下午,华为终端举办了“鸿蒙智行新品发布会”,首款搭载华为ADS基础版高阶智驾的SUV问界M7 Pro正式上市
2024-08-26 18:29:00
极越汽车:极越07车门解锁力高5000N 严重变形也能打开
快科技8月26日消息,极越汽车近期发文称,介绍了极越07在遭受严重撞击后,车门解锁力度高达5000N的情况下的表现。在官方进行的正碰
2024-08-26 18:29:00
突发!上海电信崩溃断网 网友:以为是手机坏了
快科技8月26日消息,今天18:00左右,部分上海电信用户在微博上反馈称上海电信崩溃,出现宽带没信号、电信10000号打不通等问题
2024-08-26 18:59:00
锐龙9000配它才带劲!AMD 870E主板9月30日解禁
8月20日,各家厂商纷纷宣布了AMD X870E/X870主板,但是根据博主“KENNY肯尼酷”的说法,现阶段只能进行不点亮开箱展示
2024-08-26 18:59:00
1.5万人大裁员 Intel资深CPU架构师创业!入局RISC-V
快科技8月26日消息,据媒体报道,在Intel宣布规模高达1.5万人的裁员计划之际,一批拥有丰富经验的资深CPU架构师选择离开另起炉灶
2024-08-26 18:59:00
哪吒S猎装车硬核测试:挖掘机开到车顶 车门仍可正常打开
快科技8月26日消息,哪吒汽车CEO张勇发布了一段哪吒S猎装车的硬核测试视频。视频中,一辆徐工75型挖掘机从高台上,直接开上哪吒S猎装车的车顶
2024-08-26 19:59:00
上海电信突然断网!官方回应:正在全力抢修中
快科技8月26日消息,今天下午,大量网友反馈上海电信网络崩溃。甚至不仅宽带没网络,连电信10000电话都打不通了。不少网友到中国电信和电信上海客服官微评论下方反馈
2024-08-26 19:59:00
男子半夜开车犯困:直接在高速停车睡了一个半小时
快科技8月26日消息,困了就睡,这没啥问题,但睡的时间和地点不对,那就有可能出大事。“公安部交通管理局”披露的最新案例显示
2024-08-26 19:59:00