• 我的订阅
  • 头条热搜
本周(4.8-4.14)AI界发生了什么?
...源:论文论文链接:AI界前线马斯克旗下xAI发布其首款多模态大模型4月13日消息,马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外,Grok现在可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...到新高度 ;Andrej:从 Tesla 回归的创始成员和 CV 大牛,多模态的加速器 ;Mira:新晋 CTO,AI 人机交互领域最重要的 PM 之一;Lilian Weng:前沿技术和应用研究的桥梁;Jakub Pachocki:GPT-4预训练的核心 Lead;等等几乎是硅谷甚至是全球.……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
全球同频变现最快,AI赋能广告营销的道与术
...i正式发布,作为Google迄今为止规模最大、能力最强的AI多模态模型,业内认为Gemini将对整个广告营销行业带来巨大的变化。目前,微软也正通过与OpenAI的密切合作,去抢占未来数字广告市场。比如基于必应搜索中的微软广告创建...……更多
AIGC按下昆仑万维的全球化加速度
...yText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。有意思的是,昆仑天工起先源于规...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
不要小看「实而不华」的腾讯 AI
...未来的战略思路。01模型侧:基础模型能力升级,构建多模态能力首先是基础模型方面,5 月 17 日的峰会上,腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在 1B、3B、7B、13B 等不同参数量...……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
“Sora目前仍不够可靠,应用场景受限”
...事。韩冀中告诉南都记者,Diffusion网络的提出,催生了跨模态内容生成,使AI可以用文字生成视频,虽然生成的水平不及Sora。而且,目前Sora的应用场景还很有限。“生成式AI从文本到影像世界,还没有到跨越式发展的程度。”腾...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...、知识更新鲜,而且能一次性输入一整本书。2、开放新模态API:包括接受图像输入的GPT-4 Turbo、文生图模型DALL·E 3、 文本转语音模型TTS,不久后还将支持自动语音识别模型Whisper v3。 3、GPT定制化服务:支持用户5分钟内、无代码...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
...为,从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI(通用人工智能)的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多
meta推出两款基于ai的图像编辑工具
...编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多样性。据悉,EmuEdit号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务...……更多
RTX 40系GPU AI性能首测
...IAACE技术Demo,它突破了游戏中NPC角色互动的界限,采用多模态方法来展示NPC,将认知、感知和行为系统集成在一起,以实现身临其境的叙事效果。在活动现场NVIDIA也展示了新版本的ChatRTX,增加了更多的功能,在新版本中它加入...……更多
2024年投资展望丨AI、MR、短剧等概念爆发,传媒板块去年逆市涨近17%
...的发展,带来结构化的成长趋势。一、AI应用拓展 1、多模态加速应用端落地 目前,多家厂商快速布局卡位多模态大模型,AI文生图、文生视频等多模态能力持续提升带动AI应用持续迭代升级。海内外爆款AI应用频现,如Pika 1.0、R...……更多
SAM是如何做到“分割一切”的
...重要的功能——图像分割。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员、中国科学院大学人工智能学院教授杨戈向记者表示。那么,SAM的技术原理是什么?相比于此前的图像分割模型,该模型有何不同...……更多
...统文字、图片、视频简单叠加的信息传播形态,实现了多模态信息建构,催生出场景式、沉浸式的互动与传播。二是让传播主体更加多元。Sora的应用将加快打破传统媒体和影视公司在信息传播中的垄断地位,催生更多多样化的...……更多
创新工场李开复:AI 2.0已至,将诞生新平台并重写所有应用
...的重大突破之后,AI 已经来到从 1.0 迈入 2.0 的拐点。多模态、巨型数据集的飞速发展,AI 优化目标函数及训练模型的技术方法将大幅精进,能更好地模拟人类的认知智能。此外,AI 2.0 将会带来平台式的变革,改写用户的入口和...……更多
未来已来!AI大模型,让手机真正开始「智能」
...拍照算法中也巧妙地融入了大模型,例如在抠图中,利用生成式视觉模型做更好的语义分割,不但分割精度高至发丝级,而且最多可以支持6个主体的分割与提取,利用大模型的绘图重建能力,智能消除图片中的路人与杂物,获...……更多
华人团队爆火instructblip抢跑看图聊天
碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线,就已经被超越了。近来,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。BLIP家族...……更多
ChatGPT席卷全球,内容产业最先被革命?
...表报告认为,ChatGPT中短期内产业化的方向,主要为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。其中,AICG属于有望率先落地的情况。在近日举办的第十二届中国数字出版博览会上,中文在线集团董事...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...势值得注意的是,Sora推出的同一天,谷歌发布了Gemini多模态模型的更新版本,而三天前,StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久,OpenAI发布...……更多
...,但GPT-4o也有一定的能力提升。发布会上,GPT-4o表现出多模态理解和输出能力,它能够跨声音、文本和视觉进行智能推理,可以就用户给出的截图、照片,或含有文本和图像的文件展开对话。项立刚表示,此前ChatGPT主要是通过...……更多
MediaTek发布天玑9300旗舰5G生成式AI 移动芯片,开启全大核计算时代
...型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验。 天玑9300率先采用新一代旗舰12核GPU Immortalis-G720,与上一代相比,峰值性能提升46%,相同性...……更多
对话|腾讯云陈磊:小样本数智人12小时就能造出来,成本降至千元
...钟真人口播视频、100句语音素材,之后通过音频、文本多模态数据输入,能够实现实时建模并生成高清人像,制作周期缩短至24小时。陈磊表示,小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录...……更多
更多关于科技的资讯:
本文转自:央广网央广网北京6月10日消息(记者张棉棉)据中央广播电视总台中国之声《新闻和报纸摘要》报道,2019年6月
2024-06-10 11:40:00
自主设计制造!世界首创!我国深水油田智能开发模式取得新突破
本文转自:央视网央视网消息:关注亚洲首艘圆筒型“海上油气加工厂”——“海葵一号”海上安装的最新情况。6月10日凌晨,在作业船291上
2024-06-10 13:43:00
有意思!太空中4条斑马鱼腹背颠倒游泳、旋转运动、转圈
本文转自:央视网央视网消息:一个多月以来,还有很多网友惦记着太空中养的4条斑马鱼怎么样了。前几天,航天员在问天实验舱开展了水样样品采集和鱼食盒更换等操作
2024-06-10 13:46:00
本文转自:央视网今天(10日)凌晨,在作业船291上,水下锚链和“海葵一号”牵引链成功对接,这意味着12根锚链中的最后一根完成“接骨”
2024-06-10 13:50:00
“变身”“瘦身”“伸展”,处处“黑科技”!月球背面那一抹鲜艳中国红
本文转自:央视网央视网消息:此次,嫦娥六号任务过程中着陆器携带的一面五星红旗备受关注。这是中国首次在月球背面独立动态展示国旗
2024-06-10 13:54:00
本文转自:人民网人民网联合报道组又到一年“618”,各大电商平台正跃跃欲试。在江浙沪皖,政企联动,也在不停歇“抢单”。这个“订单”
2024-06-10 07:42:00
价格低品种全 量贩零食店在我市街头遍地开花
本文转自:铜川日报价格低品种全 量贩零食店在我市街头遍地开花本报记者 郭璇顾客正在选购零食 工作人员及时补货 “去零食店买矿泉水
2024-06-10 08:10:00
厦门上百场促消费活动 点燃端午假期市场热度
SM城市广场里的艺术展吸引市民驻足欣赏。假期的商场人头攒动,市民消费热情高涨。(本组图/厦门日报记者 张奇辉 摄)厦门网讯(厦门日报记者 沈彦彦)端午假期
2024-06-10 08:40:00
本文转自:廊坊日报本报讯(记者 王洋洋 通讯员 蔡茜 刘伟)走进三河同飞制冷股份有限公司自动化生产车间,一台台智能温控设备正在高效产出
2024-06-10 09:30:00
本文转自:桂林日报 □本报记者唐健扬“大幅度运动时,俯仰角基本在0.2度以内,缓慢运动的时候,一般可以保证在0.05度以内……”在桂林飞宇科技股份有限公司(以下简称“飞宇科技”)产品展示大厅
2024-06-10 10:09:00
netflix正在测试其重新设计的电视应用程序
Netflix正在测试其重新设计的电视应用程序,这是该应用程序近十年来的首次重大改版。新的设计与当前的外观有明显的不同
2024-06-10 00:22:00
智能手机,将成为“掌上医生”
平安健康、长命百岁是人们最朴素的愿望,也是最美好的祝福。但是,和“普通人”一样的生活方式不会让你长寿。遵循各路养生大师的教导
2024-06-10 00:42:00
618发布荣耀200系列新机,主打亮点仍是流光四曲屏
大家都知道奢侈品的成本并不高,之所以价格昂贵依然有那么多人愿意买,一方面是因为品牌有附加值,另一方面则是因为奢侈品的外观设计看起来也更高端
2024-06-10 00:37:00
红米k70pro跌破两千五,骁龙8gen3顶级旗舰
距离618结束还有10天的时间,不出意外的话,接下来各大手机厂商就会发起最后的一波冲刺小高潮,可能现在的各种热门爆款机型的价格还会有小幅下跌
2024-06-10 00:29:00
真我rmx3995/3996支持 10W 充电
6月9日消息,真我realme新款入门级5G手机RMX3995/3996现已“三证齐全”,搭载5000mAh电池与720p屏幕
2024-06-10 00:44:00