• 我的订阅
  • 头条热搜
华人团队爆火instructblip抢跑看图聊天
碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线,就已经被超越了。近来,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。BLIP家族...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...势值得注意的是,Sora推出的同一天,谷歌发布了Gemini多模态模型的更新版本,而三天前,StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久,OpenAI发布...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
...,但GPT-4o也有一定的能力提升。发布会上,GPT-4o表现出多模态理解和输出能力,它能够跨声音、文本和视觉进行智能推理,可以就用户给出的截图、照片,或含有文本和图像的文件展开对话。项立刚表示,此前ChatGPT主要是通过...……更多
研究人员提出版权授权方案,能将艺术家风格和IP版权授权给AIGC模型
生成式人工智能极大地改变了人类生活。与此同时,由于这类大模型的训练需要非常巨大的训练数据,不可避免地会使用到人类创作者的未授权数据。比如说在图像生成领域,像 Stable Diffusion 和 Midjourney 可以很好地复刻一些艺...……更多
MediaTek发布天玑9300旗舰5G生成式AI 移动芯片,开启全大核计算时代
...型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验。 天玑9300率先采用新一代旗舰12核GPU Immortalis-G720,与上一代相比,峰值性能提升46%,相同性...……更多
对话|腾讯云陈磊:小样本数智人12小时就能造出来,成本降至千元
...钟真人口播视频、100句语音素材,之后通过音频、文本多模态数据输入,能够实现实时建模并生成高清人像,制作周期缩短至24小时。陈磊表示,小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录...……更多
国脉文化盘中涨停!游戏ETF(159869)午后走强涨近3%
...,完美世界、光线传媒、吉比特、浙数文化均涨超2%。多模态AI领域新技术及应用密集推出,应用前景广阔。大模型层面,谷歌于12月6日正式发布新一代大模型Gemini。应用层面,基于文字和图像输入生成视频的应用涌现,技术持...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
ai文字生成视频技术的发展趋势
随着技术的发展,AI文字生成视频逐渐出现,崭露头角,为个人内容创作和企业传播提供了相应的手段。本文将阐述AI文字生成视频技术的强大潜力和广泛应用价值,一起来看看吧。随着技术的日益先进,AI文字生成视频技术逐...……更多
中国AIGC创新 一场“逆互联网”式创业
...深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想,虚拟人生成技术将会突飞猛进。几年内,AI将能完成动画电影级别的制作,80%以上的动画产品都可以利用AI生成,未来电影工业或许...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...用同行,充分释放生产力。 此外,腾讯混元大模型在多模态能力上也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;...……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
...项目Project Astra、对标Sora的文生视频模型Veo,以及支持多模态输入的AI搜索引擎和第六代Tensor处理器单元(TPU)Trillium芯片等等。其中,Astra是谷歌的AI智能体项目,能够通过手机摄像头或智能眼镜来“看到”用户眼前的内容,响...……更多
...大模型Soul X,该模型具备条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。同时,Soul正在围绕用户需求和社交场景推进“模应一体”落地。 ……更多
AI为数字办公按下“加速键”
...国区消费业务群总经理张华表示,人工智能电脑将实现多模态自然语言交互,提升机器的用户意图理解能力,这样的创新能给用户在工作、学习、生活等多场景中带来别样体验。 关注技术风险在金山办公首席执行官章庆元看来...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
...事。韩冀中告诉南都记者,Diffusion网络的提出,催生了跨模态内容生成,使AI可以用文字生成视频,虽然生成的水平不及Sora。而且,目前Sora的应用场景还很有限。“生成式AI从文本到影像世界,还没有到跨越式发展的程度。”腾...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等。认知大模型的“智能涌现”也将带来解决人类刚需的全新机遇。比如,改变信息分发获取模式,革新内容生产模式,全自然交互完成任务,实现专家级的虚拟...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练,就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-V...……更多
一场天玑开发者大会,看尽联发科对生成式 AI 时代的野望
...了定义:利用大规模、预训练的生成式 AI 模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。同时,生成式 AI 手机需要具备支持大模型的本地部署、提供自然的交互方式、多模态内容输入与输出以及拥有实现...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
ChatGPT模型“大跃进”,各大电商平台重金入场有何变局?
...金投入AI技术。早在2020年初,阿里达摩院就启动了中文多模态预训练模型M6项目,同年6月推出3亿参数的基础模型。2021年1月,模型参数就达到了百亿量级,成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型...……更多
更多关于科技的资讯:
人民网“福建金融舆情管理共享平台”上线 打造金融舆情服务新模式
本文转自:人民网金融是国民经济的血脉,是国家核心竞争力的重要组成部分。日前,中央金融工作会议要求,各地区各部门要扎实做好加强金融监管
2024-06-26 20:22:00
更轻更节能!全球首列商用碳纤维地铁列车在青岛发布
本文转自:人民日报客户端侯琳良6月26日,中车青岛四方机车车辆股份有限公司联合青岛地铁集团为青岛地铁1号线研制的碳纤维地铁列车“CETROVO1
2024-06-26 22:42:00
蔚来车主踩断加速踏板 官方回应:车辆曾发生严重碰撞事故
快科技6月26日消息,说一个很多人可能想不到的冷知识,汽车的加速踏板并非金属,是有可能被踩断的,特殊情况下也会自己断裂
2024-06-26 16:07:00
美团忽视的闲时生意:被抖音做火了
快科技6月26日消息,在本地生活服务领域,抖音通过创新的"错峰特惠"活动,巧妙捡起了美团忽视的闲时生意。想象一下,一家店有时候人头攒动
2024-06-26 16:07:00
@高考生,新能源汽车大佬们喊你来选专业啦
‍‍‍‍近日,工信部发布的《制造业人才发展规划指南》显示,到2025年,我国新能源汽车产业的人才缺口可达103万人。其中
2024-06-26 16:11:00
千余家企业参展 第27届青岛国际机床展览会启幕
宋祖锋青岛报道6月26日,第27届青岛国际机床展览会和第7届中日韩智能制造大会在青岛市即墨区启幕。本次展览会为期五天,将深度聚焦中日韩智能制造前沿
2024-06-26 16:12:00
青岛发布全球首列商用碳纤维地铁:重量更轻 年内载客
快科技6月26日消息,全球首列商业化运营的碳纤维地铁列车“CETROVO 1.0 碳星快轨”今日在青岛正式发布。该列车由中车四方股份公司与青岛地铁集团联合研制
2024-06-26 16:22:00
7分10秒!疑小米SU7纽北圈速曝光:比奔驰AMG GT R还快
快科技6月26日消息,小米SU7已经前往世界最为知名的纽北赛道测试,近日,有网友曝光了该车的成绩,其称自己就在现场观看
2024-06-26 16:22:00
腾讯QQ的“祖师爷”!聊天软件鼻祖ICQ今日正式停止服务
快科技6月26日消息,聊天软件鼻祖ICQ在5月份发表公告称,将于6月26日关闭,建议用户改用VK Messenger。ICQ官网今天显示“Service stopped working”
2024-06-26 16:22:00
探店经济激发消费新活力 短视频、直播让餐饮酒旅更巴适四川新闻网成都6月26日讯在数字化浪潮下,抖音等短视频和直播平台已成为人们获取信息
2024-06-26 16:22:00
设计大咖齐聚2024科勒 · 设计上海设计论坛
2024年6月19日(中国,上海)——亚洲权威设计盛会「设计上海」2024于上海世博展览馆盛大开幕,汇聚世界设计力量,见证全球设计新高度
2024-06-26 16:23:00
同一角色两套穿搭!美女COS老头环人物反差感十足
借着《艾尔登法环:黄金树幽影》发售后的热度,围绕游戏中的女角色,例如女武神玛莲妮亚、永恒女王玛莉卡、梅琳娜的COS作品在近期也涌现了出来
2024-06-26 16:37:00
光存储第一股!紫晶存储因欺诈发行退市被追偿10.86亿元
快科技6月26日消息,据媒体报道,紫晶存储发布公告称,收到中信建投、致同会计师事务所、容诚会计师事务所和广东恒益律师事务所等的诉讼材料
2024-06-26 16:52:00
万元折叠屏机皇降临!三星Galaxy全球发布会前瞻
三星公司官宣将于北京时间7月10日21点在法国巴黎举办Galaxy全球新品发布会。本次活动全程网络直播,将会发布Galaxy Z Fold6
2024-06-26 16:52:00
两栋大厦几乎搬空 完美世界回应大规模裁员
快科技6月26日消息,针对近期网络传言关于完美世界启动大规模裁员的消息,公司今日作出回应,确认此举为必要的人员结构优化
2024-06-26 16:52:00