• 我的订阅
  • 头条热搜
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...势值得注意的是,Sora推出的同一天,谷歌发布了Gemini多模态模型的更新版本,而三天前,StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久,OpenAI发布...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
...,但GPT-4o也有一定的能力提升。发布会上,GPT-4o表现出多模态理解和输出能力,它能够跨声音、文本和视觉进行智能推理,可以就用户给出的截图、照片,或含有文本和图像的文件展开对话。项立刚表示,此前ChatGPT主要是通过...……更多
MediaTek发布天玑9300旗舰5G生成式AI 移动芯片,开启全大核计算时代
...型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验。 天玑9300率先采用新一代旗舰12核GPU Immortalis-G720,与上一代相比,峰值性能提升46%,相同性...……更多
对话|腾讯云陈磊:小样本数智人12小时就能造出来,成本降至千元
...钟真人口播视频、100句语音素材,之后通过音频、文本多模态数据输入,能够实现实时建模并生成高清人像,制作周期缩短至24小时。陈磊表示,小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录...……更多
国脉文化盘中涨停!游戏ETF(159869)午后走强涨近3%
...,完美世界、光线传媒、吉比特、浙数文化均涨超2%。多模态AI领域新技术及应用密集推出,应用前景广阔。大模型层面,谷歌于12月6日正式发布新一代大模型Gemini。应用层面,基于文字和图像输入生成视频的应用涌现,技术持...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
ai文字生成视频技术的发展趋势
随着技术的发展,AI文字生成视频逐渐出现,崭露头角,为个人内容创作和企业传播提供了相应的手段。本文将阐述AI文字生成视频技术的强大潜力和广泛应用价值,一起来看看吧。随着技术的日益先进,AI文字生成视频技术逐...……更多
中国AIGC创新 一场“逆互联网”式创业
...深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想,虚拟人生成技术将会突飞猛进。几年内,AI将能完成动画电影级别的制作,80%以上的动画产品都可以利用AI生成,未来电影工业或许...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
...项目Project Astra、对标Sora的文生视频模型Veo,以及支持多模态输入的AI搜索引擎和第六代Tensor处理器单元(TPU)Trillium芯片等等。其中,Astra是谷歌的AI智能体项目,能够通过手机摄像头或智能眼镜来“看到”用户眼前的内容,响...……更多
...大模型Soul X,该模型具备条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。同时,Soul正在围绕用户需求和社交场景推进“模应一体”落地。 ……更多
AI为数字办公按下“加速键”
...国区消费业务群总经理张华表示,人工智能电脑将实现多模态自然语言交互,提升机器的用户意图理解能力,这样的创新能给用户在工作、学习、生活等多场景中带来别样体验。 关注技术风险在金山办公首席执行官章庆元看来...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
...事。韩冀中告诉南都记者,Diffusion网络的提出,催生了跨模态内容生成,使AI可以用文字生成视频,虽然生成的水平不及Sora。而且,目前Sora的应用场景还很有限。“生成式AI从文本到影像世界,还没有到跨越式发展的程度。”腾...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等。认知大模型的“智能涌现”也将带来解决人类刚需的全新机遇。比如,改变信息分发获取模式,革新内容生产模式,全自然交互完成任务,实现专家级的虚拟...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练,就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-V...……更多
一场天玑开发者大会,看尽联发科对生成式 AI 时代的野望
...了定义:利用大规模、预训练的生成式 AI 模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。同时,生成式 AI 手机需要具备支持大模型的本地部署、提供自然的交互方式、多模态内容输入与输出以及拥有实现...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
ChatGPT模型“大跃进”,各大电商平台重金入场有何变局?
...金投入AI技术。早在2020年初,阿里达摩院就启动了中文多模态预训练模型M6项目,同年6月推出3亿参数的基础模型。2021年1月,模型参数就达到了百亿量级,成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌现。”刘庆峰表...……更多
更多关于科技的资讯:
本文转自:中国经济网新闻背景:近年来,网红卖课风生水起。一些网红披着情商、财商、成功学、精英教育等外衣,向粉丝销售“IP课程”
2024-06-23 08:55:00
本文转自:人民日报客户端刘洪超今年以来,浑南科技城紧紧围绕创新链布局产业链,创新开展“新东拓+”科技招商专项行动,探索实施“科学家+创新平台(团队)+新质企业”科技招商新模式
2024-06-23 09:27:00
本文转自:人民日报客户端22日,2024年“数据要素×”大赛辽宁分赛启动仪式在辽宁沈阳成功举办。本次大赛是由国家数据局等有关部门举办的首个聚焦数据要素开发应用的全国性大赛
2024-06-23 09:27:00
本文转自:南方日报珠海首批EH216-S无人驾驶载人航空器交付打造国内首个海岛低空经济应用场景南方日报讯 6月21日,首批用于珠海万山群岛低空经济示范项目的载人及物流无人驾驶航空器在云浮举行交付仪式
2024-06-23 09:47:00
一加性能生态新品正式发布,挑战前所未有的巅峰
6月21日,一加手机官微宣布:6月27日19:00,一加夏季性能生态新品发布会,携一众性能新品正式登场。从官方预热图来看
2024-06-23 00:06:00
最香小折叠!荣耀Magic V Flip获5K-8K折叠屏首销日销量冠军:4999元
快科技6月23日消息,荣耀官方宣布,荣耀Magic V Flip斩获5K-8K折叠屏首销日销量冠军。和其它小折叠不同,荣耀Magic V Flip配备一块目前行业最大的4英寸“梦想小巨幕”
2024-06-23 00:21:00
性能猛兽未发先火!超20万人预约一加Ace 3 Pro
快科技6月23日消息,一加将于6月27日发布一加Ace 3 Pro,这款新品已在OPPO商城上架接受预约。目前已有22
2024-06-23 00:21:00
iqooneo9spro性价比如何?
手机市场要找性价比,子品牌是最佳选择,早期有红米和荣耀,但如今的市面上,可谓是百花齐放,OV两家也有新秀,比如说vivo的iQOO
2024-06-23 00:20:00
燃气灶没坏但超过8年要换吗?看完心里有数了!
燃气灶作为家庭厨房的重要设备,其安全性至关重要。根据国家标准《家用燃气燃烧器具安全管理规则》GB17905-2008,家用燃气灶具的判废年限为8年
2024-06-23 00:54:00
苹果手机照片访问权限怎么设置?
设置iPhone苹果手机的照片访问权限是保护您的隐私和安全的重要步骤。您可以通过以下步骤来设置和管理照片访问权限,以确保只有您授权的应用程序可以访问您的照片
2024-06-23 01:04:00
一加ace3pro新配色“钛空镜银”曝光
6月22日消息,一加今日公布即将于6月27日晚7点发布的一加Ace3Pro手机的新配色“钛空镜银”。据介绍,钛空镜银配色采用银色亮面玻璃
2024-06-23 00:47:00
“续航怪兽”荣耀畅玩60plus即将开启预售
今天我要跟你们分享一个激动人心的新消息,保证会让你们眼前一亮!想象一下,在这个快节奏的时代,我们每天都在寻找那款能够完美平衡性能
2024-06-23 01:23:00
如何将iphone中的照片导入到电脑上
将iPhone中的照片导入到电脑并不复杂,您可以通过多种方法来实现这一目标。以下是一些常用的方法:1.使用iTunes
2024-06-23 01:05:00
如何提高机床警示led灯的耐用性和可靠性?
提升机床警示LED灯的耐用性和可靠性是确保工业生产连续性和安全性的关键因素。以下是几种提升方法的研究和技术措施:材料与结构优化选择高品质LED芯片:选择经过严格筛选和认证的LED芯片
2024-06-23 01:22:00
一加ace3强大配置和合理价格,成为众多消费者的心头好
一加手机,作为智能手机市场的一匹黑马,其品质可谓是有目共睹。从每一部产品的设计、生产到出厂,一加都秉持着精益求精的态度
2024-06-23 01:42:00