• 我的订阅
  • 头条热搜
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...构设计的基础上,他们搜集了目前市场上可以找到的所有开放版权音乐,并利用 MU-LLaMA 和一些视觉基础模型来生成文本/图像/视频到音乐的多模态数据集,从而助力 M2Ugen 模型的训练。需要说明的是,拥有更多优质的开放数据,...……更多
59秒视频质量媲美“大片”,颠覆影视行业?Sora能吗
...一年多后,OpenAI再度“进化”,日前发布首个AI文字生成视频模型Sora。使用者只需通过文字描述场景,Sora就能生成类似电影的逼真场景,涵盖多个角色、不同类型动作和背景细节等,最高能生成1分钟左右的1080P高清视频,引发...……更多
...,甚至影响政府选举。OpenAI表示,在Sora作为产品向公众开放前,他们会采取几项重要的安全措施,旨在防止模型生成涉及极端暴力、性内容、真实政治家或名人等描述的自动化流程。(徐锐) ……更多
百度文心一言的内测回答,让我惊呆了
...据百度称,文心一言的视频生成能力目前还未对所有用户开放,因为成本比较高,当然未来会逐步接入。从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。...……更多
挺进生成式AI时代,亚马逊云科技出海全球化论坛开放大招!
2024亚马逊云科技出海全球化论坛圆满落幕!过去十年,中国企业借助数字化浪潮的机遇,实现产品和服务从低端制造向高端技术研发的转型,在这股浪潮中,出海寻发展的中国企业队伍也越发壮大,并借助互联网、AI技术的发展打...……更多
谷歌CEO反思大模型生成错误图像:不可接受,初期没有完美AI
...三天前的2月26日,谷歌旗下DeepMind发布了一个根据互联网视频训练的基础世界模型Genie。Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,可以根据合成图像、照片甚至草图生成各种各样动...……更多
stablediffusion3:文字渲染能力大升级
...咋识字儿、不怎么会写字儿,可以说是目前文生图、文生视频的通病了。就拿世超用DALL·E3生成的“Chaping青花瓷”为例,上面汉字不明所以。。。最重要的\"Chaping\"还拼写错了。。。基本上可以说自AI画图不会画手之后,把文本...……更多
谷歌宣布向云计算客户开放Gemini Pro,开发者可用其构建应用
...设施能力,以及围绕隐私和安全做出的承诺,与我们开发开放可用模型的使命非常一致。”随着最近的发布,谷歌对Gemini的定位是“我们进入人工智能领域的下一步”,并吹嘘其拥有“最先进的能力”。这可能是谷歌试图转移人...……更多
出门问问内测探索大模型“序列猴子”,为个人与企业打造专属CoPilot
...意方向。为更好帮助用户提升内容创作效率,“奇妙文”开放了八大AI编辑功能,分别为风格转化、要点提取、校对纠错、续写、改写、扩写、缩写、翻译。“奇妙文”还能在写作中自动生成图片,为用户带来图文并茂的写作体...……更多
openai发布9段sora新视频
...为AI圈内头条,能够基于用户的一句话,生成最长1分钟的视频,效果接近实拍。OpenAI目前并未向公众发布Sora,不过开发者@LinusEkenstam近日发布系列推文,展示了由Sora生成的9段新视频,包括被树叶覆盖的大象、蜜蜂视角飞跃花丛...……更多
...山的人工智能研究公司OpenAI正式对外发布了人工智能文生视频大模型“Sora”。从ChatGPT到Sora,从言语对话到视频生成,不断突破技术瓶颈的人工智能更加全面、深入、生动地融入生活、解析日常、构建价值,展现出了卓越的“进...……更多
大厂要面子,Kimi要里子
...于核心团队技术背景深,另一方面在于产品面向C端免费开放,注重产品运营。”在齐镗泉看来,用户需要的,是一个能解决特定场景中80%问题的大模型、一个结合了本土用户使用习惯的本土化大模型、一个能够与用户进行交互...……更多
腾讯联手多所大学推出StyleCrafter 可用于视频模型
...ter的通用方法,可帮助通过风格控制适配器增强预训练的视频生成模型。论文表示,依靠StyleCrafter,模型可以根据参考图像生成不同风格的视频。为了促进内容与风格的分离,研究团队删除了文本提示中的风格描述,并使用解耦...……更多
最伟大 Windows 降临,微软要用大模型彻底改变操作系统和交互
...发者的 Build 大会上,微软宣布采用与 OpenAI ChatGPT 相同的开放插件标准,从而确保今后 ChatGPT 与微软一系列 copilot 产品服务之间的互操作性。这意味着开发者使用任一平台开发的插件均同时适用于 ChatGPT 和微软的 Microsoft 365、Dynam.……更多
人工智能大模型如何加速赋能千行百业?这场会议给出答案
...智能研究院副院长兼总工程师林咏华以《大模型技术开源开放,为AI未来十年发展打下坚实根基》为主题,向大家分享了自己和团队从事大模型技术开源开放的实践。江苏鲲鹏·昇腾生态创新中心CTO谭涛以企业的最新研发成果为...……更多
自研视频生成模型实现升级,「CreativeFitting」即将面向海外市场发布AI短剧APP | 早期项目
作者 | 吴思瑾编辑 | 邓咏仪*短剧因兼顾了短视频和长视频的优点,是海内外近年来为数不多发展迅速的行业。短剧节奏快,3-5秒就可抓住用户眼球;每集短剧又只有1-2分钟,十分贴合当下用户日益碎片化的时间趋势;但整体看...……更多
国产“Sora”亮相中关村,文生视频相关个股有哪些
...能大模型领域又迎来重大突破,AGI的真正连锁反应或将从视频开始。4月27日上午,“2024中关村论坛-未来人工智能先锋论坛”在北京正式举办,本次平行论坛由科学技术部、北京市人民政府主办,旨在进一步探讨“语言大模型”...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
AIGC革命:拐点降临的内容产业,如何赢得时代先机?
...保障其稀缺性和价值。同时,原始内容可以通过CC0协议来开放其使用权,利用AIGC技术产生大量高质量的衍生项目,从而扩大其影响力和生命力,并获得更高天花板的商业模式。最后,智能合约和通证经济可以建立相应的商业流...……更多
英国ai初创公司wayve公布gaia-1最新进展
...A-1多模态的性质,能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到,GAIA-1可对环境进行学习,从而提供结构性的环境理解,协助自动驾驶系统做出明智的决策。而“预测未来事件”是该模型的基本关键能力,而...……更多
视频大模型 快手美图殊途同归
...用可灵,其他AI功能以限时免费、限次免费等方式向用户开放。美图相关人士并未透露KOMI的变现计划,但付费会员、单次付费等变现模式已是美图成熟的商业模式。不约而同“今天你‘可灵’了吗?”6月12日晚间,快手通过官方...……更多
开局一张图,内容我来编!图像转视频AI工具盘点
...张图,内容全靠编”。下面我们将为大家介绍五款图像转视频的AI工具。1LeiaPixLeiaPix可以将图像转变为有深度的动画视频,使动画具有纵深感,支持为图片添加运动方式、动态强弱和蒙版控制等功能效果。经实测,目前可实现的...……更多
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...内容也是完整流畅的。尽管由于成本问题该功能暂时不会开放,但百度仍旧展示了自己的独特优势:在文本生成的基础上,文心一言还能通过多元的内容创作满足市场需求。换句话说,伴随产品能力的进一步成熟,在未来,拥有...……更多
Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?
...y.ai发布了 Stable Diffusion 3 早期预览版。这款模型目前还没开放测试。排队链接:https://stability.ai/stablediffusion3本次更新重点:在图片质量、多主题提示(multi-subject prompts)和单词拼写能力方面有大幅提升;使用了……更多
...。北京时间2月16日凌晨,Open AI公司正式发布其首个文本-视频生成模型Sora。Sora文生视频功能强大,能够通过文本提示生成长达1分钟的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。同时,Sora还...……更多
腾讯云公布多项大模型产品进展
...成式AI生态计划聚焦做强生成式AI技术和平台底座,通过开放平台能力与服务、提供技术与市场支持的方式,在未来联合千家解决方案提供商,培育千家服务商和万家代理商,共同推动生成式AI技术深入产业全链条,加速产业智能...……更多
共赢生成式AI时代
...式输出;在同等智能级别,输出最快;在减少幻觉、应对困难开放型问题上,准确度是ClaudeAI2.1的两倍;更好的开箱即用体验,无需过多优化提示词,拒绝率更低。ClaudeAI3推出了三个模型High(最快)、Sona(性能与功能平衡)、Opus(最智能,适用最...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻...……更多
文心大模型4.0发布!李彦宏:相比GPT-4毫不逊色
...,迅速生成了一组广告海报、五条广告文案以及一条营销视频。据介绍,基于这一系列能力,百度已经推出了AIGC营销创意平台擎舵,让“一个人就成为一支AI营销队伍”。同时,他还通过解数学题、总结知识点等场景,展示了大...……更多
微软宣布:copilot将持续实现创新
...例如编写代码等。微软表示,该模型目前正在对部分用户开放测试,并将在未来几周内广泛集成到Copilot中。DALL-E3Copilot现在更新了DALL-E3模型,用户能够根据提示创建质量更高、更准确的图像。您可以通过访问bing.com/create或要求Co...……更多
更多关于科技的资讯:
微软谷歌等八巨头联合对抗NVIDIA:三星也想加入
快科技6月30日消息,前不久AMD、英特尔、谷歌、微软、博通、思科、Meta和惠普企业等八家科技巨头联合组建了UALink联盟
2024-06-30 16:41:00
售价89元 追风者推出伯乐Polar ST4-120散热器:4热管ARGB风冷
快科技6月30日消息,Phanteks(追风者)带来了新款散热产品:伯乐Polar ST4-120风冷散热器,售价为89元
2024-06-30 16:41:00
交流电流源的基本原理及应用
交流电流源作为电子工程领域中不可或缺的重要设备,其在电力系统、通信、科研实验等多个领域均有着广泛的应用。本文将详细介绍交流电流源的基本原理
2024-06-30 17:01:00
重庆永川:毕业典礼与专场双选会“双翼齐飞”
6月30日,位于永川区的重庆智能工程职业学院举办了2024届学生毕业典礼暨华为及生态企业专场招聘会。活动中,该校为欢迎即将离校的学子们“回家”
2024-06-30 17:37:00
可享终身免费充电等四大权益:昊铂GT/HT推出限时购车政策
昊铂品牌近期推出了针对旗下GT和HT车型的限时购车优惠政策。据悉,从6月28日至6月30日,消费者购买昊铂GT或HT车型将享有“终身用车无忧”的权益
2024-06-30 17:41:00
3D缓存全新设计!AMD Zen5锐龙9000X3D将完全开放超频
快科技6月30日消息,AMD Zen5架构的锐龙9000系列处理器预计7月31日解禁上市,而游戏玩家们更期待的3D缓存版9000X3D系列据说会在9月底登场
2024-06-30 18:11:00
东营联通率先开启宽带网络服务2000M新时代
记者 杨珣 通讯员 刘晓彬 孙成麟 李春升东营联通公司市场部总经理张春杰在致辞中表示,百年传承,三十向新。从拨号上网到FTTR突破1000M网速
2024-06-30 18:33:00
可回收的中国最大液体火箭!天兵三号热试车意外 直接飞出爆炸
6月30日,来自天兵科技的中国最大液体运载火箭,具备可回收复用能力的天龙三号,在河南巩义进行全系统热试车时发生意外,整个火箭居然直接飞了出去
2024-06-30 18:41:00
网友偶遇翘臀海星!派大星是你吗?
网友@marvmurderface在水族馆发现了一件有意思的事儿,那就是遇到了一只翘臀海星。它好像上半身张开双臂,下半身挤出了一个屁股
2024-06-30 18:41:00
69元 凌豹M5无线三模鼠标上市:原相PAW3311芯片 仅65克
快科技6月30日消息,凌豹M5无线三模鼠标目前已经上市,首发69元。凌豹M5鼠标采用了高性能的PAW3311芯片及BK3633主控芯片
2024-06-30 19:11:00
AMD Zen5威武!锐龙9000功耗、温度都更低了
快科技6月30日消息,AMD Zen5架构的锐龙9000系列处理器首发四款型号,作为旗舰的锐龙9 9950X还是12个核心
2024-06-30 19:41:00
商标的分类有45类,第1类至34类是商品类别,第35类至第45类别是服务类商标,商标分类每年都会修订一版,但是基本变化很小
2024-06-30 19:51:00
国产番茄收获机在乌鲁木齐实现量产
本文转自:人民日报客户端李亚楠6月30日,在新疆乌鲁木齐举办的第八届中国-亚欧博览会室外展区,一台涂装鲜亮橘红色的国产番茄收获机周围
2024-06-30 20:00:00
本文转自:人民网-江西频道6月28日,江西省抚州市东乡区残联开展残疾人智能手机操作培训,让残疾人更好的融入社会数字生活
2024-06-30 20:02:00
价格惊喜!微星星影15 Air评测:仅重1.9公斤的RTX 4060游戏本
一、前言:游戏本的性能 轻薄本的重量轻薄而又性能强大的笔记本,一直以来都是许多游戏玩家所追求的目标,但想要性能就,必然要搭配中高端独显和强力的散热
2024-06-30 20:41:00