• 我的订阅
  • 头条热搜
火爆全球的AI音频大模型,最新技术细节揭秘
...是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费级GPU上运行。除了免费、开源,该模型还注重保护创作者版权,在数据训练中尽力避免伦理道...……更多
三星目标今年将Galaxy AI推广到1亿台设备
...GalaxyAl是一种全面的移动人工智能体验,是“SamsungGauss”生成人工智能的具体表现,这是为GalaxyAI提供动力的端侧AI模型。由三星开发的设备端人工智能和行业领导者开放合作所支持的基于云的人工智能提供支持。值得一提的是,...……更多
腾讯游戏学堂2024最新成果发布,以技术创新、人才培养拓宽行业边界
...果。其中,在科研创新层面,《基于AIGC的高质量PBR材质生成》联合项目被国际影响最广、规模最大、最权威的计算机图形学顶级学术会议SIGGRAPH 2024录用,并将发表在国际图形学顶级期刊 ACM Transactions on Graphics上。对比现有AI材质...……更多
(文艺评论)敞现跨媒介文学研究的广度与深度—— 读《跨媒介文学演变及其生产与传播》的思考
...生着这样或那样的影响。如此,呈现文学文本多维度次第生成的历史进程,就有助于把握跨媒介文学发展的历史逻辑。因此,本书致力于呈现文学文本跨媒介的多维演进,不只是自身研究的内在需要,而且为后来人的继续研究提...……更多
安卓版Claude应用上线:打造值得信赖的AI助手,可总结内容、生成文本等
7 月 17 日消息,Anthropic 公司于今年 5 月发布 iOS 版本之后,于今天发布了安卓版 Claude 应用,需要安卓 8.0 及更高版本以上设备才能运行。Claude 应用程序将免费提供给 Claude 人工智能模型的所有用户,包括免费用户、Claude Pro 用...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...其最大的亮点之一。该模型可以接受文本和图像输入,并生成自然语言、代码等文本输出。在给定文本和图像输入的情况下,GPT-4o能够迅速捕捉关键信息,进行深度分析和总结,为用户提供全面、准确的解答。 在图像理解方面...……更多
...方向博士生杨鹏(导师为张进教授)的论文《作为诗性的生成机制:影像历史诗学转义修辞的内在肌理与价值取向》获得本届论坛金奖。本届论坛主题为“新时代中国电影理论体系建构”和“重回本体—电影美学与新技术挑战”...……更多
...科技创新成果,爱尔数字人“爱科(Eyecho)”集合了当今生成式人工智能和计算机图形学领域目前最为前沿的技术——基于AIGC与神经渲染的高真实感数字人合成,通过神经渲染技术刻画高真实感数字人形象;基于检索增强技术RA...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...。此次推出的苹果智能仅有部分功能上线,主要围绕文本生成、Siri和相册等模块。不过,此次更新尚未集成ChatGPT功能,苹果称该功能以及更多更新将在明年正式上线。苹果基础大模型团队负责人RuomingPang强调,这些基础模型“...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!上传小哥、机甲、街景,接下来,就是见证奇迹的时刻。...……更多
Sora是如何实现1分钟一镜到底?
...其真正实力开发出热门聊天机器人ChatGPT后,OpenAI继续在生成式人工智能上玩出新花样。2月16日,OpenAI推出新的AI大模型Sora,该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。Sora一推出立即引发...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...制不同。GPT-3.5和GPT-4会先将音频转换为文本,再接收文本生成文本,最后将文本转换为音频,经历这三个过程,音频中的情感表达等信息会被折损,而GPT-4o是跨文本、视觉和音频的端到端模型,是OpenAI第一个综合了这些维度的模...……更多
微软又给谷歌「双重暴击」或将加入word、ppt和excel
...nAI的人工智能,这样,用户通过简单的提示,就可以自动生成文本。想象一下,在你需要请假时,只要随手打出「写一封请病假的邮件」几个字,Outlook就能秒秒钟把措辞正式的请假申请写好,直接点击发送即可。虽然想得很美...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...处理由区域同自由格式文本混合而成的输入,并可以无缝生成每个可定位对象的坐标和文本,由此在输出中定位所提及的对象。假设已经给定提取得出的图像特征图 Z ∈ R H×W×C 和二值化区域掩模 M,团队首先在 M 内随机采样 N ...……更多
...需要机器人,也就是具身智能。·全世界对大模型强大的生成能力、迁移能力、交互能力感到惊讶却无法解释,只能归结为“涌现”。为了人工智能产业的健康发展,必须将科学研究、技术创新、产业发展结合起来。要发展第三...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...语言,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑后处理图像,cap-retrieve 利用编辑后的字幕检索图像,还创建了概念和应用两部分评估数据集。 结果...……更多
...根据用户提示创建逼真文本,它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具,并供用户免费使用。自发布以来,研究人员一直在努力解决相关伦理道德问题,因为它大部分输...……更多
Sora概念引爆A股!谁在布局AI视频
...结合Sora等通用大模型丰富自身视频素材库以及提升视频生成效率和品质。因赛集团曾表示,在技术方面,公司推出的InsightGPT将持续迭代和升级,不断提升大模型生成的能力和跨模态之间信息互通的精准度,丰富并完善更多功能...……更多
2023开年热词「大模型」「出海」,现在怎么样了?
...场 华为与讯飞星火大模型广告牌多模态成竞争红海文本生成或为全民刚需由ChatGPT掀起的国内大模型之战,已经从文本生成蔓延到文生图、语音处理、视频处理、代码处理,并在办公、学习、医疗、零售、金融、制造等多领域应...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...套完整的高质量数据合成流程,主要包括四个步骤:指令生成、指令进化、回答生成和回答过滤。在指令生成阶段,混元团队使用高质量的数据源作为种子,覆盖多个领域和不同复杂度,确保指令的多样性和全面性。接下来是指...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
...国落幕。招联与中科大完成的“3D动作表示学习”“扩散生成图像检测”2篇论文在该顶会发表。其中,团队针对深度伪造技术首创的“DIRE”模型,达到SOTA(该项研究任务中最先进)水平,得到国际级平台的官方认可。该项研究...……更多
Sora技术报告揭秘6大核心优势,AGI或在1年内实现?
◎当地时间2月15日,OpenAI发布了最新的视频生成模型Sora。出色的视频制作能力瞬间“点燃”科技圈。英伟达人工智能研究院首席研究科学家JimFan直言,这是视频生成领域的GPT-3时刻。360集团创始人、董事长周鸿祎则称,随着Sora...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI...……更多
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造
...度联合开发了一款名为 Hallo2的全新 AI 模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过...……更多
MWC联发科展台速览:端侧AI和移动通信黑科技有突破
...题的展厅,吸引了众多行业专家和媒体关注。特别是现场生成式AI技术演示,令众多与会者纷纷争相体验。 实时AI视频生成展示人气爆棚来到展会现场,今年联发科不仅重点展出了很多端侧生成式AI技术的创新应用,包括SDXLTurbo...……更多
微软发布ai声音生成工具vall-e
...00小时英语语音数据的训练,并使用特定语音的3秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。康奈尔大学的一篇论文使用VALL-E合成了几种...……更多
资深专家也无法准确分辨出 ChatGPT 撰写的科学论文
...”,一种基于神经网络的系统,通过消化大量现有的人类生成的文本来学习执行任务。位于加利福尼亚州旧金山的软件公司OpenAI于11月30日发布了该工具,并且可以免费使用。由伊利诺伊州芝加哥市西北大学的CatherineGao领导的小...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...做到接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。如今,智谱清言的「情感语音通话」又一次推动了国产 AI 对标国际先进水平。情感语音模型 GLM-4-Voice 上线即开源自从去年的 GPT-4...……更多
通过深度合成服务算法备案,九方智投乘风破浪,智能投顾正当其时
...的定义。深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。为防止深度合成技术滥用,《规定》中第十九条明确规定,具有舆论属性或者社会动员能力的...……更多
更多关于科技的资讯:
打通淘宝!钉钉上线“小礼物”功能:将在大年初一全量开放
快科技1月27日消息,钉钉悄然上线了“小礼物”功能,并打通淘宝,可为用户提供丰富的送礼选择。目前,钉钉“小礼物”正逐步灰度中
2025-01-27 12:36:00
中美为AI拼了!美国拿出5000亿美元 中国砸1万亿元
快科技1月27日消息,近日,中国银行发布《支持人工智能产业链发展行动方案》,宣布将在未来五年内,为AI全产业链提供不低于1万亿元的专项金融支持
2025-01-27 12:36:00
京东方将进军半导体!计划2026年量产CPU玻璃基板
快科技1月27日消息,据TomsHardware报道,国内显示技术巨头京东方将进军半导体领域,计划开发用于CPU的玻璃基板
2025-01-27 12:36:00
Linux也变屎山!内核代码突破4000万行 10年膨胀一倍
快科技1月27日消息,今年初,Linux 1.3版内核正式发布,代码数量达到39819522行,而最新的Linux 6
2025-01-27 12:36:00
新能源汽车遇到寒潮、雨雪怎么办!为了家人 一定要看
1月23日中央气象台发布寒潮蓝色预警,这是今年来首个寒潮预警。这几天,寒潮天气过程持续影响我国,许多地方都出现了大幅降温
2025-01-27 12:36:00
苹果AI功能遇冷:三成iPhone用户拒绝升级iOS 18
快科技1月27日消息,苹果推出iOS 18系统,新增“Apple Intelligence”等AI功能,但用户升级热情低于预期
2025-01-27 12:36:00
济南以旧换新补贴活动全攻略,你想要的全都有!
齐鲁晚报·齐鲁壹点 李梦瑶近日,济南市密集发布消费品以旧换新补贴活动公告,政策有点多没看明白怎么办?记者为大家进行了系统梳理总结
2025-01-27 12:37:00
多项惠民政策汇聚黔西南 充分激发市场活力
多彩贵州网讯(本网记者 秦丽)1月27日,记者从2025年“多彩贵州欢乐购·新春聚惠黔西南”促消费政策新闻发布会上获悉
2025-01-27 12:48:00
1月22日,全国铁路发送旅客1332.2万人次,春运启动以来累计发送旅客1.12亿人次。随着春运高峰期的到来,购票难度增加
2025-01-27 12:51:00
国家统计局近日公布的2024年国民经济运行数据显示,2024年全国社会消费品零售总额48.7895万亿元,比上年增长3
2025-01-27 13:13:00
自驾回老家过年:余承东直播突然被封!
快科技1月27日消息,余承东昨天预告称,今年将会开享界S9自驾回安徽老家过年,接两位朋友史小诺和说车的小宇在路上聊聊天
2025-01-27 13:36:00
中国消费者报福州讯(记者张文章)春节期间,许多消费者会升级换新自己的数码装备,如购买手机、平板、笔记本电脑等。为保护消费者合法权益
2025-01-27 13:45:00
1月27日,京东集团向内部全员发布了2025年新春贺信。在迎来第一个非遗版春节的时候,京东向奋战在全球各地工作岗位上的京东人致以新春的祝愿
2025-01-27 13:57:00
让美国硅谷恐慌!中国工程院院士揭秘:DeepSeek究竟厉害在哪里
快科技1月17日消息,在AI领域,DeepSeek带来的影响力,一点也不亚于“六代机”。那么,DeepSeek究竟厉害在哪里
2025-01-27 14:06:00
索泰RTX 5090D SOLID OC显卡评测:DLSS 4加持 无敌就是这么寂寞
一、前言:全新一代旗舰游戏显卡 游戏性能一刀未砍NVIDIA全新的RTX 50系显卡赶在年前正式发布了,虽然最顶尖的5090显卡我们无缘相见
2025-01-27 14:06:00