• 我的订阅
  • 头条热搜
火爆全球的AI音频大模型,最新技术细节揭秘
...月19日在Arxiv上分享了Stable Audio Open的研究论文,公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费...……更多
字节跳动推出颠覆性视频模型
...视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。而且与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。对此,字节跳动相关人士回应称,Boximator是视频生成领...……更多
字节跳动旗下AI助手豆包推出视频生成内测,可将信息转化为视频内容
字节跳动旗下大模型AI助手豆包正式推出视频生成内测,意味着继快手、商汤、Minimax等公司后,字节跳动正式杀入AI视频生成领域。豆包官网称,豆包视频生成,支持图片文字一键成片,“能将信息转化为生动逼真的视频内容。...……更多
...网近日,美国人工智能研究公司OpenAI推出了一款视频生成模型“Sora”。OpenAI的官网介绍称,使用这款模型可以用文本生成长达一分钟的视频,视频可具有多个角色、特定类型的运动、精确主题和背景细节等复杂场景。该公司称...……更多
新闻传播业的生成式人工智能应用及其风险应对
...程序ChatGPT、人工智能图片生成平台Midjourney和文生视频大模型Sora等生成式人工智能出现,掀起内容生产和信息消费热潮。生成式人工智能的数据训练、程序设计和生成结果应用等环节,也可能产生“被制造的风险”(manufactured ri...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
初创公司Odyssey推出AI工具Explorer:文本、图像可秒变3D场景
...pMind、World Labs 和以色列初创公司 Decart 近期演示的“世界模型”类似,只需输入“拥有茂密绿色植物的日式花园”等描述,Explorer 便可生成可交互的实时场景。Odyssey 声称,其工具尤其擅长创建逼真的场景,这主要归功于其独特...……更多
华为新专利可保护大模型版权 【华为新专利可保护大模型版权】财联社11月8日电,天眼查App显示,11月7日,华为技术有限公司申请的“一种语言模型保护方法、装置及计算设备集群”专利公布。摘要显示,该方法包括:获取用...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...搜索引擎,也未推出GPT-4.5或GPT-5,而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。此前OpenAI公司CEO奥尔特曼(Sam Altman)就已经否认了公司将会发布GPT-5,他表示新版GPT非常“神奇”。...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式...……更多
麻省理工学院联合metaai开发streamingllm框架
...研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。▲图源GitHubStreamingLLM的研究重点,是想解决实现流式语言模型(...……更多
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...服务已备案信息》,截止至今年 3 月,我国已有 117 家大模型成功备案。除了部分面向 B 端的行业大模型之外,过去一年,不少通用大模型已经开始面向 C 端提供服务,诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆...……更多
AI能让长视频行业重拾信心?
...察到,在几大长视频巨头之中,在公开场合提倡AIGC和大模型等新技术在影视工业的落地相对积极的是爱奇艺。去年底,在钛媒体2023T-EDGE全球创新大会上,爱奇艺副总裁孙斌就分享称,在爱奇艺内部,生成式AI辅助人工阅读,将3-...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...18日,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿...……更多
Jina AI 推出全球首个开源 8K 文本嵌入模型
...消息,JinaAI在其官网发布新闻稿,宣布推出jina-embeddings-v2模型,号称是目前是唯一支持8K(8192个token)上下文长度的开源产品,在功能和性能上与OpenAI的text-embedding-ada-002类似。在大规模文本嵌入基准(MTEB)排行榜方面,IT之家发现……更多
stability邀请用户测试文本到图像生成模型
...lityAI近日更新其产品页面,邀请用户测试文本到图像生成模型StableDiffusion3。官方表示新版本大幅提高了处理复杂提示词、生成更高质量的图像和纠正拼写错误方面的能力。StableDiffusion3目前并未公开测试,不过已经启动了早期预...……更多
马斯克说人类愿赌服输!OpenAI首个文生视频模型炸街,哪些行业又将颠覆
...锏。当地时间2月15日,OpenAI宣布,正在研发“文生视频”模型Sora,可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色,也可以根据静态图像制作动画。根据OpenAI官网,Sora能...……更多
失意职场人 迷上了烧钱做短视频
...。AI视频作为内容形态的“新物种”,来势汹汹。各家大模型厂商和互联网大厂纷纷发力AI视频生成。今年8月,昆仑万维昆仑万维推出AI短剧平台SkyReels。9月,字节跳动发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模...……更多
小米小爱音箱宣布推送大模型小爱:支持文本创作 更聪明了
快科技8月30日消息,今日,小米澎湃OS宣布大模型小爱已在小米小爱音箱上正式推送。据了解,小米Sound Pro、小米Sound Move、小米Sound、小米小爱音箱Art电池版、小米小爱音箱Art、小米小爱音箱Pro、小米小爱音箱、小米AI音箱(第二...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
11月20日消息,最新的Qwen2.5-Turbo已在阿里云百炼上线,该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字,在多个长文本评测集上的性能表现超越GPT-4。即日起,所有用户可在阿里云百炼调用Qwen2.5-TurboAPI,百万tok...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
STAR团队 投稿自 凹非寺量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
用AI识别AI:西湖大学一项研究可高效检测AI生成文本
...假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利,但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本...……更多
智谱AI视频大模型上线排队30秒生成6秒视频 记者现场实测
Sora引爆公众对大模型生成视频能力的期待后,国内企业也纷纷开启了文生视频领域的探索,继短视频企业快手推出视频模型可灵之后,专注于大语言模型的智谱AI也官宣进军视频模型领域。7月26日,智谱AI CEO张鹏在智谱Open Day上...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...LightRAG在检索准确性和响应多样性方面均优于现有的基线模型,并且在资源消耗和动态环境适应性方面表现更优,使其在实际应用中更为有效和经济。随着大语言模型(LLM)自身能力的日趋完善,很多学者的目光聚焦于如何帮助...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
文|王怡宁编辑|邓咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要...……更多
更多关于科技的资讯:
一大波RTX 50游戏本集体登场!多了个“Ti”
快科技1月7日消息,RTX 50系列终于登场了,不过大家的关注普遍都在桌面卡上,其实用于移动版RTX 50系列也同步更新了
2025-01-08 02:48:00
仅迷你机大小!NVIDIA发布全球最小AI超级计算机:联发科参与
快科技1月7日消息,除了万众焦点的RTX 50系列桌面和笔记本显卡,NVIDIA还带来了一款特殊的整机产品,代号“Project DIGITS”的新一代个人AI超级计算机
2025-01-08 03:18:00
本文转自:人民日报海外版《人民日报海外版》(2025年01月08日第 10 版)随着人工智能、大数据、云计算等技术的快速发展
2025-01-08 05:20:00
新型产业学院打造本土人才库
本文转自:人民日报海外版本报记者 周姝芸《人民日报海外版》(2025年01月08日第 10 版)杭海龙渡湖国际时尚产业学院学生在岗位工作室设计作品
2025-01-08 05:25:00
本文转自:人民日报喻思南《人民日报》(2025年01月08日第 05 版)我国市场容量大,一旦新材料赢得市场认可,就可以获得广泛应用和广阔销路
2025-01-08 06:03:00
本文转自:人民日报《人民日报》(2025年01月08日第 04 版)新华社北京1月7日电 (记者张晓洁、张辛欣)工业和信息化部7日发布关于开展万兆光网试点工作的通知
2025-01-08 06:05:00
鹿每年都要耗尽资源长角 为何用一次就脱落
这是一头驼鹿努力脱落鹿角的样子!您可能好奇,好不容易长这么大的鹿角为什么要脱落?鹿角其实是自然界最独特的动物角。对于其它动物而言
2025-01-08 06:48:00
联想ThinkPad X9发布:重量、续航超越MacBook Air
快科技1月8日消息,在CES2025上,联想发布了全新的高端商务笔记本——ThinkPad X9 Aura系列,包括14英寸与15英寸
2025-01-08 07:18:00
370家餐厅、57种菜系入选2025黑珍珠餐厅指南杭州日报讯 1月6日,聚拢了中国高品质标杆餐饮品牌的“黑珍珠餐厅指南”(以下简称“黑珍珠”)第8年发布榜单
2025-01-08 07:07:00
98%全球最高屏占比PC!联想发布YOGA Air X AI元启版:首发屏下摄像头
快科技1月8日消息,在国际消费电子展(CES 2025)上,联想发布了最新一代的高端轻薄本产品——YOGA Air X AI元启版
2025-01-08 07:18:00
本文转自:环球时报近日,某短视频平台发布公告,表示要推动算法和平台治理透明化,引发网民热议。其中,有人指出,该平台上称“钱”为“米”
2025-01-08 06:52:00
保时捷女销冠回应连续2年卖出170台:数据真实 我一天最多卖出4台
快科技1月8日消息,近日,2023年卖170台保时捷的女销冠再次晒出自己的2024年战绩,称在2024年12月31日下午完成最后一台签订完成170台
2025-01-08 07:18:00
搭载RTX 5090显卡 联想新一代游戏本亮相:性能爆炸
快科技1月8日消息,在CES2025盛会上,联想全新推出搭载英伟达RTX 5090显卡的游戏本——Legion Pro 7i
2025-01-08 07:18:00
杭州日报讯 日前,“中国视谷”重大产业项目签约仪式上,云豹智能AI网络研发中心总部项目正式落户“中国视谷”窗口园区。令人瞩目的是
2025-01-08 07:06:00
小米手机冲至国内第二 雷军:小米15和REDMI K80太畅销
快科技1月8日消息,根据权威市场调研机构的最新数据,2024年第四季度小米新机激活量达到了1243.22万台,市场份额为17
2025-01-08 07:18:00