西湖,生成,文本,突破,大学,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...是StabilityAI于今年6月推出的开源文本转音频模型，可免费生成长达47秒的样本和音效，还可生成44.1kHz高质量立体声音频，并且能在消费级GPU上运行。除了免费、开源，该模型还注重保护创作者版权，在数据训练中尽力避免伦理道...……更多

2024-07-25 09:22:00最新技术,火爆,模型,细节,音频,全球

三星目标今年将Galaxy AI推广到1亿台设备

...GalaxyAl是一种全面的移动人工智能体验，是“SamsungGauss”生成人工智能的具体表现，这是为GalaxyAI提供动力的端侧AI模型。由三星开发的设备端人工智能和行业领导者开放合作所支持的基于云的人工智能提供支持。值得一提的是，...……更多

2024-02-04 15:11:00三星,目标,推广,设备,三星,智能

腾讯游戏学堂2024最新成果发布，以技术创新、人才培养拓宽行

...果。其中，在科研创新层面，《基于AIGC的高质量PBR材质生成》联合项目被国际影响最广、规模最大、最权威的计算机图形学顶级学术会议SIGGRAPH 2024录用，并将发表在国际图形学顶级期刊 ACM Transactions on Graphics上。对比现有AI材质...……更多

2024-05-30 14:55:00成果发布,腾讯,人才培养,边界,技术创新,学堂

（文艺评论）敞现跨媒介文学研究的广度与深度—— 读《跨媒介文

...生着这样或那样的影响。如此，呈现文学文本多维度次第生成的历史进程，就有助于把握跨媒介文学发展的历史逻辑。因此，本书致力于呈现文学文本跨媒介的多维演进，不只是自身研究的内在需要，而且为后来人的继续研究提...……更多

2023-10-30 22:05:00媒介,文学,广度,深度,文艺,传播

安卓版Claude应用上线：打造值得信赖的AI助手，可总结内

7 月 17 日消息，Anthropic 公司于今年 5 月发布 iOS 版本之后，于今天发布了安卓版 Claude 应用，需要安卓 8.0 及更高版本以上设备才能运行。Claude 应用程序将免费提供给 Claude 人工智能模型的所有用户，包括免费用户、Claude Pro 用...……更多

2024-07-18 09:50:00安卓,生成,助手,文本,应用,内容

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...其最大的亮点之一。该模型可以接受文本和图像输入，并生成自然语言、代码等文本输出。在给定文本和图像输入的情况下，GPT-4o能够迅速捕捉关键信息，进行深度分析和总结，为用户提供全面、准确的解答。在图像理解方面...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

第九届全国电影学青年学者论坛兰大学子论文斩获金奖

...方向博士生杨鹏（导师为张进教授）的论文《作为诗性的生成机制：影像历史诗学转义修辞的内在肌理与价值取向》获得本届论坛金奖。本届论坛主题为“新时代中国电影理论体系建构”和“重回本体—电影美学与新技术挑战”...……更多

2023-01-06 02:50:00金奖,学子,学者,青年,论文,全国

爱尔眼科数字人“爱科(Eyecho) ”正式发布，支持视频、

...科技创新成果，爱尔数字人“爱科（Eyecho）”集合了当今生成式人工智能和计算机图形学领域目前最为前沿的技术——基于AIGC与神经渲染的高真实感数字人合成，通过神经渲染技术刻画高真实感数字人形象；基于检索增强技术RA...……更多

2024-10-26 22:43:00爱尔,模态,眼科,语音,文本,数字

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...也不容易，因为我们需要的是多模态数据，但LLM无法直接生成图像，DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起，直接生成但文生图模型实际上很难对图像细节做到细微精...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

“苹果智能”仅面向付费开发者，三大新模块炸裂出圈

...。此次推出的苹果智能仅有部分功能上线，主要围绕文本生成、Siri和相册等模块。不过，此次更新尚未集成ChatGPT功能，苹果称该功能以及更多更新将在明年正式上线。苹果基础大模型团队负责人RuomingPang强调，这些基础模型“...……更多

2024-07-31 23:28:00开发者,模块,苹果,三大,智能,开发

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

...上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5，成为世界首个支持多主体一致性的多模态模型！上传小哥、机甲、街景，接下来，就是见证奇迹的时刻。...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

Sora是如何实现1分钟一镜到底？

...其真正实力开发出热门聊天机器人ChatGPT后，OpenAI继续在生成式人工智能上玩出新花样。2月16日，OpenAI推出新的AI大模型Sora，该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。Sora一推出立即引发...……更多

2024-02-21 01:42:00视频,生成,文生,记者,扬子,模型

记者实测|速度更快成本更低，人机交互更自然，OpenAI新模

...制不同。GPT-3.5和GPT-4会先将音频转换为文本，再接收文本生成文本，最后将文本转换为音频，经历这三个过程，音频中的情感表达等信息会被折损，而GPT-4o是跨文本、视觉和音频的端到端模型，是OpenAI第一个综合了这些维度的模...……更多

2024-05-14 14:39:00实测,人机,更快,模型,成本,速度

微软又给谷歌「双重暴击」或将加入word、ppt和excel

...nAI的人工智能，这样，用户通过简单的提示，就可以自动生成文本。想象一下，在你需要请假时，只要随手打出「写一封请病假的邮件」几个字，Outlook就能秒秒钟把措辞正式的请假申请写好，直接点击发送即可。虽然想得很美...……更多

2023-01-12 21:25:00微软,微软,模型,合进,邮件,电子邮件

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...处理由区域同自由格式文本混合而成的输入，并可以无缝生成每个可定位对象的坐标和文本，由此在输出中定位所提及的对象。假设已经给定提取得出的图像特征图 Z ∈ R H×W×C 和二值化区域掩模 M，团队首先在 M 内随机采样 N ...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

大模型为建立通用人工智能理论提供可能性

...需要机器人，也就是具身智能。·全世界对大模型强大的生成能力、迁移能力、交互能力感到惊讶却无法解释，只能归结为“涌现”。为了人工智能产业的健康发展，必须将科学研究、技术创新、产业发展结合起来。要发展第三...……更多

2024-03-21 09:57:00人工智能,人工,可能性,模型,理论,智能

$多个中国团队斩获EMNLP\\\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者

...语言，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑后处理图像，cap-retrieve 利用编辑后的字幕检索图像，还创建了概念和应用两部分评估数据集。结果...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

审稿人或难识别AI撰写的论文摘要

...根据用户提示创建逼真文本，它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具，并供用户免费使用。自发布以来，研究人员一直在努力解决相关伦理道德问题，因为它大部分输...……更多

2023-01-17 02:46:00审稿人,摘要,论文,摘要,研究,生成

Sora概念引爆A股！谁在布局AI视频

...结合Sora等通用大模型丰富自身视频素材库以及提升视频生成效率和品质。因赛集团曾表示，在技术方面，公司推出的InsightGPT将持续迭代和升级，不断提升大模型生成的能力和跨模态之间信息互通的精准度，丰富并完善更多功能...……更多

2024-02-19 20:50:00布局,概念,视频,文生,视频,万兴

2023开年热词「大模型」「出海」，现在怎么样了？

...场华为与讯飞星火大模型广告牌多模态成竞争红海文本生成或为全民刚需由ChatGPT掀起的国内大模型之战，已经从文本生成蔓延到文生图、语音处理、视频处理、代码处理，并在办公、学习、医疗、零售、金融、制造等多领域应...……更多

2023-12-20 12:16:00开年,模型,讯飞,模型,同传,生成

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...套完整的高质量数据合成流程，主要包括四个步骤：指令生成、指令进化、回答生成和回答过滤。在指令生成阶段，混元团队使用高质量的数据源作为种子，覆盖多个领域和不同复杂度，确保指令的多样性和全面性。接下来是指...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

引领消费金融数智化时代招联发布行业首个开源金融大模型“招联

...国落幕。招联与中科大完成的“3D动作表示学习”“扩散生成图像检测”2篇论文在该顶会发表。其中，团队针对深度伪造技术首创的“DIRE”模型，达到SOTA（该项研究任务中最先进）水平，得到国际级平台的官方认可。该项研究...……更多

2023-11-06 19:17:00智化,金融,模型,消费,时代,行业

Sora技术报告揭秘6大核心优势，AGI或在1年内实现？

◎当地时间2月15日，OpenAI发布了最新的视频生成模型Sora。出色的视频制作能力瞬间“点燃”科技圈。英伟达人工智能研究院首席研究科学家JimFan直言，这是视频生成领域的GPT-3时刻。360集团创始人、董事长周鸿祎则称，随着Sora...……更多

2024-02-17 21:03:00核心,优势,报告,技术,日本,视频

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...项模型更新，同时发布了GPT-4 Turbo预览模型，提升了代码生成能力。Google发布文本生成视频模型Lumiere，生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量，组建新的GenAI团队研发小模型，减少对OpenAI...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

首发根据音频生成 4K 分辨率 1 小时长视频，复旦、百度联

...度联合开发了一款名为 Hallo2的全新 AI 模型，该模型可以生成长达数小时的 4K 分辨率人物动画，现已在 GitHub 发布开源。Hallo2 模型建立在 latent diffusion models 的基础上，相比上一代 Hallo 模型的效果更好，支持了长视频生成，通过...……更多

2024-10-22 09:49:00复旦,生成,分辨率,音频,小时,视频