生成,模型,图像,文本,测试,用户头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...循指令方面的能力有关。如果模型无法准确地遵循指令，生成CoT解释就会变得更加困难。此外，有些模型无法保持正确的回复格式，即存在所谓的「简化回复格式」问题。 ……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

比Stable Diffusion便宜118倍！1890美元

...。另外，微调还可以减轻由于使用mask而产生的任何不良生成伪影。MoE和分层扩展MoE能够增加模型的参数和表达能力，而不会显著增加训练成本。作者使用基于专家选择路由的简化MoE层，每个专家确定路由到它的token，而不需要...……更多

2024-08-13 09:42:00文生,高质量,模型,参数,模型,训练

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...出的Sana架构，得益于核心架构创新，具备了惊人的图像生成速度，而且最高能实现4k分辨率。一台16GB的4090笔记本，仅需0.37秒，直接吐出1024×1024像素图片。如此神速AI生图工具，竟是出自英伟达MIT清华全华人团队之笔！正如其名...……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

谷歌史上最强大模型！Gemini 2.0正式发布

...现出色。这些技术的创新使得Gemini 2.0能够更好地理解和生成自然语言，增强了人机交互的智能性。即日起，开发人员便可在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用，而且该版本也已经在网页版中为Gemini Advanced开放试...……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

潍坊七夕相亲季开幕在即，壹点相亲数字交互产品全新上线

...、高鼻梁、长相温文尔雅……”仅需三步就可以让AI帮你生成你心目中“理想型”。您可以根据页面提示，选择理想型的五官、发型、脸型等基本特征，在补充栏内详细描述你对理想另一半的要求，AI将智能生成一位符合您要求...……更多

2024-08-09 19:02:00潍坊,全新,数字,产品,齐鲁,理想

一句话搞定UI设计！Figma开卷AI，人人都成「设计大神」

...晰的图片能有效增强视觉效果。因此，Figma推出了AI内容生成工具，帮助用户在设计中快速填充相关的逼真视觉内容。通过加入与实物一样鲜明生动的画面，形成更具吸引力和说服力的视觉效果，有效传达设计理念。此外，Figma还...……更多

2024-07-01 09:20:00设计,大神,一句话,人人,设计,功能

3秒让AI生成风险减少30%！复旦新研究拿下扩散模型概念移除

...模型变“乖”，现在仅需3秒调整模型参数。效果be like：生成的风险图片比以往最佳方法减少30%！像这样，在充分移除梵高绘画风格的同时，对非目标艺术风格几乎没有影响。在移除裸露内容上，效果达到“只穿衣服，不改结构...……更多

2024-08-26 09:54:00复旦,生成,模型,概念,风险,研究

又一生成式AI助手将“登机”！谷歌发布多模态Bard助理，交

...Bard助理（Assistant with Bard）”，将手机的个人助手功能与生成式AI相结合，用户可通过文本、语音或图像与Bard助理互动——换言之，其具备多模态功能。例如，当用户询问“本周我错过了哪些重要邮件”时，Bard助理会列出各项要...……更多

2023-10-07 16:38:00模态,交互式,助理,助手,一生,时代

我的AI理想型！壹点相亲数字交互产品全新上线，给您脱单新体验

2024-08-09 09:00:00理想,全新,体验,数字,产品,理想

推动终端侧AI发展 MWC2024高通带来多项全球首发

...AIHub为开发者提供全面优化的AI模型库，包括传统AI模型和生成式AI模型，能够支持在骁龙和高通平台上进行部署。在使用高通AIHub时，开发者可以选择所需的大模型，例如Baichuan-7B，然后可以选择开发应用所使用的框架，例如例...……更多

2024-02-29 10:14:00高通,终端,发展,全球,高通,模型

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主

...图标描述模型以及光学字符识别（OCR）模块的输出，可以生成用户界面的结构化表示，类似于文档对象模型（DOM），以及一个叠加潜在可交互元素边界框的屏幕截图。可交互区域检测（Interactable Region Detection）从用户界面屏幕中...……更多

2024-10-28 09:51:00贾维斯,贾维,时代,电脑,模型,图标

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...括Micro、Lite、Pro、Premier四个版本的语言模型，还有图像生成模型Canvas、视频生成模型Reel。其中Reel现支持生成6秒视频，很快将会延长到2分钟。亚马逊总裁兼CEO安迪·贾西现场剧透：明年，AWS不仅将发布语音转语音模型，还有更...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

【新智元导读】Meta版Sora，就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频，还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文，模型架构、训练细节一并公开，干货满满！毫无...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

昆仑万维2024年前三季度营收38.3亿，以大模型技术驱动多

...用实现多样化功能创新，并逐步在全球落地。图为天工AI生成AGI与AIGC业务方面，首先，天工AI智能助手持续迭代更新，在网页端率先推出三大全新功能：高级搜索模式、彩页和宝典。天工AI智能助手-高级搜索模式(网页端) 2023年8...……更多

2024-10-29 22:14:00万维,昆仑,模型,年前,驱动,应用

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像

...量子位 | 公众号 QbitAI超越扩散模型！自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像，超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多

2024-06-27 09:17:00范式,仅需,高质量,生成,模型,图像

苹果ios18.1中文版将于明年发布

...清理”工具，可从照片中删除不需要的人或物体，并使用生成式AI填充背景；可以在照片应用中通过输入描述来创建回忆影片；电话录音和转录；新的专注模式“减少干扰”仅显示重要通知；在Safari应用程序中使用阅读器模式时...……更多

2024-09-15 04:27:00中文,将于,中文版,苹果,功能,应用

OpenAI宣布DALL-E 3模型向免费用户开放，但每天只

...，OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。IT之家注：DALL-E 3 于去年 9 月推出，起初只面向 ChatGPT Plus 付费订阅用户提供。用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令，但经过实测，这项功...……更多

2024-08-10 09:43:00生成,模型,开放,用户,图片,生成

马斯克评OpenAI首个视频生成模型：人类认赌服输

OpenAI周四发布了首个视频生成模型Sora，并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频，并评论称：“OpenAI今天宣布了Sora，它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多

2024-02-16 22:16:00马斯,马斯克,生成,模型,人类,视频

语音能力再突破！讯飞星火语音大模型即将发布

...于去年8月15日如期迎来V2.0版本，对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度升级，其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日，在第六届世...……更多

2024-01-29 15:57:00音大,讯飞,星火,语音,模型,突破

Hailo获1.2亿美元新融资，首发AI加速器Hailo-1

...速器,以出色的低功耗性能处理大型语言模型(LLM),成功将生成式人工智能技术引入边缘计算领域,为行业发展注入新动力。边缘人工智能处理器的领先芯片制造商Hailo近日宣布C轮融资再获1.2亿美元投资。与此同时,Hailo还推出创新型H...……更多

2024-04-03 11:36:00人工智能,加速器,融资,人工,生成,边缘

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...语言，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑后处理图像，cap-retrieve 利用编辑后的字幕检索图像，还创建了概念和应用两部分评估数据集。结果...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

Meta推出AI新模型VFusion3D，微美全息布局AIG

...，Meta（META.US）和牛津大学的研究人员开发了一种新的3D生成式AI模型VFusion3D，能够从单张图像或文本描述生成高质量的3D对象，可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉，VFusion3D界面简单直观，允...……更多

2024-08-21 13:55:00全息,布局,模型,升级,产业,内容

新闻传播业的生成式人工智能应用及其风险应对

...伪造滥用，探究“AI治理AI”新模式，坚持人本主义，是生成式人工智能风险治理的关键。人工智能的创新应用形塑社会互动模式。在信息传播、医疗、交通、教育等场景中，人工智能成为社会互动的代理，促使人与人的互动越...……更多

2024-06-13 10:23:00传播业,人工智能,人工,生成,风险,传播

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...了 LoCoVQA，一种带有干扰项的长上下文视觉问答 (VQA) 基准生成器。LoCoVQA可以提供与问题相关的图像序列，以及一组可配置的视觉干扰项，从而准确评估VLM如何在杂乱的上下文中仅提取与查询相关的信息。从原理上讲，这也是一...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

Sora刷屏标贝科技AI配音为音视频内容创作插上翅膀

...一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型， Sora能够根据文本指令创造出既逼真又富有想象力的场景，生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI 官网展示的众多案例我们可...……更多

2024-02-29 12:00:00音视,配音,翅膀,创作,内容,科技

Adobe将Firefly引入Vision Pro头显

...ITBEAR科技资讯】2月3日消息，Adobe公司近日宣布，其主流生成式人工智能应用程序Firefly将正式登陆VisionPro头显平台，并在2024年3月1日前提供免费使用服务。这一举措被视为Adobe在创意生成人工智能领域的又一重要布局。据ITBEAR科...……更多

2024-02-03 14:48:00生成,用户,创意,应用程序,应用,功能

协同办公进入AI时代金山办公张宁：不追求最强AI大模型，合

...成为金山办公布局海外业务的新节点。“今天我们来到了生成式 AI 的时代。”近日，金山办公全球业务副总经理张宁在接受记者采访，谈到协同办公软件发展时认为，移动互联网时代让我们看到了应用软件的百花齐放，如今，...……更多

2024-06-25 09:44:00张宁,办公,金山,模型,时代,模型

中国首个音乐SOTA模型「天工音乐大模型」今日公测

...技术领域取得突破，带来产业全面变革。然而，在AI音乐生成领域，全球迟迟等不到一款产品，开启「音乐ChatGPT时刻」。这是因为一直以来，AI音乐行业大量研究都集中在符号音乐生成技术路线上，并且大多只能实现无人声背景...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

OpenAI劲敌来了！这款大模型多项测试超越GPT-4o，号

...差别、幽默和复杂指令方面的表现有显著的提升，并能在生成内容时使用更自然的语气。在内部代理编码评估中，3.5 Sonnet解决了64%的问题，而Opus此前的成绩是38%。3.5 Sonnet超越前代Opus。来源：Anthropic此外，Claude 3.5 Sonnet模型具备...……更多

2024-06-21 12:43:00劲敌,模型,智能,测试,模型,前代