• 我的订阅
  • 头条热搜
谷歌史上最强大模型!Gemini 2.0正式发布
...深度学习算法,提升了神经网络的结构和效率,特别是在自然语言处理(NLP)领域表现出色。这些技术的创新使得Gemini 2.0能够更好地理解和生成自然语言,增强了人机交互的智能性。即日起,开发人员便可在AI Studio和Vertex AI中...……更多
...国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...多个细粒度原则进行标注,提供复杂精细化偏好标注。 自然语言语言反馈:提供细粒度批评和润色反馈,可利用此自然语言反馈开发算法及提升模型性能 跨模态 QA 对:输入输出包含混合模态,在不同模态之间实现更丰富的交...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...正在火山口跳动冒出。这段 10 秒的视频是豆包视频生成模型基于以上提示词想象创造的。可以说这段视频的拟真度非常高,并且有着娴熟的运镜,足以放入任何影视作品中。有着剪映、即梦等视频创作工具的字节跳动,正式宣...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...技术方向,仍然值得关注,但可以明确的是,随着大型AI模型的产业化进程不断深入,国内外参与者也越来越冷静,更加专注于自身的AI策略与节奏。有人将这两场发布会比作是一场斗地主游戏,OpenAI打出一对二,谷歌就跟四个...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...《捉妖记》海报。 赵宜OpenAI开发的文(图)生视频模型Sora演示素材发布后,再次在全球范围引发了对生成式人工智能的迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
GPT-4o:“更像人”的人工智能模型
...基准测试,GPT-4o的性能对比GPT-4 Turbo处于优势,对比其他模型更是大幅领先。GPT-4o可通过呼吸来辨别情绪,它甚至可以指导使用者怎么深吸慢呼平复心情,在分析用户喘气声后进行呼吸指导。 GPT-4o响应时间越来越短。它可以在...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...的根本。尤其在AI领域,语言的重要性愈发凸显。AI通过自然语言处理来理解和生成文本,通过代码语言来执行任务,通过视觉语言来识别和处理图像。这些不同的“语言”构成了AI理解世界的多种维度。然而,这些语言之间的割...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
... GPT4o,引起全球轰动。其中 GPT4o 展现出了与人类相近的自然语言交互能力,实现了 AI 能同时读懂人类语音中的内容及情绪,并实时做出反馈。同时,GPT4o 也给众多语音研究人员带来「新的春天」,语音文本多模态大模型成为热...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用。腾讯...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...作为智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
大模型标注:你看不上的数据标注正在成为高薪工作
...大语言模型,全球科技巨头纷纷入局,后来各家不仅限于自然语言技术,更是将文生图、文生音频、文生视频、图生视频等多模态技术“玩”出了新高度,近期大模型生成的兵马俑,还跳起了“科目三”的热舞。大模型的热潮为...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然...……更多
...性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...专家模块处理,生成连续的视频序列。整个过程可视为将自然语言描述转化为动态视觉内容的复杂系统。在模型架构设计中,CogVideoX特别采用了因果3D卷积(Causal 3D Convolution),以高效捕捉时空维度上的复杂变化,使得模型能够...……更多
Sora为何没能诞生在中国?
...道相似。清华大学人工智能研究院常务副院长、计算机系自然语言处理与社会人文计算实验室负责人孙茂松向《中国新闻周刊》解释,这是基于Transformer架构模型的“硬伤”。科学家曾希望人工智能像人类一样能“演绎推理”,...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...注。Midjourney、Imagen3、Stable Diffusion和Sora等模型能够根据自然语言提示词生成美观且逼真的图像和视频,广受用户喜爱。然而,这些模型在处理复杂的提示词时仍存在不足。例如,当让Stable Diffusion或Midjourney生成「棕色的狗绕着一...……更多
...括商量、秒画、如影、琼宇、格物五大模型,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。在技术交流日,记者发现,这五大模型以全新版本全面亮相,其中一些局部能力甚...……更多
...奉毅说。大模型是人工智能领域的重要发展方向,可以为自然语言处理、计算机视觉等领域带来更加先进的技术,推动人工智能与其他领域的交叉融合,为各个行业带来新的机遇和挑战。作为承办单位,新疆理化所在多语言智能...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...让人啼笑皆非。就在刚刚,阿里国际发布首个商用翻译大模型,电商出海神器真来了!果式文案一出,少不了网友的热议。苹果iOS 18官方7月更新的系统宣传语中,「真的很你」硬生生文案,被许多人吐槽太过抽象。原本英文的...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...“AIGC第一股”出门问问(02438.HK)携AIGC艺术展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为...……更多
更多关于科技的资讯:
奇瑞车主在广西旅游用海水洗车 网友:看到车牌明白了
快科技2月4日消息,有网友发布视频显示,一位游客竟然在海边用海水洗车。视频中,这位奇瑞车主在广西防城港海边游玩时,一时兴起竟把车辆开到了海边
2025-02-04 09:41:00
GPU-Z升级正式支持RTX 50:最烫的热点温度消失了
快科技2月4日消息,RTX 5090/5080发布多日之后,GPU-Z终于升级了,最新的2.62.0版本已经完整支持新卡
2025-02-04 09:41:00
新春走基层 | 新年数码市场涌“新”潮
本文转自:人民网-广西频道人民网南宁2月4日电 (冯肖慧)年轻消费者拿着刚领到的红包来换新手机、给老人换购大屏手机、销售人员每天从早忙到闭店……这个春节
2025-02-04 09:57:00
黄仁勋喊话年轻人:学会用AI 才能更出色
快科技2月4日消息,据媒体报道,英伟达创始人兼CEO黄仁勋在近期的一次公开报道中向年轻人提出了明确建议。他指出:“如果我是学生
2025-02-04 10:11:00
全球第一台可扩展光量子计算机问世:35颗光子芯片、13公里光纤
快科技2月4日消息,量子计算机被视为计算的未来,各种突破也是接连不断。加拿大创业公司Xanadu就宣布,他们打造了全球第一台可扩展联网的
2025-02-04 10:11:00
免费绕过Win11系统要求:第三方工具Flyby11被微软视为潜在恶意软件
快科技2月4日消息,随着Windows 10系统即将在8个月后正式停止支持,许多用户面临升级到Windows 11的需求
2025-02-04 10:41:00
全球第一例!中国完成卫星超远程手术 拉萨-北京3000公里
快科技2月4日消息,近日,由中国人民解放军总医院肝胆胰外科医学部主任刘荣主刀,我国完成了全球第一例给予通信卫星的超远程手术
2025-02-04 11:11:00
告别复杂操作!微软PowerToys新增神技能:快捷转换视频和音频
快科技2月4消息,PowerToys是微软推出的一款免费的Windows辅助工具集,包含多种实用功能,如窗口布局调整、快速截图等
2025-02-04 11:11:00
印度将罚大众14亿美元 博主:非雁过拔毛、实雁过炖了!
快科技2月4日消息,去年11月就有海外媒体报道,印度已向大众汽车公司发出通知,指控其“故意”少缴奥迪、大众和斯柯达汽车零部件的进口税
2025-02-04 11:41:00
大摩为美国科技巨头打气:DeepSeek不会导致AI资本开支崩盘!
快科技2月4日消息,据媒体报道,摩根士丹利(大摩)全球定量研究主管Vishwanath Tirupattur近日对DeepSeek的突破发表了看法
2025-02-04 11:41:00
堵麻了!返程高峰杀到!网友:18个小时的车程 铁屁股已练成
快科技2月4日消息,据媒体报道,近日,随着春节假期结束,全国各地迎来了返程高峰,交通拥堵情况尤为严重。不少网友在社交媒体上纷纷晒出自己的返程经历
2025-02-04 12:41:00
OpenAI CEO表态:无意起诉DeepSeek 会继续打造优异产品
快科技2月4日消息,据媒体报道,OpenAI CEO Sam Altman在接受媒体采访时表示,OpenAI没有计划起诉DeepSeek
2025-02-04 12:41:00
香港维尔利科技集团宣布将在成都与山东设立医疗科技体验中心
香港维尔利科技集团今日正式宣布,将在中国内地的成都和山东两地设立医疗科技体验中心。这标志着维尔利集团在中国市场的进一步深耕
2025-02-04 15:08:00
RTX 5090太缺货!黄牛3倍价格倒卖
快科技2月4日消息,英伟达最新推出的RTX 50系列显卡,特别是RTX 5090,在全球范围内都是一卡难求,在中国台湾RTX 5090显卡同样也是供不应求
2025-02-04 20:11:00
传台积电将在台南建6座晶圆厂:3座1nm 3座0.7nm
据业内传闻称,台积电最先进的1nm制程晶圆厂将落户台南沙仑,预计规划打造可容纳六座12英寸生产线的超大型晶圆厂(Giga-Fab)
2025-02-04 20:11:00