• 我的订阅
  • 头条热搜
谷歌史上最强大模型!Gemini 2.0正式发布
...深度学习算法,提升了神经网络的结构和效率,特别是在自然语言处理(NLP)领域表现出色。这些技术的创新使得Gemini 2.0能够更好地理解和生成自然语言,增强了人机交互的智能性。即日起,开发人员便可在AI Studio和Vertex AI中...……更多
...国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...多个细粒度原则进行标注,提供复杂精细化偏好标注。 自然语言语言反馈:提供细粒度批评和润色反馈,可利用此自然语言反馈开发算法及提升模型性能 跨模态 QA 对:输入输出包含混合模态,在不同模态之间实现更丰富的交...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...正在火山口跳动冒出。这段 10 秒的视频是豆包视频生成模型基于以上提示词想象创造的。可以说这段视频的拟真度非常高,并且有着娴熟的运镜,足以放入任何影视作品中。有着剪映、即梦等视频创作工具的字节跳动,正式宣...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...技术方向,仍然值得关注,但可以明确的是,随着大型AI模型的产业化进程不断深入,国内外参与者也越来越冷静,更加专注于自身的AI策略与节奏。有人将这两场发布会比作是一场斗地主游戏,OpenAI打出一对二,谷歌就跟四个...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...《捉妖记》海报。 赵宜OpenAI开发的文(图)生视频模型Sora演示素材发布后,再次在全球范围引发了对生成式人工智能的迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
GPT-4o:“更像人”的人工智能模型
...基准测试,GPT-4o的性能对比GPT-4 Turbo处于优势,对比其他模型更是大幅领先。GPT-4o可通过呼吸来辨别情绪,它甚至可以指导使用者怎么深吸慢呼平复心情,在分析用户喘气声后进行呼吸指导。 GPT-4o响应时间越来越短。它可以在...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...的根本。尤其在AI领域,语言的重要性愈发凸显。AI通过自然语言处理来理解和生成文本,通过代码语言来执行任务,通过视觉语言来识别和处理图像。这些不同的“语言”构成了AI理解世界的多种维度。然而,这些语言之间的割...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
... GPT4o,引起全球轰动。其中 GPT4o 展现出了与人类相近的自然语言交互能力,实现了 AI 能同时读懂人类语音中的内容及情绪,并实时做出反馈。同时,GPT4o 也给众多语音研究人员带来「新的春天」,语音文本多模态大模型成为热...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用。腾讯...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...作为智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
大模型标注:你看不上的数据标注正在成为高薪工作
...大语言模型,全球科技巨头纷纷入局,后来各家不仅限于自然语言技术,更是将文生图、文生音频、文生视频、图生视频等多模态技术“玩”出了新高度,近期大模型生成的兵马俑,还跳起了“科目三”的热舞。大模型的热潮为...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然...……更多
...性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...专家模块处理,生成连续的视频序列。整个过程可视为将自然语言描述转化为动态视觉内容的复杂系统。在模型架构设计中,CogVideoX特别采用了因果3D卷积(Causal 3D Convolution),以高效捕捉时空维度上的复杂变化,使得模型能够...……更多
Sora为何没能诞生在中国?
...道相似。清华大学人工智能研究院常务副院长、计算机系自然语言处理与社会人文计算实验室负责人孙茂松向《中国新闻周刊》解释,这是基于Transformer架构模型的“硬伤”。科学家曾希望人工智能像人类一样能“演绎推理”,...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...注。Midjourney、Imagen3、Stable Diffusion和Sora等模型能够根据自然语言提示词生成美观且逼真的图像和视频,广受用户喜爱。然而,这些模型在处理复杂的提示词时仍存在不足。例如,当让Stable Diffusion或Midjourney生成「棕色的狗绕着一...……更多
...括商量、秒画、如影、琼宇、格物五大模型,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的AIGC应用。在技术交流日,记者发现,这五大模型以全新版本全面亮相,其中一些局部能力甚...……更多
...奉毅说。大模型是人工智能领域的重要发展方向,可以为自然语言处理、计算机视觉等领域带来更加先进的技术,推动人工智能与其他领域的交叉融合,为各个行业带来新的机遇和挑战。作为承办单位,新疆理化所在多语言智能...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...让人啼笑皆非。就在刚刚,阿里国际发布首个商用翻译大模型,电商出海神器真来了!果式文案一出,少不了网友的热议。苹果iOS 18官方7月更新的系统宣传语中,「真的很你」硬生生文案,被许多人吐槽太过抽象。原本英文的...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...“AIGC第一股”出门问问(02438.HK)携AIGC艺术展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为...……更多
更多关于科技的资讯:
连续七年,兰蔻等多品牌在银泰百货收获“全国第一柜”
近日,银泰百货公布了2024年度化妆品品牌“全国第一柜”。据了解,2024年,海蓝之谜等多个化妆品品牌在银泰百货卖到了“全国第一”
2025-01-15 10:21:00
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
快科技1月15日消息,在今天的新品发布会上,科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型
2025-01-15 10:24:00
行程4400余公里!最长春运列车全程63小时停靠7小时
快科技1月15日消息,临近年关,一年一度的春运大迁徙也已开幕,就在昨日,中国铁路开通K4292/K4290次海拉尔往返广州白云旅客列车
2025-01-15 10:24:00
俄罗斯发生大规模断网事件:原因不明
快科技1月15日消息,据俄罗斯联邦通信、信息技术和大众传媒监督局发布的消息,莫斯科时间14日约17时05分至17时30分
2025-01-15 10:24:00
余承东回应智界R7方向盘太轻:支持随速助力转向 速度越快手感越稳
快科技1月15日消息,余承东近日通过视频介绍了智界R7汽车的方向盘设计,强调了其随速助力转向功能,即车速越快方向盘越重
2025-01-15 10:24:00
商报讯 见过巨无霸汉堡,那你见过和生日蛋糕一样大的汉堡吗?近日,塔斯汀推出新品“生日大汉堡”,瞄准生日场景做营销。如今
2025-01-15 10:39:00
四大关键词,透视兆驰股份20周年盛典
2025年1月14日,兆驰股份二十周年盛典暨全球战略合作伙伴生态峰会在江西省南昌市顺利召开。本次活动以“起宏图、立巅峰
2025-01-15 10:39:00
神眸助力首届高校校友贵州村超足球联赛总决赛
2025年1月11日,“首届高校校友嘉年华”暨湾区高校校友“贵州村超足球联赛总决赛”在深圳湾体育中心“春茧”体育场圆满落幕
2025-01-15 10:45:00
时代潮流的产物,娱乐升级的助力—飞猫随身WiFi
在华语乐坛的繁星中,周华健无疑是一颗耀眼的恒星。多年来,他凭借《朋友》《花心》等诸多经典曲目,用温暖且极具感染力的嗓音
2025-01-15 10:46:00
成为全国轮胎行业首家入选企业 贵州轮胎获评全球“灯塔工厂”
多彩贵州网讯(本网记者 石琳婕)1月14日,世界经济论坛公布2025年度首批“灯塔工厂”名单。其中,贵州轮胎股份有限公司(简称贵州轮胎)成功入选
2025-01-15 10:49:00
OPPO周意保:Find X8 Ultra将支持物理长焦微距
快科技1月15日消息,OPPO Find系列产品负责人周意保近日透露,即将发布的OPPO Find X8 Ultra手机将支持物理长焦微距功能
2025-01-15 10:54:00
端到端同传国内首个!科大讯飞星火同传语音大模型发布:领先Gemini 2.0、GPT-4o
快科技1月15日消息,今日,科大讯飞星火同传语音大模型正式发布,这是国内首个具备端到端语音同传能力的大模型。相较于讯飞此前的翻译技术
2025-01-15 10:54:00
万物相连通讯:共绘万物互联蓝图
树立行业标杆,讲好中国故事,传递中国声音,充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。近日,“崛起的民族品牌”专题系列节目对话深圳市万物相连通讯有限公司(简称
2025-01-15 11:00:00
送礼攻略 | 与龚俊一同体验古人香雅
2025乙巳年至,野兽派以古代节令画“岁朝图”为灵感,推出蛇年限定系列「太平有象,长乐未央」,礼献三款新年新香——长乐未央
2025-01-15 11:00:00
雷军官宣,瞬间爆了!与用户一起到小米汽车工厂过大年
1月14日,小米集团创始人雷军发微博官宣:小米汽车工厂增设春节专场,初五开始至初七开放5场参观,与用户一起到工厂过大年
2025-01-15 11:06:00