• 我的订阅
  • 头条热搜
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是一个重要的里程碑」!现已可在官网上体验Le Chat的使用。体验地址:h...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...AIHub为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。 在使用高通AIHub时,开发者可以选择所需的大模型,例如Baichuan-7B,然后可以选择开发应用所使用的框架,例如例...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目,正文很大,清晰易读,机器人的手在打字机上打字。 5月14日,OpenAI发布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。...……更多
被字节索赔800万的实习生:拿下NeurIPS 2024最佳论文!
...a Next-Scale Prediction》(视觉自回归建模:通过Next-Scale预测生成可扩展图像)。提出了一种全新的图像生成框架VAR,首次使基于GPT风格的自回归模型在图像生成任务中超越了扩散模型,并验证了VAR模型的可扩展性和零样本泛化能力...……更多
Adobe神级AI视频媲美Sora!拖拽一键秒生大片,最强PS震撼设计圈
...同时,经过全面升级的史上最强PS也来了。Adobe全面进军AI生成领域!就在2024年的Adobe MAX大会上,Adobe正式推出Firefly视频模型,以及最新升级的图像模型。Adobe Premiere Pro加入生成式扩展相比于一次只生成1~5秒的视频生成模型,将...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...,使得粒子数量的方差仍然在每个图块的分布范围内。与生成式视频模型的定性比较鉴于生成式视频模型的突出地位,可以合理地假设它们可以很容易地用作世界模型。为了研究 DINO-WM 相对于此类视频生成模型的实用性,该团队...……更多
...。他毕业于卡内基梅隆大学(CMU),是全球最早一批推动生成式AI与大模型理论技术成熟的青年学者之一,“基于这个思路,我们开始思考:视觉模型是否也能实现类似的推理能力?”与传统大模型训练的 SFT(Supervised Fine-Tuning...……更多
...度表征学习与优化》《航天器序列图像自主导航技术》《生成我们的数字未来》主题学术报告。本次大会共设置34场论坛,以及200余项成果和海报展示。其中,25场学术论坛涵盖生成式人工智能、大模型、数字人、机器学习、类...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI 官网展示的众多案例我们可...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年是国内大语...……更多
...动规划方法,按无人机巡检飞行距离、标准拍照顺序一键生成巡检航线,无人机按照航线高精度飞行,保证了巡检安全性以及图像采集的规范性、准确性,单塔巡检时间由30分钟降低至8分钟。无人机执行巡检任务时,采集的图像...……更多
大模型下 自动驾驶企业开始取经特斯拉
...自动驾驶企业的蓝图规划中。而随着ChatGPT的骤然爆火,生成式AI大模型正在给自动驾驶领域带来一些新的变量和启示。 01.自动驾驶圈“去高精地图化”2021年年中,正在冲刺港股双重上市的小鹏汽车,斥资2.5亿元收购了一家进入...……更多
...最全面的大模型家族,包括大语言模型、语音交互、图像生成和编辑、音乐生成、视频生成等,这背后是字节跳动对基础模型全方位、大力度地坚决投入。例如,豆包·音乐模型根据用户提供的素材进行AI词曲创作,提供版权音...……更多
谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3
...究实验室Google DeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创...……更多
meta推出两款基于ai的图像编辑工具
...编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多样性。据悉,EmuEdit号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...Net,将其潜在表示聚类到语义上有意义的类别,从而能够生成大量的语义相似性三元组,研究人员将该数据集称为AligNet。 为了将这种精心构造的类人相似性结构信息迁移到预训练的神经网络基础模型中,研究人员引入了一种基...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...提的是,字节跳动还将在2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线目前,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设...……更多
视频大模型 快手美图殊途同归
...视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频。美图宣布将在7月底上线新品MOKI,该产品基于美图奇想大模型的视频生成能力,可帮助用户生成AI短片。不论是做视频还是做短片,都是通过大模型辅助用户创...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
2月16日,OpenAI的AI视频模型Sora炸裂出道,生成的视频无论是清晰度、连贯性和时间上都令人惊艳,一时间,诸如“现实不存在了!”的评论在全网刷屏。Sora是如何实现如此颠覆性的能力的呢?这就不得不提到其背后的两项核心...……更多
Black Forest Labs推出Flux1.1Pro
...stLabs)是一家位于德国的初创公司,专注于开发最先进的生成性人工智能模型。Flux简介Flux在AI文生图领域有着“最强”称号,在多个方面有着卓越表现:生成质量:Flux在图像生成的质量上表现出色,能够处理多种风格,包括二...……更多
谷歌CEO反思大模型生成错误图像:不可接受,初期没有完美AI
由于旗下AI(人工智能)Gemini在生成的图像中展现出了过度的“多样性”,在紧急下架Gemini刚上线不到一个月的图像生成功能后,谷歌CEO承认该问题冒犯了客户,公司将为AI产品的发布推出新流程。当地时间2月27日晚间,谷歌CEO...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研究者使用最先进的方...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前的 CAD 软件普遍缺乏简易的交互工具...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...中的奖励来自于校准的自我奖励:LVLM对于每句话的自我生成概率 + 结合视觉约束奖励,用于奖励校准。2. 基于每一轮构造的偏好数据在线通过DPO迭代学习。实验CSR相较于数据驱动的偏好学习对齐方法和模型自我反馈的方法均有...……更多
Sora未开放课先火 选课当心被割韭菜
输入寥寥数语便能生成效果炸裂的60秒视频!美国开放人工智能研究中心(OpenAI)推出的视频生成模型Sora近日震惊全球。目前,Sora只发布了多个演示视频和技术指导,并对一些专家开放内测,但该模型尚未对公众开放注册。也...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...但这个过程可能会影响语音的表达性,使得模型在理解、生成带表达的语音上有所欠缺。为了解决这个限制,研究人员构建了Spirit LM,也是首个Meta开源的多模态语言模型,能够自由地混合文本和语音;通过在语音和文本数据集...……更多
AI应用正面临能耗挑战?分布式算力提供新路径!
...应用领域,它们在对话系统、自动翻译、语音识别、文本生成和语义分析等方面表现出色,如GPT-3等模型。图像处理:涵盖图像识别、图像生成、图像增强和人脸识别等,这些技术为医疗诊断、安全监控和娱乐行业提供了强大支...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...用世界模型研发,旨在通过研究通用世界模型改进其视频生成系统,使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2,一款高质量、逼真的人工智能图像生成器。Mistral AI发布Mixtral 8x7B专家混合模型,表现优越且推理速度...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便...……更多
更多关于科技的资讯:
杭州六小龙 第一个IPO即将诞生
继 DeepSeek 和宇树科技之后,又一家来自杭州的科创企业群核科技于近日走到台前,迎来了关键时刻。近日,群核科技递交了港股招股书
2025-02-26 19:05:00
禁止电竞选手2月23日洗澡冲上热搜!到底什么情况
快科技2月26日消息,今天下午,微博热搜上出现了一个看起来颇为奇怪的词条“禁止电竞选手2月23号洗澡”,并且一度冲上了第一的位置
2025-02-26 19:05:00
RTX 50/40/30大量黑屏变砖!救命的BIOS、驱动来了
快科技2月26日消息,RTX 50系列发布之后,不少玩家遇到了黑屏、变砖的问题,无法再点亮,不仅波及RTX 5090(D)
2025-02-26 19:05:00
汽车应急车道违停 被一只半挂轮胎追尾 司机懵了
快科技2月26日消息,近日,杭州公安高速交警接到一起奇特的车辆报警。一位驾驶员称自己停在应急车道的车子,竟被一只轮胎“追尾”了
2025-02-26 19:05:00
曾为驾驶爱好者白月光!新款别克君威GS实车展示
快科技2月26日消息,曾几何时,别克君威GS还是很多年轻人梦想中的运动型家用车,然而随着新能源的到来,2.0T高性能发动机已经无法满足他们的胃口
2025-02-26 19:05:00
响应小于1秒、唤醒识别超98%!岚图自研AI语音对话系统即将发布
快科技2月26日消息,岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力
2025-02-26 19:05:00
国补政策落地“满月”,点燃十堰数码产品“换新潮”
十堰广电讯(全媒体记者 蒋巍)自1月20日起,手机等3C数码产品购新补贴政策正式实施,“国补”政策落地满月,十堰的数码产品销售市场态势如何?数码产品迎来换新潮2月25日
2025-02-26 19:24:00
三星计划2030年实现1000层NAND!使用长江存储专利技术
快科技2月26日消息,随着NAND闪存技术竞争日益激烈,三星电子公布的路线图显示,计划到2030年开发出1000层的NAND闪存
2025-02-26 19:35:00
ROG魔盒WIFI7电竞路由器首发1999元:9个2.5G网口
快科技2月26日消息,华硕带来了ROG魔盒 WIFI7电竞路由器。首发到手价为1999元。ROG魔盒 WIFI7电竞路由器机身融入了大量ROG元素
2025-02-26 19:35:00
旅游公司招募太空旅行者:门票一人400多万 近两年席位已售罄
快科技2月26日消息,据媒体报道,近日,在湖北一商场内,一家旅游公司悬挂出太空旅行的乘客招募广告。该广告宣称,这场太空旅行面向普通市民开放
2025-02-26 19:35:00
DeepSeek凭借其开源、低成本、高性能等优势,掀起人工智能领域的新一轮热潮。作为平安集团金融科技生态圈的重要组成部分
2025-02-26 19:44:00
股价暴涨4倍后,博士眼镜实控人再减持,“AI眼镜第一股”含金量如何?
博士眼镜股价暴涨但业绩下滑,欲靠加盟拓展门店? 来源|时代商业研究院作者|陈佳鑫编辑|韩迅【导语】AI眼镜是人工智能最热门的赛道之一
2025-02-26 20:02:00
男子在高速上恶意别停他车 还威胁辱骂女司机让网友看怒:官方通报
2月26日消息,近日,有网友发视频称,重庆高速上一男子开丰田车在高速上恶意别停后车,并且还辱骂后车女司机。按照女司机的陈述
2025-02-26 20:05:00
游戏本天花板!微星泰坦18 Ultra AI/龙魂典藏版发布:满血RTX 5090、96GB大内存
快科技2月26日消息,在今天的新品发布会上,微星正式发布了泰坦18 Ultra AI和龙魂典藏版旗舰游戏本。核心配置上
2025-02-26 20:05:00
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
开源模型,还是得看杭州。前脚发完QwQ-Max,阿里就在深夜开源了视频生成模型Wan 2.1,14B参数直接屠榜VBench
2025-02-26 20:05:00