• 我的订阅
  • 头条热搜
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...、知识更新鲜,而且能一次性输入一整本书。2、开放新模态API:包括接受图像输入的GPT-4 Turbo、文生图模型DALL·E 3、 文本转语音模型TTS,不久后还将支持自动语音识别模型Whisper v3。 3、GPT定制化服务:支持用户5分钟内、无代码...……更多
英伟达超快stylegan回归
扩散模型的图像生成统治地位,终于要被GAN夺回了?就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的 StyleGAN-T,一下子在网上火了。无论是在星云爆炸中生成一只柯基:还是基于虚幻引...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...势值得注意的是,Sora推出的同一天,谷歌发布了Gemini多模态模型的更新版本,而三天前,StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久,OpenAI发布...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...次发布基于CogVideoX的清影,使其大模型矩阵又扩充类一个模态。值得一提的是,这也是国内做语言大模型起家的大模型独角兽,首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂,以及爱诗科技、生数科...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...2M、SA-1B以及WebVid-10M和OpenVid-1M等。1、LAION-5B:一个用于多模态AI研究的大型数据集。2、CC-12M:一个由网络爬虫收集的图像文本对的数据集。3、SA-1B:具有高质量、无模糊图像的数据集。4、WebVid-10M和OpenVid-1M:两个被广泛用于文……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”,意为全能,与现有模型相比,它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多
MSRA:视觉生成六大技术问题
...进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,难以直接拟合。因此,往往需要将复杂的信号做拆分,拆分成多个简单的分布拟合问题,再分别求解。信...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
“最强开源AI模型”,4050亿参数版Meta Llama 3被曝7月23日发布
...上图为机翻字幕,存在错误 报道称 Llama 3-405B 是一个多模态 AI 开源模型,能够理解图像、文本等多种媒体内容。IT之家查询社交媒体等公开信息,发现已经有开发者使用该 AI 模型。 ……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...华为的盘古大模型,包括盘古 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。不得不说,华为大模型手机声量越来越高,与其密切关注新兴技术并持续投入掌握这些新技术,根据市场需求进行调整相关。从HarmonyOS 4系...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...注意力表现出与视频中的运动和动态相关的中频变化;跨模态注意力是最稳定的,将文本与视频内容联系起来,类似于反映文本语义的低频信号。基于此,研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多
Galaxy S24系列上线大模型!三星:不排除未来Galaxy AI收费的可能性
...手让给了苹果。有消息称,苹果此前推出了名为Ferret的多模态大语言模型,而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。有...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...模型进行持续迭代式微调。GPT-4系列:能力跃升,增加多模态能力,最新版4o突破性价比GPT系列模型的技术演变(GPT-4~GPT-4o):继ChatGPT后,OpenAI于2023年3月发布GPT-4,它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...频。图源:VideoPoetOne More Thing虽然已经是2023年的年底,多模态赛道的玩家们却都还在抢着发布新模型,为本就热闹的市场又增加了一把热度。勤奋如Google,一个月内连发好几款新模型。也有蓄势待发的Midjourney,时隔9个月后终于...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...低了82%。最新发布的GPT-4o更是被称为现实版的斯嘉丽,多模态的输入输出能力和类人化的情感表达让网友直呼,“她来了!”。不仅支持文、图、音频三种信息形态的输入,并且可以做超过50种语言的同声传译。甚而有网友给GPT-...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
...智算训练资源池,对图像、文本及语音等混合数据进行多模态大模型训练,最后针对南宋御街场景进行本地化增量训练打造而成。充分发挥西部数据算力资源优势,贵州依托全国一体化算力网络国家枢纽节点和国家级人工智能训...……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...量问题而导致难产的节骨眼,Meta毫不客气发了它的视频模型“Movie Gen”,并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是,Meta还“杀人诛心”,虽然这模型目前和Sora一样还没对外开放,但它把新模型的95页技...……更多
更多关于科技的资讯:
微星Claw 8、Claw 7 AI+掌机终于发布!首发酷睿Ultra 200V、32GB大内存
快科技11月29日消息,微星在海外正式发布了第二代游戏掌机,包括两款Claw 8 AI+、Claw 7 AI+,首发配备代号Lunar Lake的酷睿Ultra 200V系列处理器
2024-11-29 22:04:00
国产自研CPU!龙芯3C6000明年Q2发布 对标英特尔至强4314
快科技11月29日消息,龙芯中科最近发布的投资者关系活动记录表显示,公司下一代服务器芯片3C6000目前正处于样片阶段
2024-11-29 22:34:00
武汉大学131周年校庆:雷军视频送祝福 去年曾捐赠13亿
快科技11月29日消息,今日,武汉大学迎来建校131周年校庆日。下午,武汉大学第十届校友论坛在雷军科技楼报告厅举行,武汉大学校友企业家联谊会执行理事长
2024-11-29 22:34:00
半夜口干舌燥 可能不是缺水!这6种情况一定要警惕
相信很多人都曾有过这样的体验:临睡时刻,总觉得口干舌燥,害怕会频繁起夜,但又忍不住想大口喝水。每当此时,一些人不免会担心
2024-11-29 22:34:00
为满足国内市场需求 特斯拉将针对Cybertruck进行碰撞保护改进
快科技11月29日消息,特斯拉正计划对中国市场的Cybertruck进行工程改进,以满足中国行人碰撞保护标准,这可能预示着这款纯电动皮卡即将正式引入中国
2024-11-29 23:34:00
月租2167元起!特斯拉海外全系车型推出“先租后买”政策
快科技11月29日消息,特斯拉在北美市场推出了一项全新的“先租后买”汽车租赁方案,覆盖Model S、3、X、Y以及Cybertruck全系车型
2024-11-30 00:04:00
比国内贵9万!广汽埃安AION V正式登陆泰国市场
快科技11月29日消息,广汽埃安AION V正式登陆泰国市场,售价约合人民币21.8万元。这是AION V首次海外上市
2024-11-30 00:04:00
东南网11月29日讯 随着全球化进程的加速,越来越多的中国企业选择走出国门,探索海外市场。面对复杂多变的国际环境,如何突破文化壁垒
2024-11-30 04:17:00
张婷婷 对外经济贸易大学国际经济贸易学院摘要:伴随着金融科技的快速发展,传统银行业务转型面临前所未有的机遇与挑战。本文在分析传统银行业务转型困境的基础上
2024-11-30 04:40:00
徐燕霞 对外经贸大学国际经济贸易学院摘要:在当前瞬息万变的市场环境下,企业面临着日益激烈的市场竞争压力,如何准确预测采购供应需求
2024-11-30 04:40:00
吴楠 对外经济贸易大学中国金融学院摘要:小微企业是国民经济和社会发展的生力军,在扩大就业、激发创新活力、促进经济发展中发挥着不可替代的作用
2024-11-30 04:40:00
孙常军 魏民 寇军营 乔一民 山东新矿信息技术有限公司近期,新矿集团为解决在广域网组网中专线带宽低、费用高、不稳定的痛点
2024-11-30 04:40:00
沈婕 吴钰 江西师范大学面对国际社会了解中国的迫切需要,我们要主动出击,迎合数字时代发展新需求,强化国际传播效能的技术属性
2024-11-30 04:40:00
本文转自:人民日报本报记者 潘俊强走进中国国际展览中心(顺义馆),在南登录厅入口附近主干道的工商银行展台中心位置,一则工商银行服务中国中车集团有限公司的供应链金融故事
2024-11-30 06:27:00
曾经的欧美游戏一哥:成了今年最大的乐子
转眼间,2024 迎来尾声,亲爱的 Bioware ,请查收你的年度成绩单吧!在前两天公布的 TGA 2024 提名列表中
2024-11-30 07:34:00