• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...成模型还有三个亮点。1、文本编码器部分,已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器,适配的主要是上一代语言模型,如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模型Hunyuan-DiT中适配的是T5和C...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...技公司争相入局大模型的研发,大模型也逐渐从单一文本模态,向语音、图像、视频等多模态方向演进,这些前沿技术不再遥不可及,展现了巨大的应用潜力,改变千行百业的同时也开始走进千家万户。作为国产大模型产品的代...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
CybotStar——大模型一站式应用开发平台
...,助力产业机构竞逐AI新时代。内容生成:CybotStar提供多模态的内容生成能力,包括文本、语音、视频等,帮助产业机构实现文本写作、代码生成、语音生成等基础性功能。 知识库:CybotStar提供了完善的知识库管理系统,支持...……更多
不会AI的医生会被取代?
...真正进入AI时代,仍然需要跨越数据、算力等门槛。01.多模态AI通用化成趋势对医疗行业而言,AI并非一个新话题。早在20世纪80年代,我国就开始了对医疗AI的研究。2017年,AlphaGo背后的谷歌子公司DeepMind开始将目光转向药学关键...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
...事业”。报告总结出人工智能产业发展十个趋势,即:多模态预训练大模型是人工智能产业的标配;高质量数据愈发稀缺将倒逼数据智能飞跃;智能算力无处不在的计算新范式加速实现;人工智能生成内容应用向全场景渗透;人...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外,OmniGen 可以处理经典的计...……更多
视频大模型 快手美图殊途同归
...a早成立一个月,主要业务集中在图像、3D、视频等原生多模态大模型的研发。2024年4月,生数科技联合清华大学发布的视频大模型Vidu,支持一键生成16秒、分辨率1080P的高清视频内容。6月初,生数科技宣布,已完成数亿元Pre-A轮...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...。全自研技术All in 大模型的智谱 AI,很早就开始部署多模态生成式 AI 模型。从 2021 年开始,智谱 AI 先后发布了 CogView(NeurIPS’21)、 CogView2(NeurIPS’22)、CogVideo(ICLR’23)、Relay Diffusion(ICLR’……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编...……更多
...源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...型等。除大模型外,算法团队正深入研究小样本学习、多模态机器学习、鲁棒学习和知识推理等核心技术,力求在认知智能领域实现重大突破。论坛上,牛津大学DeepMind人工智能教授Michael Bronstein带来了关于“几何深度学习—从...……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
...为,从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI(通用人工智能)的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...化应用的标准化平台产品。通过集成大模型、虚拟人、多模态语音、知识库等技术,利用人机对话的交互方式,轻松完成展厅和展会的讲解互动,实现用户行为分析,精准定位商机。在团队碰头会场景,星火快答可通过问答快速...……更多
AI视野:iPhone16将引入生成式AI;百度AI编程工具限时免费;
...演模式。????‍????????????聚焦开发者清华系ChatGLM3发布,多模态挑战GPT-4V智谱AI发布了清华系ChatGLM3,全自研、适配国产芯片,多模态模型挑战GPT-4V,搭载国产Code Interpreter,实现代码交互能力。元象大模型向全社会开放元象信息科...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...抓不住经典瞬间了。相比之下更加「基础」的能力,如多模态大模型的推理,也可以在手机端侧进行:无论是拍数学题让 AI 解题,还是看一张外文菜单让 AI 帮忙点菜,都是几秒钟就能办到的事。这一系列技术的驱动力,都来自...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
科大讯飞股价跌停,市值蒸发120亿元
...升9%,其次是逻辑推理(8%),文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时,七大能力大幅度提升,其中语言理解能力提升78%,文本生成、知识问答、数学能力等提升也超70%,逻辑推理能...……更多
大模型到了该「验收」的时候
...最后,以Stable Diffusion为首的技术突破也使得大模型在多模态内容创作生成上表现极佳。抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能...……更多
更多关于科技的资讯:
当东明石化“EPOE”,遇上DeepSeek
大众网记者 王晓姝 济南报道在国际舞台上,中国“智”造正以前所未有的速度崛起,近日火爆全球的DeepSeek是其中代表
2025-03-01 21:17:00
震撼!一千四百年前古人竟已用上储粮黑科技
快科技3月1日消息,近日,据央视报道,一项关于古代储粮技术的发现再次引发了热议。原来,在一千四百年前,古人就已经掌握了一种堪称“黑科技”的储粮秘诀
2025-03-01 13:38:00
春晚出圈的宇树科技招人了:年薪可达百万!
快科技3月1日消息,蛇年春晚舞台上,来自杭州的宇树科技凭借出色表现刷屏热搜。而就在今日,杭州今年新春最大规模的线下人才招聘会于上午9时在杭州大会展中心盛大启幕
2025-03-01 14:08:00
凌晨退税喜提5万多!网友直呼:3月第一份快乐
快科技3月1日消息,三月第一天,许多网友卡点干的第一件事,就是退税!2024年度个人所得税综合所得汇算清缴今天开始了,汇算的时间为3月1日至6月30日
2025-03-01 14:38:00
抗病5年 知名歌手方大同去世:年仅41岁
快科技3月1日消息,今日中午,歌手方大同独立音乐厂牌@赋音乐FUMUSIC 发布消息称:以积极的态度面对顽疾5年, 方大同于2025年2月21日早晨
2025-03-01 14:38:00
董明珠回应500亿做芯片质疑:国家和企业发展都需要
快科技3月1日消息,近日,董明珠在央视频的视频中回应了外界对于格力投资500亿做芯片的质疑。此前,格力大价钱投资造芯片引发热议
2025-03-01 15:08:00
DeepSeek大胆披露:理论利润率高达545%!
快科技3月1日消息,今日,DeepSeek正式在知乎平台开设了其官方账号,并发布了一篇名为《DeepSeek-V3/R1推理系统概览》的技术文章
2025-03-01 15:08:00
同比增长62.2%:蔚来公司2月交付新车13192辆
快科技3月1日消息,在刚刚过去的2月份,蔚来公司交付新车13192台,同比增长62.2%。其中,蔚来品牌交付新车9143台
2025-03-01 16:08:00
气胸是什么病、为什么高瘦男性容易得:医生科普
快科技3月1日消息,歌手方大同因病去世,享年41岁,据报道,2010年他因操劳过度,出现(气胸)爆肺而数度住院。那么什么是气胸
2025-03-01 16:38:00
每年导致40万人截肢:这种动物被联合国列入“危险疾病名单”
在非洲肯尼亚的一个小镇,11 岁的比阿特丽斯坐在路边,用手划拉着地上的泥土打发时间。忽然,石缝中弹出一条“红线”,她还没来得及反应
2025-03-01 17:08:00
9.98万 赛力斯蓝电E5 PLUS长续航先享版上市:纯电能跑165公里
快科技3月1日消息,就在今日,蓝电E5 PLUS 165km长续航先享版车型上市,限时一口价9.98万元,限量1000台
2025-03-01 17:08:00
英特尔再度推迟“千亿美元”芯片工厂的建设!投产起码再等5年
陷入困境的芯片制造商英特尔周五(2月28日)宣布,该公司将推迟在俄亥俄州开设芯片制造工厂的进程。2022年时,英特尔曾承诺将投资高达1000亿美元
2025-03-01 17:38:00
骁龙8 Elite近乎“白菜价”!有厂商要干到2500元以内:网友担心会不会赔钱
快科技3月1日消息,博主数码闲聊站爆料,某款骁龙8 Elite机型好像要干到2500元以内。这条微博引发热议,有网友担心“厂商会不会赔钱”
2025-03-01 17:38:00
因“方向感不清晰”:车主控诉小鹏P7+智驾时撞上护栏
快科技3月1日消息,当前一切高阶智能驾驶均为辅助驾驶,使用时还需小心谨慎,时刻准备接管,以防事故发生。据“1818黄金眼”最新报道
2025-03-01 18:08:00
老了也有依靠!京东外卖骑手感谢刘强东
快科技3月1日消息,据媒体报道,近日京东首批全职外卖骑手代表正式签约,引发热议。多位外卖骑手表示,公司为其缴纳五险一金对房贷
2025-03-01 18:08:00