• 我的订阅
  • 头条热搜
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...lama 3-V 70B相媲美。NVLM-X1.0还有一个优势:训练和推理速度更快。开源的多模态大型语言模型,如LLaVA-OneVision 72B和InternVL-2-Llama3-76B,在多模态训练后在纯文本任务上表现出显著的性能下降;相比之下,NVLM-1.0模型的纯文本性能甚至.……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...也进一步推动AI普惠风。 一、智谱“清影”上线:速度更快、更为可控、画面更连贯速度上,智谱生成式视频模型的推理速度提升了6倍,生成6s视频只需花费30s,这意味着更快的创作周期、更高的实时性、更流畅的生成,以及...……更多
AI PC是噱头还是更快的马车?
...tra5125H包含7个。而且,这一代核显还支持AV1硬编码,可以更快速地输出高质量、高压缩率的视频。凭借领先的编解码能力,ArcGPU确实在视频剪辑行业积累的良好的口碑。随着矢量引擎能力的大幅度提升,大量内容创作ISV的演示了...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...SenseNova”大模型体系开放API和MaaS服务,该板块有望迎来更快增长。1956年,人工智能这个词和粒子对撞机同时发明出来,粒子对撞机作为物理学最大的基础设施大装置,给行业推进带来了动力。徐立希望,商汤的AI大装置不仅可...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...的 7B MLLM (e.g., LLaVA1.5 和 SPHINX),但我们优先使用更小更快的 Mamba-2.7B 来平衡机器人模型的效率。在未来,我们计划为资源不受限制的场景开发 RoboMamba-7B。 2. 机器人推理能力评估(RoboVQA Benchmark)另外,为了全面比……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...PT-4o。GPT-4o 将文本、音频和视觉集成到一个模型中,提供更快的响应时间、更好的推理能力以及在非英语语言中的更佳表现,不仅在传统文本能力上与GPT-4 Turbo性能相当,还在API方面更快速,价格便宜50%。与GPT-4 Turbo相比,GPT-4o...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...式的视觉模型,在保障用户隐私安全的情况下,带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型,FindX7系列将带来自然语言理解、文本内容摘要、通话语音摘要...……更多
以公共预览形式,微软开放AI计算机视觉模型Florence
...用户免受任何潜在有害内容的侵害,增强安全性,并允许更快的事件响应时间。Florence通过自动字幕、智能裁剪、分类、消除背景干扰和图像搜索提供用户友好的内容发现。更重要的是,用户可以通过符合道德规范的AI实施来跟...……更多
...性和实时性要求相对较低,因此融合和借鉴DeepSeek的速度更快。本地化大模型部署不仅可以减少对云端网络的依赖、降低延迟、提高响应速度,还能更好地保护用户隐私,并实现个性化体验升级。基于以上分析,笔者认为本轮的...……更多
云测数据:为人工智能提供专业、高效的AI数据服务
...值数据支持,实现场景数据专业化、高质量交付,帮助企业更快更好地实现AI应用成功落地。与此同时,云测数据也一直推动着AI数据标准化体系建设,先后参与编制了《智能网联汽车激光雷达点云数据标注要求及方法》、《智能网联...……更多
最新美国国家人工智能科学院院士介绍
...她专注于元学习和强化学习,致力于让机器学习系统能够更快地适应新任务和环境。Finn的研究有助于提升人工智能系统的灵活性和泛化能力,为未来的智能系统发展开辟了新的道路。DaniYarowsky,来自约翰斯·霍普金斯大学(JohnsH...……更多
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
...学革命推向聚光灯下。好的AI工具,可以帮助科学家做出更快、更好的科学发现。IDEA团队选择了化学领域,从预测能力和数据能力入手,进行了研究和产业化实践。在预测方面,IDEA研发的多个化学领域专家大模型,分子属性预...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...比,掩码建模由于采样迭代次数较少,因此推理速度明显更快,而二元目标的扩散过程需要更多时间。这种生成与判别的统一能带来什么好处呢?齐宪标举了两个例子,如果我们想让模型生成一张「飞翔的熊猫」图,那么这种自...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...能和响应速度,使得模型的训练过程更加高效,收敛速度更快,性能更稳定。同时也得益于云从科技长期在视觉、语言领域的深厚积累和不断创新。图 4:从容大模型 - 2.0 多模态能力示例此前,从容大模型已在视觉、跨模态领域...……更多
人均年薪100万,手机厂商数百亿开卷大模型
...据不用上传到云端。与此同时,端侧大模型的响应速度会更快,一种最极端的情况就是即便在没有网络的情况下,端侧大模型依然可以使用,而云上大模型在没有网络情况下则无法使用。此外,云上大模型的调用成本高昂。“一...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...经走到了比拼技术商业化的攻坚阶段,比拼的是谁落地得更快,谁的落地更实用。就在这波降低技术门槛、优化模型的大潮中,国内的一家公司脱颖而出,它从创立之初就确立了大模型「工业化落地」的方向,并已经取得了一系...……更多
小模型正在成为AI界的新宠
...相对较小,可以在本地机器上运行模型,训练和推理速度更快,适用于资源有限的环境。 可解释性更好:小模型的结构相对简单,更容易理解其决策过程。 适用范围广:小模型可以应用于各种任务,包括嵌入式设备、移动应...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布的数据,在GSM8K、HumanEval和MMLU等一系...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...型模型中提供了更显著的加速,与普通模型相比,实现了更快的 FID-50K 改进。此外,增加模型大小可以在生成和线性评估方面带来更快的增益。REPA 显著提高训练效率和生成质量最后,该研究比较了普通 DiT 或 SiT 模型与使用 REPA ...……更多
36氪获悉,近日360智慧生活集团举办视觉大模型及AI硬件新品发布会。发布会中,360推出智脑·视觉大模型及多款AI硬件产品,并宣布360智慧生活正式切入SMB市场。360方面表示,近年传统深度学习算法在安防场景中的局限性愈发突...……更多
...epSeek的优化策略,天星大模型在保持高精度的同时,能够更快地处理复杂任务,更好地适配不同行业与多种场景需求,为企业提供强大、灵活且安全可控的大模型训练、优化解决方案,满足企业级应用对实时性和准确性的严苛要...……更多
大模型涌现前,巨头涌入AI广告
...片、视频为载体的内容营销借助AIGC释放的想象力,反而更快地显现出来。前不久,钟薛高推出新品系列“Sa Saa”,该产品较以往最大的区别在于,AI参与了“Sa Saa”起名、包装、设计等多个环节;可口可乐也在同期发布一则疑似...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...预训练计算效率的同时提升大模型处理复杂任务的性能,更快地学习复杂任务的同时保证准确性。与稠密模型相比,MoE模型的预训练速度更快;使用MoE 层代替transformer 中的前馈网络(FFN)层。因而对的采用可以弥补Transformer架构...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
今日值得关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基...……更多
【重磅】OpenAI最新解密,ChatGPT的本质是无损压缩器
...活动产生了大量数据资产,但是LLM所需的训练集膨胀速度更快。根据预测,到2026年文本数据将被训练完,图像数据将在2040年左右用完。图:大语言模型对互联网存量数据消耗的预测这对于“大力出奇迹”的大语言模型来说,并...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
更多关于科技的资讯:
中国移动5G创新技术试验成功:农村网速提升17% 不增加成本
快科技2月27日消息,日前,中国移动宣布,在河北沧州完成农村场景跨通道智能功率共享外场试验,成功验证了中国移动研究院创新提出的“5G基站内生功率共享技术”
2025-02-27 00:05:00
入门价格下调3.2万!2025款奥迪A4L 200万辆悦享版上市
快科技2月26日消息,2025款奥迪A4L 200万辆悦享版于2月26日上市,共推出4款车型,指导价区间为28.98万-36
2025-02-27 00:35:00
19岁女棋手用AI作弊!中国围棋协会:禁赛8年、撤销段位
快科技2月27日消息,26日深夜,中国围棋协会发布关于撤销违规运动员秦思玥职业段位等处罚的情况通报。通报称,2024年12月15日
2025-02-27 01:05:00
本文转自:人民日报海外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型
2025-02-27 05:08:00
本文转自:人民日报海外版本报南宁电(记者庞革平)近日,广西大学人工智能学院揭牌仪式举行。广西壮族自治区政府代表、相关高校专家代表
2025-02-27 05:08:00
本文转自:人民日报常 钦近期,我国矿产勘探领域好消息频传。青藏高原,“十四五”以来累计新增铜资源量2000余万吨,形成4个千万吨级铜矿资源基地
2025-02-27 05:48:00
花木之乡搭上5G快车(大数据观察·数据里的增收故事)
本文转自:人民日报江苏沭阳县拓展应用场景,推动产业发展花木之乡搭上5G快车(大数据观察·数据里的增收故事)本报记者 白光迪数据来源
2025-02-27 05:48:00
本文转自:人民日报本报北京2月26日电 (记者刘阳)记者从国家广播电视总局获悉:电视“套娃”收费和操作复杂治理工作自2023年8月启动以来
2025-02-27 05:48:00
本文转自:人民日报常  晋营业3天,客流量达177.5万人次;日销售额最高过亿元,消费热度喜人。春节假期,位于河南许昌的胖东来商超再次“出圈”
2025-02-27 05:49:00
本文转自:人民日报许 锐当“机器”成为舞者,“人”成为“机器”的伴舞,将怎样影响艺术发展?2025年总台春晚舞蹈节目《秧BOT》引发热议
2025-02-27 05:57:00
本报讯 中国江西新闻网全媒体记者陈春伟报道:江西线上3C数码补贴来啦!即日起至2025年12月31日,消费者登录政策实施专区页面可领取3类3C数码“品类券”
2025-02-27 06:54:00
SU7 Ultra今晚发布!雷军:非常激动 小米首次冲击豪车市场
快科技2月27日消息,今晚7点,小米SU7 Ultra将正式发布,雷军一早就发文称今天非常激动。他强调,这是小米首次冲击豪车市场
2025-02-27 07:05:00
DeepSeek爆火后英伟达首份财报发布:利润大增80%
快科技2月27日消息,美东时间2月26日盘后,英伟达公布了2025财年第四季度(2024年11月1日至2025年1月31日)业绩报告
2025-02-27 07:05:00
海尔收购了汽车之家并不意外 其实这哥们搞汽车很久了
前些天,汽车之家被海尔收购了。不知道大伙儿看到这个消息,是不是和我一样这个反应:还以为说车子成了冰箱彩电是调侃来着,结果海尔你认真了
2025-02-27 07:05:00
男子照顾独居老人12年继承北京5套房引热议 网友:好人就该有好报
2月27日消息,据国内媒体报道称,男子照顾独居老人12年继承北京5套房引起了网友的热议,大家纷纷表示好人有好报。报道中提到
2025-02-27 07:05:00