• 我的订阅
  • 头条热搜
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...lama 3-V 70B相媲美。NVLM-X1.0还有一个优势:训练和推理速度更快。开源的多模态大型语言模型,如LLaVA-OneVision 72B和InternVL-2-Llama3-76B,在多模态训练后在纯文本任务上表现出显著的性能下降;相比之下,NVLM-1.0模型的纯文本性能甚至.……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...也进一步推动AI普惠风。 一、智谱“清影”上线:速度更快、更为可控、画面更连贯速度上,智谱生成式视频模型的推理速度提升了6倍,生成6s视频只需花费30s,这意味着更快的创作周期、更高的实时性、更流畅的生成,以及...……更多
AI PC是噱头还是更快的马车?
...tra5125H包含7个。而且,这一代核显还支持AV1硬编码,可以更快速地输出高质量、高压缩率的视频。凭借领先的编解码能力,ArcGPU确实在视频剪辑行业积累的良好的口碑。随着矢量引擎能力的大幅度提升,大量内容创作ISV的演示了...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...的 7B MLLM (e.g., LLaVA1.5 和 SPHINX),但我们优先使用更小更快的 Mamba-2.7B 来平衡机器人模型的效率。在未来,我们计划为资源不受限制的场景开发 RoboMamba-7B。 2. 机器人推理能力评估(RoboVQA Benchmark)另外,为了全面比……更多
oppo首个端侧应用70亿参数大模型findx7系列
...式的视觉模型,在保障用户隐私安全的情况下,带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型,FindX7系列将带来自然语言理解、文本内容摘要、通话语音摘要...……更多
以公共预览形式,微软开放AI计算机视觉模型Florence
...用户免受任何潜在有害内容的侵害,增强安全性,并允许更快的事件响应时间。Florence通过自动字幕、智能裁剪、分类、消除背景干扰和图像搜索提供用户友好的内容发现。更重要的是,用户可以通过符合道德规范的AI实施来跟...……更多
云测数据:为人工智能提供专业、高效的AI数据服务
...值数据支持,实现场景数据专业化、高质量交付,帮助企业更快更好地实现AI应用成功落地。与此同时,云测数据也一直推动着AI数据标准化体系建设,先后参与编制了《智能网联汽车激光雷达点云数据标注要求及方法》、《智能网联...……更多
最新美国国家人工智能科学院院士介绍
...她专注于元学习和强化学习,致力于让机器学习系统能够更快地适应新任务和环境。Finn的研究有助于提升人工智能系统的灵活性和泛化能力,为未来的智能系统发展开辟了新的道路。DaniYarowsky,来自约翰斯·霍普金斯大学(JohnsH...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...能和响应速度,使得模型的训练过程更加高效,收敛速度更快,性能更稳定。同时也得益于云从科技长期在视觉、语言领域的深厚积累和不断创新。图 4:从容大模型 - 2.0 多模态能力示例此前,从容大模型已在视觉、跨模态领域...……更多
人均年薪100万,手机厂商数百亿开卷大模型
...据不用上传到云端。与此同时,端侧大模型的响应速度会更快,一种最极端的情况就是即便在没有网络的情况下,端侧大模型依然可以使用,而云上大模型在没有网络情况下则无法使用。此外,云上大模型的调用成本高昂。“一...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...经走到了比拼技术商业化的攻坚阶段,比拼的是谁落地得更快,谁的落地更实用。就在这波降低技术门槛、优化模型的大潮中,国内的一家公司脱颖而出,它从创立之初就确立了大模型「工业化落地」的方向,并已经取得了一系...……更多
小模型正在成为AI界的新宠
...相对较小,可以在本地机器上运行模型,训练和推理速度更快,适用于资源有限的环境。 可解释性更好:小模型的结构相对简单,更容易理解其决策过程。 适用范围广:小模型可以应用于各种任务,包括嵌入式设备、移动应...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布的数据,在GSM8K、HumanEval和MMLU等一系...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...预训练计算效率的同时提升大模型处理复杂任务的性能,更快地学习复杂任务的同时保证准确性。与稠密模型相比,MoE模型的预训练速度更快;使用MoE 层代替transformer 中的前馈网络(FFN)层。因而对的采用可以弥补Transformer架构...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
真香!智谱大模型,有了首个免费的API
...。与此同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...他模型,MoE大模型应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。 在上一代“天工2.0”MoE大模型的领先基础上,“天工3.0”更是实现了全面的性能升级,其采用4000亿级参数MoE混合专家模型架...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
...作提质增效,节约时间成本近80%,让客户在咨询问题后时更快得到专业答复,提升客户体验。通过使用Text-To-Text(从文本到文本)的逻辑以及大语言模型参数涌现下的自学习能力,模型训练效率提升超90%。据了解,该模型未来将...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包大模型在文生图模型方面的技术升级。李亮表示,豆包...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...GETTY IMAGES) “我们试图让大语言模型在谷歌内部运行得更快,并取得了一些进展,但实现这一目标仍很困难。”Pope说,“在谷歌内部,有很多人希望对芯片进行各种改动,因此我们很难只专注于大语言模型的开发。为此,我们...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...现,业内其实早有预期,但仍有人评价称“比想象中来得更快”,亦有人振奋地表示“我们真的看到新工业革命来临”。2月16日,业内分析人士对记者表示,Sora无疑是人工智能领域的一次重大突破,该技术不仅展示了AI在理解和...……更多
更多关于科技的资讯:
iPhone 16交货时间缩短,成近年最不受欢迎一代
2024年9月26日,摩根士丹利在研报中指出,iPhone16的交货时间较前几代产品明显缩短,这说明该产品的受欢迎程度可能不及预期
2024-09-26 20:20:00
星纪魅族举办AI生态发布会,AI 手机、智能穿戴设备登场
9月25日消息,在今日举办的星纪魅族AI生态发布会上,星纪魅族科技有限公司展示了其在智能手机、智能穿戴设备和智能汽车领域的最新产品
2024-09-26 20:21:00
一加13保密壳背板外观曝光,或采用苹果同款长焦方案
9月26日消息,继此前一加中国区总裁李杰透露一加13即将上市后,业内也开始传出这台新机的更多信息。数码博主@数码闲聊站发文展示了一加13的保密壳背板外观
2024-09-26 20:21:00
比苹果还薄!高管晒出vivo小屏旗舰新机照片
近日,vivo产品经理韩伯啸在微博中晒出了一组图片,为网传了许久的vivo“小屏旗舰”手机,从微博显示的机型名称可以得知
2024-09-26 20:21:00
魅族 Lucky 08评测:兼具高颜值的旗舰级AI手机
近年来,AI技术愈发火热,诸多智能手机厂商都纷纷在手机内集成AI大模型相关技术。魅族则直接推出了一款AI手机——魅族Lucky08
2024-09-26 20:21:00
为了一个边框投入上亿,OPPO真是下血本
大家还记得iPhone16系列正式发布之后,刘作虎晒出一张图片。当时行业猜测这是OPPOFindX8系列中某款机型与iPhone16Pro系列的R角对比图
2024-09-26 20:21:00
Redmi Note 14 Pro进水保修,王腾玩大了
按照行业惯例支持防水的手机,一旦进水之后厂家都是不保修的。这也引起很多用户的不满,甚至有iPhone用户为此来起诉苹果
2024-09-26 20:21:00
解释vivo X200,顺手捧了一下小米14,蓝厂格局真大
10月份的旗舰非常有意思,目前只有vivoX200系列确认了发布日期,但是官方却一点都不预热。反而是还没有确认发布日期的OPPOFindX8系列
2024-09-26 20:22:00
摩根士丹利发报告,iPhone 16系列销量不如预期
不知道大家发现没有今年iPhone16系列的热度远远不如前几年,现在已经几乎看不到讨论iPhone16系列的,即使有也是关于iPhone16系列销量不如预期的
2024-09-26 20:23:00
刺激!小米15、荣耀Maigc7都在抢骁龙8Gen 4首发
现在已经确认联发科天玑9400将在10月9日正式发布,vivoX200系列将在10月14日正式发布,全球首发联发科天玑9400
2024-09-26 20:23:00
vivo OriginOS5官方自爆,这四个界面信息量巨大
都知道vivo在10月份会很忙,但率先出现的并不是vivoX200系列,而是OriginOS5.0操作系统。根据官方的信息vivo2024开发者大会将在10月10日举行
2024-09-26 20:23:00
Redmi K80系列电池容量曝光,王腾够狠
不知道大家发现这一波关于高通骁龙8Gen4机型的讨论之中,除了主品牌的机型之外iQOO13、一加13等子品牌的机型也在不断爆料之中
2024-09-26 20:23:00
vivo与郑钦文达成合作,蓝厂小屏旗舰命名确认
大家都知道今年vivoX20系列共有三款机型,除了标准版与Pro之外还有一个小屏旗舰。这是新加的机型,如何命名成为行业关注的焦点所在
2024-09-26 20:23:00
Redmi发布会有创新,王腾不请媒体和粉丝
常规的新机发布会,各品牌都会邀请媒体和粉丝到现场参加。特别是会邀请很多媒体进行报道,即使是线上的发布会,也会邀请一些重量级的媒体到现场
2024-09-26 20:23:00
推动算力交易,赋能产业发展
本文转自:人民日报海外版贵州打造面向全国的算力保障基地:推动算力交易,赋能产业发展本报记者 陈隽逸《 人民日报海外版 》( 2024年09月27日 第 08 版)贵州贵阳大数据科创城一角
2024-09-27 05:00:00