更快,模型,视觉,语言,训练,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

3天把Llama训成Mamba，性能不降，推理更快！

...实现方式在H100 GPU上不太好使，主要是因为GEMM操作的速度更快了，使得缓存和重新计算产生的开销更加明显。所以，作者通过融合内核以及调整实现方式来优化算法。对于验证模型，首先从缓存中重新计算之前的步骤，然后对新...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

人工智能基础大模型“九天”广州发布

...伴大会主论坛上，中国移动重磅发布“九天•众擎基座大模型”。作为“央企AI国家队”，中国移动勇担人工智能战略性新兴产业发展重任，牵头打造国资人工智能大平台，攻坚多类大模型，建设超大规模智算中心等。发挥算网...……更多

2023-10-12 21:49:00人工智能,广州,九天,人工,模型,智能

苹果展示ferret-uiai系统可理解应用程序

...以理解应用程序屏幕上的内容。以ChatGPT为代表的AI大语言模型（LLMs），其训练材料通常是文本内容。为了能够让AI模型能够理解图像、视频和音频等非文本内容，多模态大语言模型（MLLMs）因此孕育而生。只是现阶段MLLMs还无法...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...。可以使用LLM自动生成基础回答，人类标注者可以基于此更快地进行标注。数据多样性简单来说，如果你用特定类型的回应过度训练模型，它会倾向于给出那种回应，即使不是最合适的答案。这里的经验法则是，尽可能确保训练...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

混合架构赋予AI人类推理能力

...转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技术已大大改进，但仍因为无法像人类一样理解语境或在推理任务方面表现出色而受限...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

百度“数字人生成方法和装置”专利申请公布

...施方式包括：首先获取人格对话语料集和预先训练的语言模型；然后利用人格对话语料集对语言模型进行训练，得到人格对话模型。最后对人格对话模型对应的形象进行三维建模，得到人格对话模型对应的数字人。通过该方式生...……更多

2023-12-19 18:43:00专利申请,装置,生成,专利,数字,方法

Sora为何没能诞生在中国？

...家又一次感受到，他们没有停下，而且，前进的速度看似更快。我们之间的差距仍然存在。”国内知名大模型公司智谱AI相关负责人在接受《中国新闻周刊》采访时坦言，Sora发布后，公司最关注的是，认清差距和方向，继续追赶...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

AI视觉进入“大模型时代”不仅“看得见”还“看得懂”

本文转自：广州日报AI视觉进入“大模型时代”不仅“看得见”还“看得懂”智慧安防领域需求旺盛更强调个人隐私权保护第十九届中国国际社会公共安全博览会现场。智慧安防更注重隐私保护。近日，第十九届中国国际社会...……更多

2023-11-12 05:33:00模型,视觉,时代,模型,安防,视觉

Yandex推出开源大语言模型训练工具，称可节省高达20%的

...球科技公司Yandex推出了YaFSDP，这是一种用于训练大型语言模型(LLM)的开源方法。据介绍，YaFSDP是目前在大型语言模型训练中增强图形处理器（GPU）通信并减少内存使用量的公开可用的最有效工具，与FSDP相比，根据架构和参数数量...……更多

2024-06-18 16:13:00处理器,图形,模型,高达,训练,语言

ChatGPT一周年，机会在大厂还是小公司？

...研究，现在大模型非常成功，它的推进速度比我们想象的更快，我和很多公司接触，发现他们底层已经都用大模型了，用大模型确实可以降低研发成本、标注数据等，它的广泛性确实非常好，可能比我们想象中还要更快。但是做...……更多

2023-12-07 09:42:00大厂,还是,机会,公司,模型,王小川

人工智能成为深圳医生好“搭子”

本文转自：深圳特区报AI预问诊提升效率医学影像诊断更快更准人工智能成为深圳医生好“搭子”■ 深圳特区报记者余海蓉2022年国家卫健委印发《医疗机构设置规划指导原则》，明确要求，医院不断推动人工智能、大数据、...……更多

2024-06-03 07:17:00生好,人工智能,深圳,人工,智能,医生

GPT-4最强对手出现！Claude-3 AI模型发布

...凌晨Anthropic公司宣布Claude-3正式发布，带有三个高性能的模型形态，并宣布在AI逻辑基准测试中超过了ChatGPT-4。可能国内的小伙伴很少知道Claude，这是一个在海外备受关注且用户基数较大的一个AI模型，其从诞生以来就一直与GPT相...……更多

2024-03-10 18:27:00模型,对手,模型,处理,能力,前代

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...。根据测试，在谷歌搜索中内置Gemini，它能够为用户提供更快的搜索生成体验（SGE），用户在美国的英语搜索延迟降低40%，同时在质量方面也有所提高。谷歌CEO Sundar Pichai（来源：CNBC）皮查伊表示，这次Gemini的发布对于Bard来说...……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

回顾GPT大模型2023这一年，5大顶级公司预测2024年A

...或部门层面运行。有关AI的伦理规范将比其他技术动荡更快地出现，既有来自私营部门又有来自公共部门。有效监管技术非常困难，但对新技术潜在隐私影响的担忧已经引发了行业和监管机构之间更早、更明智的讨论。对于安...……更多

2023-12-01 15:02:00模型,顶级,产品,公司,模型,人工智能

语言、机器人破壁，MIT等用GPT-4生成模拟任务，并迁移到

...能包含数十到数百个任务。如何解决呢？近年来，大语言模型在自然语言处理及各类任务的代码生成方面不断取得重大进展。同样，LLM 已经应用于机器人的多个方面，包括用户界面、任务和运动规划、机器人日志总结、成本和...……更多

2023-10-17 16:58:00机器人,生成,机器,任务,语言,世界

720亿参数模型开源通义千问已实现“全尺寸、全模态”开源

本文转自：新华网12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI fo...……更多

2023-12-01 13:33:00通义,模态,模型,尺寸,参数,模型

奇瑞也造人形机器人？

...应用并不用过于执着于人类能力，先行示范或许能够跑得更快。而这种探索，也有望帮助站在全新十字路口上的奇瑞，走好全球化加速扩张的道路，全面促进奇瑞朝着科技类公司转型发展。 ……更多

2024-05-16 15:06:00奇瑞,人形,机器人,机器,奇瑞,机器人

对话科大讯飞刘聪：中美大模型的差距在缩小，GPT-5提升更多

...去升级，业内还提出要打造AI原生应用，这两种方式谁能更快跑通？刘聪表示，不用纠结是不是原生，或者做原生越多越好，核心还是它能否更好满足用户需求，而且能给用户和市场带来增量价值，要找到大模型在哪些场合适合...……更多

2024-08-07 07:05:00讯飞,中美,局部,模型,差距,对话

英伟达发布80亿参数的ai模型

...伟达（NVIDIA）宣布，其已成功研发并发布了一款全新的AI模型，该模型拥有高达80亿的参数规模，具备精度高、计算效率高等优点，可在GPU加速的数据中心、云和工作站上运行。据介绍，这款新发布的AI模型是基于英伟达在深度学...……更多

2024-08-24 05:15:00英伟,模型,参数,模型,英伟,应用

“AI春晚”背后的故事

算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今，仍然面临技术上的诸多挑战。瞄准这些“痛点”，智源研究院放了个大招。在北京智源大会上，涵盖大语言模型、多模态大模型、具身智能大模型...……更多

2024-06-16 23:38:00背后,故事,模型,智能,技术,研究院

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...这也意味着SliceGPT可以运行在更少的GPU上，同时运行速度更快。△SliceGPT原理论文地址：项目地址：复旦大学发布NLP大模型论文，让大模型说出“我不知道”2月1日，复旦大学研究团队发布论文《Can AI Assistants Know What They Don’t Know...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

1890美元，就能从头训练一个还不错的12亿参数扩散模型

...只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。现阶段，视觉生成模型擅长创建逼真的视觉内容，然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多

2024-07-30 09:37:00从头,模型,训练,参数,掩蔽,训练

谷歌DeepMind推Imagen2；ChatGPT Plu

...istral AI发布Mixtral 8x7B专家混合模型，表现优越且推理速度更快。由于获得更多GPU，ChatGPT Plus重新开放订阅，提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物，表彰其在ChatGPT开发中的核心作用。Open……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

AIGC工具测评：生成式AI的产品表现如何

...这一年，AI展现出了前所未有的发展势头，无论是在基础模型能力、实际应用场景，还是资本投入方面都取得了显著进展。特别是在2022年11月30日，OpenAI发布了ChatGPT，标志着AI技术的一个新纪元。紧接着，在2023年1月，ChatGPT的月...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

AI潮起共筑数智之基

...，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国建设注入更加强劲动能。集聚...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

... 2 日消息，阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL，并推出 2B、7B 两个尺寸及其量化版本模型。同时，旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台，用户可直接调用。据阿里云官方介绍，相比上代模型，...……更多

2024-09-03 09:45:00二代,通义,阿里,模型,视觉,语言

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能

...i-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%，提高了两种模型的速率限制，并减少了延迟。新定价于 2024 年 10……更多

2024-09-26 09:51:00进化,更快,模型,成本,性能,模型