• 我的订阅
  • 头条热搜
3天把Llama训成Mamba,性能不降,推理更快!
...实现方式在H100 GPU上不太好使,主要是因为GEMM操作的速度更快了,使得缓存和重新计算产生的开销更加明显。所以,作者通过融合内核以及调整实现方式来优化算法。对于验证模型,首先从缓存中重新计算之前的步骤,然后对新...……更多
人工智能基础大模型“九天”广州发布
...伴大会主论坛上,中国移动重磅发布“九天•众擎基座大模型”。作为“央企AI国家队”,中国移动勇担人工智能战略性新兴产业发展重任,牵头打造国资人工智能大平台,攻坚多类大模型,建设超大规模智算中心等。发挥算网...……更多
苹果展示ferret-uiai系统可理解应用程序
...以理解应用程序屏幕上的内容。以ChatGPT为代表的AI大语言模型(LLMs),其训练材料通常是文本内容。为了能够让AI模型能够理解图像、视频和音频等非文本内容,多模态大语言模型(MLLMs)因此孕育而生。只是现阶段MLLMs还无法...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...。可以使用LLM自动生成基础回答,人类标注者可以基于此更快地进行标注。数据多样性简单来说,如果你用特定类型的回应过度训练模型,它会倾向于给出那种回应,即使不是最合适的答案。这里的经验法则是,尽可能确保训练...……更多
...转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技术已大大改进,但仍因为无法像人类一样理解语境或在推理任务方面表现出色而受限...……更多
百度“数字人生成方法和装置”专利申请公布
...施方式包括:首先获取人格对话语料集和预先训练的语言模型;然后利用人格对话语料集对语言模型进行训练,得到人格对话模型。最后对人格对话模型对应的形象进行三维建模,得到人格对话模型对应的数字人。通过该方式生...……更多
Sora为何没能诞生在中国?
...家又一次感受到,他们没有停下,而且,前进的速度看似更快。我们之间的差距仍然存在。”国内知名大模型公司智谱AI相关负责人在接受《中国新闻周刊》采访时坦言,Sora发布后,公司最关注的是,认清差距和方向,继续追赶...……更多
AI视觉进入“大模型时代”不仅“看得见”还“看得懂”
本文转自:广州日报AI视觉进入“大模型时代”不仅“看得见”还“看得懂”智慧安防领域需求旺盛 更强调个人隐私权保护第十九届中国国际社会公共安全博览会现场。智慧安防更注重隐私保护。近日,第十九届中国国际社会...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
ChatGPT一周年,机会在大厂还是小公司?
...研究,现在大模型非常成功,它的推进速度比我们想象的更快,我和很多公司接触,发现他们底层已经都用大模型了,用大模型确实可以降低研发成本、标注数据等,它的广泛性确实非常好,可能比我们想象中还要更快。但是做...……更多
本文转自:深圳特区报AI预问诊提升效率 医学影像诊断更快更准人工智能成为深圳医生好“搭子”■ 深圳特区报记者 余海蓉2022年国家卫健委印发《医疗机构设置规划指导原则》,明确要求,医院不断推动人工智能、大数据、...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4。可能国内的小伙伴很少知道Claude,这是一个在海外备受关注且用户基数较大的一个AI模型,其从诞生以来就一直与GPT相...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...。根据测试,在谷歌搜索中内置Gemini,它能够为用户提供更快的搜索生成体验(SGE),用户在美国的英语搜索延迟降低40%,同时在质量方面也有所提高。 谷歌CEO Sundar Pichai(来源:CNBC)皮查伊表示,这次Gemini的发布对于Bard来说...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...或部门层面运行。 有关AI的伦理规范将比其他技术动荡更快地出现,既有来自私营部门又有来自公共部门。有效监管技术非常困难,但对新技术潜在隐私影响的担忧已经引发了行业和监管机构之间更早、更明智的讨论。对于安...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...能包含数十到数百个任务。如何解决呢?近年来,大语言模型在自然语言处理及各类任务的代码生成方面不断取得重大进展。同样,LLM 已经应用于机器人的多个方面,包括用户界面、任务和运动规划、机器人日志总结、成本和...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
奇瑞也造人形机器人?
...应用并不用过于执着于人类能力,先行示范或许能够跑得更快。而这种探索,也有望帮助站在全新十字路口上的奇瑞,走好全球化加速扩张的道路,全面促进奇瑞朝着科技类公司转型发展。 ……更多
对话科大讯飞刘聪:中美大模型的差距在缩小,GPT-5提升更多是在局部
...去升级,业内还提出要打造AI原生应用,这两种方式谁能更快跑通?刘聪表示,不用纠结是不是原生,或者做原生越多越好,核心还是它能否更好满足用户需求,而且能给用户和市场带来增量价值,要找到大模型在哪些场合适合...……更多
英伟达发布80亿参数的ai模型
...伟达(NVIDIA)宣布,其已成功研发并发布了一款全新的AI模型,该模型拥有高达80亿的参数规模,具备精度高、计算效率高等优点,可在GPU加速的数据中心、云和工作站上运行。据介绍,这款新发布的AI模型是基于英伟达在深度学...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...这也意味着SliceGPT可以运行在更少的GPU上,同时运行速度更快。△SliceGPT原理论文地址:项目地址:复旦大学发布NLP大模型论文,让大模型说出“我不知道”2月1日,复旦大学研究团队发布论文《Can AI Assistants Know What They Don’t Know...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...istral AI发布Mixtral 8x7B专家混合模型,表现优越且推理速度更快。由于获得更多GPU,ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其在ChatGPT开发中的核心作用。Open……更多
AIGC工具测评:生成式AI的产品表现如何
...这一年,AI展现出了前所未有的发展势头,无论是在基础模型能力、实际应用场景,还是资本投入方面都取得了显著进展。特别是在2022年11月30日,OpenAI发布了ChatGPT,标志着AI技术的一个新纪元。紧接着,在2023年1月,ChatGPT的月...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
... 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。 据阿里云官方介绍,相比上代模型,...……更多
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
...i-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模型的速率限制,并减少了延迟。新定价于 2024 年 10……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...利用少量有标签和大量无标签数据视频数据来训练自己的模型,并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...式智算平台产品——大云震泽智算平台,助力大模型训得更快、训得更稳。大云震泽智算平台针对千亿、万亿大模型训练所需,提供异构算力调度、万卡并行训练、断点自动续训、通智边一体化训推服务,承载训练及大颗粒算力...……更多
更多关于科技的资讯:
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00