• 我的订阅
  • 头条热搜
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
五福节成AI互动应用练兵场 支付宝技术迭代提速
...构集群的能力,其硬件算力效率已超过60%;以及软件上对推理效率和训练效率的优化,其中推理效率提升了2.3倍,处于业界先进水平。此外,蚂蚁的CPU利用率从2017年的不到10%,提升到了2022年的33%。以支付宝推出的业内率先多人A...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...token(文本处理最小单位)数量相较于文本及图片模型的推理,有望成数量级增长,判断Sora将刺激推理算力需求将持续上升。此外,推理端token增加、算力需求的增长,也对显存及带宽提出更高要求,预计将拉升400G光通信技术在...……更多
有道AI学习机X20面世 首创学习机学练机电脑三合一模式
...的10000+正版优质图书。 “子曰”教育大模型引领教育新范式在学练机模式下,X20是最好的助考帮手,内置的《5.3》海量正版真题,涵盖小初高全学科上千本中高考同源习题册,构筑起智能化的日常“考场”,检验每一点细微的...……更多
...能设备或家庭服务器上,使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容,而且更精准、贴切,甚至根据用户的思维模式预测任务,并自主寻找解决方...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...大地超越传统的机器算法的精度,掀起了一种全新的研究范式;一直到2019年GPT-2的实现,它提供了自然流畅的文本内容的生成能力,彼时GPT-2的应用Talk2Transformer确实让大家很惊艳,当然对比现在的ChatGPT以及我们自己的ChatGLM等一...……更多
美图大模型再更新,创始人吴欣鸿:全员拥抱AI,今年研发投入将超6亿元
...节他也更具体地展开,训练部分主要采用A100与A800的卡,推理部分使用了V100、T10等多种型号,“比如做AI动漫这样视频类的,大模型推理能够用到约8000 张卡一天。”但他也表示算力目前对美图而言不是很大的成本压力,也不会...……更多
...计算和边缘计算这“四大计算”融合,正催生全新的计算范式;通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台, AI治理将引领我们踏上更智慧、更安全的未来。此外,数字交互引擎在高效构...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...、视觉数据的准确标注、分布式训练集群的工程化,以及推理成本的管控。▲来自 inf2.xl 实例上部署的 Stable Diffusion 模型这些经验为参与者提供了关于有效管理视频数据、提高模型训练效果和性能、构建高效训练集群以及管理推...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...大能力,分别为:文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力,并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量,科大讯飞也做了多方面的准备。一方面,科大讯飞积极展开与业内巨头的合...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先,开普云将不断完善...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
掰开安卓手机 满屏都是三个字:大模型
...的内存单元,是大模型进手机面临的第二道难关:大模型推理需要大量计算资源做支撑,与此同时,内存大小决定了数据处理速度的上限以及推理的稳定性。另外,在手机上跑大模型,也给电池带来了更大的压力。因此芯片能耗...……更多
...表示,大模型提供了发展通用硬件和软件的机会。传统AI范式利用特定的算法和规则完成特定任务,生成式AI范式是基于一种称为基础模型的通用模型,通过广泛文本数据的训练,在开领域(open domain,开域)内可以生成类似人类...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... 和 ChartQA,它们不仅需要理解,还需要对图表进行强大的推理能力。对于这两个基准,PaLI-3 稍微落后于 PaLI-X。另外,研究人员还扩展了 PaLI-3 的功能,使其能够通过语言类似的输出来预测分割遮罩。实验结果表明,对于这种类...……更多
OPPO:用AndesGPT迎接下一个十年
...打法:在AndesGPT的定义中,“对话”是GPT记忆能力、逻辑推理能力、模糊意图理解能力、生成能力等等的一个集合,作为大模型与用户沟通的桥梁,“对话”的重要性不言而喻。面对这座大山,坚持长期主义的OPPO做出了与“愚公...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...加速卡等。相比于通用服务器,AI服务器更适应AI训练和推理的大算力、高并发、大数据流转等需求,已经成为大模型时代的“香饽饽”。以热门AI服务器型号浪潮NF5688M6服务器为例,某代理商在电商平台上挂出125万元的价格,这...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...析。 因此,Transformer 架构的引入为具身智能领域带来了范式革新,使真正智能的具身机器人成为可能。这种变革可类比于从功能手机向智能手机的演进,具身智能机器人的优势正在于它所具备的交互性与通用性,即一种在开放...……更多
中信建投第四范式业绩前瞻:买入评级 预计去年营收40.7亿
中信建投(22.970, 0.10, 0.44%)发布第四范式(06682)首次覆盖报告,考虑到公司的AI平台化能力及成长性,下游优质客户占比高,技术积累深厚,参考海外可比公司估值,给予“买入”评级。预计公司2023-2025年营业收入分别为40.7、51....……更多
赛道Hyper | AI PC渐近:联想抢占第一入口
...。由此,并行算力的飞跃使得PC能轻松执行复杂的AI模型推理任务,从而展现出更高级的智能性。这就是AI PC的算力基础特性。有别于传统PC的CPU和GPU分列,缺乏NPU的算力结构。除了芯片商积极参与,PC操作系统开发商微软、终端...……更多
估值180亿美元,马斯克造了一家“AI独角兽”
...rok模型,那么特斯拉汽车可能可以拥有世界上最大的可用推理计算能力。甚至有人指出,Grok可能会取代特斯拉目前的语音控制系统。除了与X等的集成,Grok本身也将被以独立应用的形式提供给用户,这意味着用户不仅可以在X平...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...用于自身业务优化并对外开放合作。 大模型分为训练和推理两个过程,前者将大模型训练成型,后者即为应用。由于训练大模型需极大算力,开发成本高昂,业界多有关于不需“重复造轮”的讨论。例如,入场做大模型后,百...……更多
“整活”保险业务,AI大模型哪家强?
...目前更擅长信息的检索,类似于知识图谱的能力,在逻辑推理方面还需进一步提升。“整体而言,对于营销应用和合规风控方面,由于涉及更复杂的业务规则和风险判断,大模型的能力还需要进一步提升。”朱克力基于《报告》...……更多
...本文转自:人民日报客户端田泓3月18日,临港集团与第四范式举行战略合作签约仪式,第四范式华东区域总部拟落户临港集团下属漕河泾开发区,双方将在临港集团相关园区合作建立“三中心一平台”(人工智能产业赋能中心、...……更多
大模型这把“火”,烧到了人形机器人
...脑”负责运动控制,“大脑”则主导机器人的环境感知、推理决策和语言交互。而大模型的出现,将语义理解能力和推理生成能力引入其中,相当于给人形机器人换了个“大脑”。大模型对人形机器人的提升主要体现在两个方面...……更多
不要苛责中国大模型公司的盈利
...上下文,自动选择模型的多模态能力,同时实现了更快的推理速度和更多并发。GLMs的个性化智能体定制能力,则被认为是直接瞄准了GPTs。目前,国内敢说自己的大模型比肩GPT-4的,只有智谱AI和百度两家公司。虽然这两家公司从...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就...……更多
更多关于科技的资讯:
“文创师”与“文创热”(新职·新知⑯)
本文转自:人民日报海外版文创产品策划运营师——“文创师”与“文创热”(新职·新知⑯)徐嘉伟 席雨柯《 人民日报海外版 》( 2024年08月26日 第 05 版)之间文化设计的考古探方体验课程现场
2024-08-26 04:44:00
本文转自:人民日报海外版加快研究型数字人才培养中国数据要素新锐学者项目启动《 人民日报海外版 》( 2024年08月26日 第 09 版)本报上海电 (记者沈文敏)近日
2024-08-26 04:44:00
本文转自:人民日报海外版卢泽华《 人民日报海外版 》( 2024年08月26日 第 08 版)“还车难”这个“小难题”
2024-08-26 04:44:00
西数将剥离SSD及NAND闪存业务:估值可达220亿美元
快科技8月25日消息,据媒体报道,自2021年起西部数据和铠侠(Kioxia)就NAND闪存生产业务合并一直在谈判,不过最终因计划遭到了铠侠重要的间接股东SK海力士的强烈反对
2024-08-25 19:58:00
4411米!国产飞机ARJ21飞到世界最高民用机场
8月25日,一架ARJ21飞机从成都双流国际机场起飞,经过44分钟的飞行,顺利抵达稻城亚丁机场。这是正在进行的ARJ21飞机“环青藏高原”演示飞行的重要一站
2024-08-25 20:28:00
小伙用激光网杀蚊子:有生化危机的感觉了!
虽然夏天快要过去了,但蚊子带来的困扰并没有消失。喜欢下楼打个水的工夫就被咬了8个包的极致围攻体验吗?感觉自己站在外面就跟自助餐一样
2024-08-25 20:58:00
中国石化每天净赚2亿元!股东分红高达近50%
8月25日,中国石化发布2024年中期业绩报告,经营业绩良好,同时发布了未来三年的股东分红回报规划。按照国际财务报告准则
2024-08-25 20:58:00
吉林一号卫星带你看浪漫的土耳其:古代城墙、现代建筑
我想要带你去浪漫的土耳其,然后一起去东京和巴黎。其实我特别喜欢迈阿密,和有黑人的洛杉矶……这首《带你去旅行》充满了对某些国家和城市的美好想象
2024-08-25 21:58:00
新上市!秋初才有的鲜美果子 错过真的太太太遗憾了
最近,真的超级超级羡慕陕西人,原因很简单,那就是——初秋限时限量供应的美食,鲜核桃,上市了!如果你问鲜核桃有多好吃,简直可以写 1000 字小作文来抒发我的爱意
2024-08-25 22:28:00
可恩口腔与蚂蚁消金强强联合 开启全民口腔健康服务新篇章
8月22日,可恩口腔医疗集团与蚂蚁消金在可恩口腔医疗集团旗舰院区海晏门分院举行了一场意义非凡的战略合作签约仪式。蚂蚁消金线下场景业务部总经理裘荣华先生
2024-08-25 19:50:00
本文转自:人民网-贵州频道2024中国国际大数据产业博览会(以下简称:数博会)将于8月28日至30日在贵阳市举行,贵州好一多乳业股份有限公司(以下简称
2024-08-25 20:13:00
本文转自:人民网-贵州频道2024中国国际大数据产业博览会将于8月28日至30日在贵阳市举办,中国移动通信集团有限公司(以下简称
2024-08-25 20:14:00
本文转自:人民网-贵州频道2024中国贵阳国际大数据产业博览会将于8月28日至30日在贵阳召开,作为中国钢结构行业竞争力榜首企业
2024-08-25 20:14:00
本文转自:人民网-贵州频道8月29日,2024中国—阿拉伯国家大数据产业投资合作洽商会(以下简称:2024中阿大数据投洽会)作为2024中国国际大数据产业博览会专业展的重要活动之一
2024-08-25 20:14:00
“令人惊叹的中国科技!”清华国际青年走进贵安感受贵州数字魅力
8月24日下午,清华国际青年对话贵州行活动走进贵阳贵安,国际青年参观贵安新区规划展示厅,游览贵安数据中心集群,感受贵州数字时代的强劲脉搏
2024-08-25 16:05:00