• 我的订阅
  • 头条热搜
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
金山办公:年初就备了较大的算力供应 推理和训练算力充足 【金山办公:年初就备了较大的算力供应 推理和训练算力充足】《科创板日报》18日讯,据一财网17日晚间报道,拜登政府10月17日更新了针对人工智能芯片的出口管制...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展,提升社会效率。...……更多
王文静丨网络评分断崖式下跌,《白夜破晓》冤吗?
...绩。 说到底,刑侦题材就是要在社会现实、悬疑指数和推理逻辑上找到平衡,否则,要么是被劲爆而富有冲击力的情节和场面裹挟,成为\"爽\"字当头的暴力审美;要么就会叙事机械、戏剧冲突淡化,悬疑的元素稀释被弃剧。原...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
《逆水寒手游》即将开启盲盒测试,探案玩法曝光!
在国内的武侠游戏中,最常见的推理、断案要素是比较受玩家喜爱的。推理相关的玩法设定,可以让剧情增添了一些可玩性。而《逆水寒》手游也做了如此深层次的融合。并制作了新颖的案件还原系统,以保证探案更具代入感...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...tical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也...……更多
综艺《魔方新世界》借博弈与推理探讨人性“寓言”
...端讯(中青报·中青网记者 蒋肖斌)由芒果TV推出的博弈推理综艺《魔方新世界》于近期开播,截至目前,微博主话题阅读量4.2亿。其多变的游戏玩法和充满变数的游戏过程,吸引了不少观众进行探讨和解读。《魔方新世界》创...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
华为联合WPS AI,见证昇腾大模型推理应用启航
...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
推综“迷路”,平台乱斗
文|犀牛娱乐,作者|方正,编辑|朴芳推理综艺烧脑,烧的是观众的脑,更烧的是平台开发者们聪明的大脑。就在近期,爱优腾芒齐卷推综,四平台四档新节目,俨然一场“智斗”大戏。最先出招的优酷,于3月底上线的《盒子...……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...行评分。最后,强化微调加强了模型在处理领域问题时的推理能力,并提升了在特定任务上的准确性。对于那些要求高精确性和专业知识的领域,强化微调将会发挥至关重要的作用。从OpenAI的官方演示中不难看出,强化微调的效...……更多
...理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Lla...……更多
沉浸式感受悬案 《旁观者报告》邀观众一道推理寻真相
大型沉浸式硬核推理悬疑话剧《旁观者报告》,即将于11月3日在繁星戏剧村首演,带领观众进入一个全新的探案世界。 2023年北京的朔冬,两名警察对于真相的执念被还原在一个封闭的空间里。故事从正在参与刑侦主题的club活...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
《开推2》突发状况,宣传半月正片全无踪影,迪丽热巴又接到烂饼
...,争夺热度,生怕落后于别人。而让人不解的是,《开始推理吧2》这档已经预热了大半个月的正片,却迟迟没有上线,非常反常。在剧宣和综艺宣传方面,提前一周预热是最佳选择,特别是在发布会之后,尽快上线可以抢占先...……更多
大型沉浸式硬核推理悬疑话剧《旁观者报告》首演圆满成功!
来源:极目新闻集合了悬疑、推理、情感等元素的视听盛宴,大型沉浸式硬核推理县疑话剧《旁观者报告》,在北京繁星戏剧村成功首演,吸引了大量观众和戏剧爱好者。《旁观者报告》以刑侦为主线,故事从正在参与刑侦主...……更多
超强AI来袭!OpenAI最新AI模型 “草莓”即将上线,推理能力惊艳
...但其实这个模型的能力可不容小觑,它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道,“草莓” 模型将视为一种推理模型,这意味着它能够处理一些需要多步骤来完成的请求,比如解答难度较大的代数题,...……更多
...科技:公司智慧车管等系统化产品已完成华为昇腾Atlas300I推理卡等兼容性测试 【多伦科技:公司智慧车管等系统化产品已完成华为昇腾Atlas300I推理卡等兼容性测试】财联社11月15日电,多伦科技公告,“公司作为华为昇腾AI产业...……更多
《古龙风云录》香囊故事线索推理攻略
...探索时有一些主线或是支线需要通过收集各种线索来完成推理,推理有不同结论可以拿到不同奖励,本期将分享的是第二章的香囊故事线索收集和推理。古龙风云录香囊故事线索推理攻略玩家先要前往折花苑外找到围事和旁边的...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...在上海大学举行的总决赛。据悉,今年的赛题包括大模型推理优化、渗流数值模拟,以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
从2023年1月11日00:00起,您在《推理学院》消费的金币数量,将统计到春节相关活动中。活动开始后,您可根据已累计的金币消费数量领取“年度魅力王”奖励和参与“年度魅力王”排名。特别注意1、通过商城购买金砖、金元宝...……更多
《古龙风云录》失踪的梅二线索推理
...草堂触发这个支线,需要找到梅二,同时在破庙还有一场推理,具体流程来看下文中介绍吧。古龙风云录失踪的梅二线索推理1.先找到梅花草堂骑鹿,和骑鹿对话可以触发“失踪的梅二”支线。2.前往荒郊破庙,庙门口见到梅二...……更多
专家也不如AI了:GPT-4o道德推理能力已比专家更强
快科技6月24日消息,最新研究显示,人工智能在道德推理方面的能力可能已经超越了人类专家。美国北卡罗莱纳大学教堂山分校和艾伦AI研究所的研究人员开展的两项研究中,OpenAI的新型聊天机器人GPT-4o在提供道德建议方面,被...……更多
更多关于科技的资讯:
本文转自:人民日报海外版新定位、新布局、新应用:人工智能引领香港新质生产力发展方向《人民日报海外版》(2025年01月09日第 03 版)香港新界清水湾半岛
2025-01-09 04:45:00
回到“校园”做创客
本文转自:人民日报海外版本报记者 孙亚慧蒋天仪团队深入社区,免费为电动车提供电池检测服务。周明月正在进行液流电池充放电测试
2025-01-09 06:17:00
中国量子计算产业按下“加速键”
本文转自:人民日报海外版本报记者 杨俊峰2024年12月25日,在安徽省合肥市知冷低温科技有限公司的生产车间内,技术人员正对量子计算领域关键设备稀释制冷机进行换热组件的精密安装
2025-01-09 06:17:00
科技守护候鸟越冬(美丽中国)
本文转自:人民日报人工智能监测、无人机巡护、算法推演,多地创新手段——科技守护候鸟越冬(美丽中国)《人民日报》(2025年01月09日第 15 版)鄱阳湖国家级自然保护区内的候鸟
2025-01-09 06:28:00
江苏集萃智能制造技术研究所有限公司——一日斩获两订单,墙内墙外“双开花”□南京日报/紫金山新闻记者江芬芬“开工就是双喜临门
2025-01-09 08:23:00
集聚相关企业160家,总估值超百亿元麒麟崛起“中科系”创新高地□南京日报/紫金山新闻记者孙秉印通讯员麒轩集聚160家“中科系”科技创新企业
2025-01-09 08:23:00
拼颜值、比工艺,每天可产360万只 你手中的奶茶纸杯可能产自这里
□南京日报/紫金山新闻记者陈燕飞你常喝的奶茶、咖啡,精美的纸杯可能来自南京的周边城市。喝奶茶是时下年轻人流行的生活方式
2025-01-09 08:23:00
南京这台机器人斩获国际设计最高奖
南京这台机器人斩获国际设计最高奖企业自主研发,已应用到南京南站P5停车场南京南站P5停车场应用的轨道机器人。南京日报/紫金山新闻记者 何钢 摄南报网讯(记者何钢通讯员杨喜)在车流穿梭的南京南站P5停车场
2025-01-09 08:24:00
聚焦医工交叉南医大教学创新产品实现市场转化南报网讯(记者何洁)前不久在南京举行的2024中国高校科技成果展示会上,南京医科大学带来的一套医理工融合系列教学创新产品亮相并受关注
2025-01-09 08:24:00
车厘子砂糖橘,南京人最爱买的年货水果
春节临近,众彩批发市场水果销售正旺车厘子砂糖橘,南京人最爱买的年货水果□南京日报/紫金山新闻记者张可 实习生王一清春节进入倒计时
2025-01-09 08:24:00
去年以来,杭州市中心和余杭区、临平区都投放了不少亲子版公共自行车。最新数据统计,杭州的亲子版公共自行车已超过15000辆
2025-01-09 08:28:00
小米众筹被抢光的爆品!米家智能健腹轮上架:199元
快科技1月9日消息,小米最新在京东、天猫等平台上架了米家智能健腹轮,售价199元。目前已经开启预售,1月13日10:00支付尾款
2025-01-09 08:49:00
昆明到上海火车票打2折仅53.5元 为啥这么便宜
1月9日消息,近期,一张从昆明至上海仅需53.5元的返乡车票引发了广泛关注。这张车票属于春运期间铁路部门恢复并增开的K4418次列车
2025-01-09 08:49:00
汉王展示全球首款磁容芯片:支持8192级压感
快科技1月9日消息,汉王科技在CES 2025全球消费电子展上首次公开展示了全球首颗EMC磁容触控双模芯片——HW0888
2025-01-09 08:49:00
信赖同行,智启未来山东移动焕新发布全球通139领航计划
在科技创新引领高质量发展的浪潮中,AI和5G-A等尖端技术不仅是驱动产业升级的新动力,也成为了构建数字生活范式的新引擎
2025-01-09 08:52:00