• 我的订阅
  • 头条热搜
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的同时,将 Llama 2 预填充阶段的推理速度提升到原来的 2 倍以上,这或许能为...……更多
解析AMD Zen5架构CPU:架构革新,性能飞跃
...。根据AMD给出的数据可知,BlockFP16在保持与FP32相当的高准确度的同时,还能提供更高的吞吐量和更小的模型尺寸,因此可以有效减少模型的存储需求。此外,BlockFP16的灵活性允许它作为FP32的直接替代品,并且几乎不损失准确度...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...各种设置中的性能进行更细致和可靠的评估,超越了单点准确度指标。作者对 25 个最先进的开放和封闭模型进行了大规模研究,为 LLM 在数学推理任务中的行为提供了重要的见解。 2、作者质疑了当前在 GSM8K 上报告的结果的可...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
...出同一图标在不同界面中的多种含义,显著提升了描述的准确度和情境相关性。图1数据由谷歌ScreenAI生成,将心形图标错误地理解为“心”而不是“收藏”;图2、3、4数据由Motiff妙多大模型生成,能结合界面信息准确描述图标含...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...文本输入。(3)Pro:多模态模型,300k上下文窗口,兼顾准确度、速度和成本,能进行视频理解、生成创意素材。(4)Premier:亚马逊功能最强的多模态模型,可用于执行复杂的推理任务,并可用作蒸馏自定义模型的最佳老师(...……更多
最前线丨苹果发布M3芯片:用3nm工艺生产,为大模型端侧落地做足准备
...处理器,这一图形处理器的特点是能效比更高、处理速度更快了。此外,M3并且还有动态缓存的能力,这也意味着,M3可对硬件中本地内存的使用进行实时分配,让电脑上的每一项任务对内存的消耗精准调配。M3芯片还支持全新的...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...实现方式在H100 GPU上不太好使,主要是因为GEMM操作的速度更快了,使得缓存和重新计算产生的开销更加明显。所以,作者通过融合内核以及调整实现方式来优化算法。对于验证模型,首先从缓存中重新计算之前的步骤,然后对新...……更多
朱啸虎:AI的赚钱风向,彻底变了!
...间一下缩减到了2分钟。半年后发现,大模型比人设置的准确度更高。你看,像这种垂直场景外行根本拿不到,只有你聚焦在细分行业里,才能找到这些机会点。一旦找到这种尖刀场景,就尽快建立数据闭环,先把客户圈下来。...……更多
机器学习助力预测全球变暖趋势:30秒完成22天大气模拟
...于机器学习的大气环流模型,与现有工具相比,预测速度更快,能耗更低,且可以比传统模型节省数量级的计算量。相关成果于7月22日在权威科学期刊《自然》发表,并登上《自然》官网的首页。NeuralGCM模型将传统基于物理的大...……更多
苹果iphone16原型机曝光,或将采用新的触觉按钮
...容量的确切信息。不过,这些都是@MajinBuOfficial的猜测,准确度有待验证。iPhone16:系统苹果通常会在每年夏季的WWDC开发者大会上发布新系统,因此iOS18应该会在iPhone16系列之前推出。虽然许多科技公司都在大力投入人工智能领域...……更多
OPPO:影调不是风格化,无须教育用户
...,(70亿参数)在新模型的通话摘要功能上,包括摘要的准确度、关键信息的提取完善度、细节提取的精准度方面,我们和竞品对比都是比较好的。”言外之意是,70亿参数是一个能完美平衡手机算力和AI能力的“甜蜜点”,并且...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...式的视觉模型,在保障用户隐私安全的情况下,带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型,FindX7系列将带来自然语言理解、文本内容摘要、通话语音摘要...……更多
CMU副教授:在多智能体流行的当下,不要忽视单智能体系统
...。如同检索增强式生成(RAG)系统一样,可以出于效率或准确度的目的对长上下文进行裁剪。在选择提供 LLM 的示例方面,这里有一些研究进展:https://arxiv.org/abs/2209.11755总结本文并不是说多智能体就没有用武之地了。比如在一...……更多
太能写了!体验完夸克CueMe智能助手,我想说其他AI写作工具可以弃了
...还算合理且完整。2、第二题:从新闻写作到政策总结,准确度挑战在准确度方面,夸克CueMe也达到了新闻记者认可程度。提示词:9月10日,华为和苹果同日发布了新品,对此写一篇500字左右的新闻。如下图所示,夸克CueMe拟定了...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
...a-3.1 版本,在大幅降低资源需求的同时,还能提供类似的准确度。 Puzzle 算法和知识蒸馏Llama-3.1-Nemotron-51B 有别于其他模型的另一个关键组件,就是 Puzzle 算法。该算法对模型中的每个潜在区块进行评分,并确定哪些配置能在速...……更多
双模卫星通话、70亿参数大模型......OPPO提前发布了一大波Find X7系列新技术
...例。自然语义的理解和文本处理方面,AndesGPT的响应速度更快、处理能力更强,质量更高。根据官方提供的数据,相比于同平台其他模型,OPPO AndesGPT 70亿参数大语言模型可以在200字首字生成带来20倍的更快响应,面向2000字首字生...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...开发者Greg Kamradt设计的,业内公认最权威的大模型长文本准确度测试方法。简单而言,这一测试是将一段信息放在一段长文本中的任意位置,检测大模型的回答准确率如何。△“大海捞针”压力测试图目前,对于192k token以内的...……更多
CPU,正在被AI时代抛弃?
...技术,xFT有效地降低了对内存带宽的需求,在推理速度和准确度之间取得平衡,支持多种数据类型来实现模型推理和部署,包括单一精度和混合精度,可充分利用CPU的计算资源和带宽资源来提高LLM的推理速度。 另外值得一提的...……更多
不花一分钱!GPT-4o微调限时免费开放,每日附赠百万训练token
...。由于不需要反复输入重复的脚本,提示词缓存具有速度更快、成本更低这两大优势。有网友认为,提示词缓存功能对开发者更友好(无需异步微调),且几乎可以获得与微调相同的好处。提示词缓存可以让您付出1%的努力获得9...……更多
...研究院将持续深耕研发创新,不断提高支持方言的数量和准确度,计划建成首个覆盖全国333个地市方言和主要少数民族语言的语音识别大模型,切实让每个人都能享受到AI时代的便利。 ……更多
亚马逊云科技,如何用AI再赢一次
...模型的灵魂。只有给大模型喂入够多的高质量数据,模型准确度才会够高。SageMaker平台承担了两部分任务,一是把企业内散落在各个“孤岛”的数据进行查询、治理、分析;二是把高质量的数据用于模型的二次训练和开发。这可...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...和化学问题的基准测试(GPQA)中超过了人类博士水平的准确度。OpenAI团队上下对o1模型充满了信心,OpenAI的CEO 山姆·奥特曼在社交媒体上表示:“需要耐心等待的时刻结束了!”、“这是我们至今为止最强大、最一致的一系列模...……更多
MathGPT大模型发布:落地学而思AI学习机
...学”通过多轮对话的方式将精准学定位到步骤级,不管是准确度还是个性化程度上,都实现了代际化的提升。作为教育领域的垂直大模型,MathGPT专攻教育和学习场景下AI能力的训练和优化。早在8月好未来20周年司庆活动上,学而...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...灯等难以察觉的小目标,其置信度、以及模糊边缘的定位准确度明显高于 YOLO11x。细粒度分布优化 (FDR)FDR (Fine-grained Distribution Refinement) 将检测框的生成过程分解为: 1.初始框预测:与传统 DETR 方法类似,D-FINE 的解码器会在……更多
谷歌推出ai气象模型gencast,预测准确度超越ens
...t,能够提前15天提供更快速、更精准的天气预报,其预测准确度超越了欧洲中期天气预报中心(ECMWF)的ENS系统。项目背景天气影响我们所有人,塑造着我们的决策、安全和生活方式。IT之家注:随着气候变化导致更多极端天气...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...问题,还能极大降低延迟。据了解,豆包同声传译模型的准确度在办公、法律、教育等场景中接近甚至超越人类同传水平,而延迟水平仅有半句话左右。 基础能力之上,豆包同声传译模型还具备音色克隆能力,可生成与说话人...……更多
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
...及并行处理(动态分配计算任务并且提高运算并行度)。更快的速度,不仅节省时间,更让创作更自由!实例展示:更真实的生成效果下图展示了使用 SDXL-Turbo 模型,原版Sdcpp以及我们优化的Sdcpp使用5步采样,所生成的图像对比...……更多
首次采用 3nm 制程、比 M1 Max 快 80%!苹果亮相 M3 系列芯片,最高搭载 40 核 GPU
...。“凭借 3 纳米技术、下一代 GPU 架构、更高性能的 CPU、更快的神经引擎以及对更统一内存的支持,M3、M3 Pro 和 M3 Max 是迄今为止为个人电脑打造的最先进的电脑芯片。”2相比前两代芯片,M3 芯片有哪些升级?在亮相最新款 M3 ...……更多
...识别问题,如抛洒物识别,以从整体上提升AI算法识别的准确度;二是解锁了新的应用场景。吴柯维举例称,基于SAM(Segment Anything Model)万物分割等模型,公司大幅提升了可转动的球型摄像头检测准确率,因而拓宽了道路交通检测...……更多
生成一周大气模拟仅需9.2秒,谷歌气候模型登Nature
...分辨率下的性能可与当前最先进的模型相媲美,天气预报准确度可达5天。确定性模型由于只提供一个预测结果,可能无法充分代表气候系统未来状态的多样性,因此,气候预测中引入了集合预报,即根据略微不同的一组初始条...……更多
更多关于科技的资讯:
先别买游戏本!RTX 50系显卡好像还不错
最近关于RTX50系显卡的消息越来越多,特别是移动版的跑分数据出现在网络上,对于现在要不要买游戏本这个问题,有很重要的作用
2025-01-03 20:15:00
雷军亲自出面 海底捞正式入驻小米科技园 全体员工88折
快科技1月3日消息,小米公司宣布,海底捞首家北京企业火锅店昨日在小米科技园落地开业!官方表示,把海底捞引入小米科技园,小米花了近三年时间
2025-01-03 20:15:00
499元超低价神机!Redmi 14C图赏
快科技1月3日消息,小米日前推出了爆款百元级——Redmi 14C,起售价仅499元,这价格真的无懈可击了。其前作Redmi 12C
2025-01-03 20:45:00
银川地震:烧鸡店阿姨折返回去关火
1月3日消息,据媒体报道,近日宁夏银川永宁县发生4.8级地震,一餐饮店后厨阿姨在地震瞬间跑出去后,又返回关火,事后店主安排现金红包奖励这位工作负责
2025-01-03 20:45:00
广东一SUV不减速撞翻货车 瞬间撞成碎片后续:司机已死亡 2人受伤
1月3日消息,据国内媒体报道称,广东河源桂山路口就发生了一起严重的事故,一辆闯红灯通过路口的SUV车速不减,直接怼上了正常行驶大货车的后部
2025-01-03 21:15:00
iQOO Z9 Turbo长续航版开卖:骁龙8s Gen3+6400mAh 1899元起
快科技1月3日消息,iQOO Z9 Turbo长续航版正式开卖,起售价是1899元。对比Z9 Turbo,长续航版本的电池增大至6400mAh
2025-01-03 21:45:00
合资性价比首选!2025款一汽-大众ID.4 CROZZ上市:一口价14.99万元起
快科技1月3日消息,一汽-大众ID.4 CROZZ的2025款已正式上市,价格区间为14.99-18.59万元。据悉,新款车型在设计
2025-01-03 21:45:00
只做豪华大型车!领克SPA Evo全新架构发布:首搭领克900
快科技1月3日消息,领克汽车销售有限公司副总经理穆军表示,领克900 EM-P将在相当长的一段时间内作为领克品牌的旗舰级产品
2025-01-03 21:45:00
2025年第一场流星雨来了 肉眼就能观测
快科技1月3日消息,2025年的第一场流星雨——象限仪座流星雨将于1月3日迎来极大,大家可在3日夜晚至4日黎明进行观测
2025-01-03 22:15:00
涛的饭店火了 老板发声:谢谢大家关注
1月3日消息,据媒体报道,河北一名网友发布视频,有一家位于河北临漳某处十字路口的饭店名叫“涛的饭店”,因其独特的名字走红网络
2025-01-03 23:15:00
英特尔锐炫B580挑战4K最高画质《燕云十六声》:流畅运行无压力
英特尔锐炫580上市以来销量喜人,虽然首发价定在了2000元以上,但是实际优惠价基本在1800-1900元附近,这个价格拿下一款2K分辨率流畅运行3A游戏
2025-01-03 23:15:00
昔日家用电子游戏机王者 雅达利将于CES 2025发布全新游戏掌机
今夕是何年,曾经的家用电子游戏机王者雅达利(Atari)就这么水灵灵地加入了即将到来的CES 2025,并将带来全新游戏掌机产品——Gamestation Go
2025-01-04 00:15:00
年轻人开始流行换房过年:更省钱
1月4日消息,据媒体报道,春节期间,哈尔滨热门景点旁的酒店一晚标价上千元,为了省钱,南方的网友盯上了景点旁边的房子,“换房过年”因此诞生
2025-01-04 00:15:00
Roxtec电缆和管道密封技术赋能济南地下管廊 为城市生命线安全 “护航”
随着城市化的快速发展,地下综合管廊已成为城市运转不可或缺的“隐形动脉”,承担着输送能源与信息的重要任务。济南市工业北路沿线工厂众多
2025-01-03 19:52:00
华为鸿蒙next5.0来袭,新增应用锁功能
每次提到手机系统的时候,原生鸿蒙就被提及,原因是其证明了中国人独立自主、自力更生的强大精神力量,这也是华为品牌影响力能够得到很大幅度提升的关键
2025-01-03 19:58:00