• 我的订阅
  • 头条热搜
谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题
GPT-5有3-5万亿参数,由7000块B100炼成?!一夜间,下面这张图在网上疯转:仔细看,这是三星高管Jung Bae Lee(李禎培)在一场高级管理层峰会(CEO Summit)上演讲。上面明晃晃写着GPT-5 3-5T、B100 7000、HBM3E 8TB/s。网友发现,不只是三...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...业生产目标,还是科学场景辅助需求,评估 LLM 在精细化维度上的能力都是至关重要的,例如:数学及其专门分支领域,如代数、几何、概率和微积分。 不同类型的推理能力,例如符号推理、类比推理、反事实推理和社会推理。...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...果的影响。为了评估模型的性能,我们采用了基于LLM的多维度比较方法。具体定义了全面性、多样性、赋能性和总体表现四个评估维度。这些维度从不同角度衡量模型的回答质量,确保评估的全面性。 由于检索增强生成(RAG)...……更多
关于暗物质隐藏地点的新理论
...挑战,但近两年,有科学家提出的一个创新性概念——暗维度场景,这为我们提供了一种可能的解答路径,因为它至少在一定程度上回应了关于宇宙构成的一些根本性问题。这一理论不仅为暗物质的存在提供了一个明确的理论基...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...义理解的SQL生成任务需要精准理解用户查询的指标和相关维度。为了增强问数服务层的数据精度与效能,浩鲸科技的BI大模型团队聚焦于构建一套全面的BI知识数据管理体系。该体系深刻涵盖了业务术语、同义词汇、原子术语、...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...写百页长文,发布名为MultiTrust的综合基准,首次从多个维度和视角全面评估了主流多模态大模型的可信度,展示了其中多个潜在安全风险,启发多模态大模型的下一步发展。论文标题:Benchmarking Trustworthiness of Multimodal Large Languag...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...提高模型性能的关键因素。GPT-4o的识图能力有多牛?四大维度深度体验基于图片类型,记者将识图功能的测评分为4大维度,分别为普通图像、特定专业领域的图像、数据图像和手写图像。一、普通图像识别(1)内容较为单一的...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...数却始终难以超过48%。但这种情况并没有持续很久。各个维度的分数持续猛涨,2023年3月,GPT-4在HellaSwag上的各项得分就逼近,甚至超过了人类水平。 https://rowanzellers.com/hellaswag/为什么在基准测试上如此惊艳的模型,一遇到现实...……更多
AI技术助力5G网络性能提升 无线空口技术引领未来网络设计变革(附图片)
...于5G大数据和算力资源,以人工智能技术为基础的新资源维度。5G智能维可以被认为是与传统无线移动通信的时域、频域和空域并列的一个新维度。相较于传统的维度,5G智能维构建需要基于三项基本元素:5G大数据、算力资源和...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚...……更多
地球上的水为何无法填满“克莱因瓶”?高维空间的神秘力量是什么
...学研究发现,在微观世界和宇宙的尺度上,存在着更多的维度。一个常用的例子是弦理论,它是一种试图统一量子力学和引力理论的理论框架。根据弦理论,我们生活的世界实际上是由10个或11个维度构成的,其中7个或8个维度是...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...这里就涉及到了语言、图片和动作三种模态。动作具有低维度和高频的特点。研究者采用具有傅里叶特征的多层感知机(MLP)来进行编码。 图片具有高维度的特点,同时含有丰富的空间和语义信息。研究者采用经过对齐的 SigLIP ...……更多
养老机器人真来了!国产顶流泡茶喂猫练咏春,帮十亿人做家务
...可以用第一人称,支持从视频、动捕,以及遥操作收集多维度的高质量数据,实现人类多模态数据交互,也能低成本、高效率地利用已有的真实世界视频数据,以及人体动作数据。围绕「力」展开研发,既丝滑又安全在关于S1的...……更多
科学家已经把宇宙建到十维了?
...描述为一种曲折的流形,再到现代量子理论和弦论对更高维度时空的探索,各种物理理论都紧密依赖于对应的几何学基础。反过来,物理学对几何学的发展也产生了重要的推动作用,促进了新的几何概念和分析工具的诞生。令人...……更多
...收尽收。搭建标签体系,洞察精准有力。从诉求内容主观维度出发,平台采用平行设置若干独立标签,构建涵盖智能概要、诉求触发、业务洞察、政策导航和响应反馈共计48项2037个标签,让数据的流动像自来水一样即开即用,为...……更多
...分要素的合集,甚至很多简单好用的模型仅需要其中一种维度即可构建业务逻辑。有了大数据法律监督的意识,通过案件确定了异常监督点,又进一步完成同类型案件业务规则的梳理,便基本实现了刑事检察部门检察官在大数据...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
...水平。”从另一个角度讲,语言只是人类意识的其中一个维度映射,在这个过程中存在大量的信息丢失和扭曲。人类在认识世界的过程中,还包含了视觉、听觉、触觉、嗅觉、味觉等多个不同维度。同时,人类自身的运动学习,...……更多
车企AI大模型陆续上车,我们离车机功能要付费不远了?
...上车”,意义有多大 现阶段大模型的主要应用在于两个维度,上述内容表达了大模型对智能驾驶提供自适应自学习能力的意义,下面将说明大模型能为智能座舱提供更简便又丰富的操作模式。现阶段大模型的意义,对于智能座...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...。重新审视Scaling Law我们所熟知的Scaling Law主要关注两个维度,即模型权重和训练量,包括训练时的step、epoch和token总量等等。基本上,论文的发现就是,模型规模是重要因素。因此,GPT-3犯了一个错误——模型参数量远远超出了t...……更多
派安盈揭秘大卖都在用的TikTok Shop运营模型
...、拆解并寻找经营短板和问题所在。五维模型指的是选品维度、内容维度、流量维度、运营维度、品牌维度。接下来,我们将逐个分析讲解。一、选品维度选品有以下几个基本注意事项:1、产品不涉及任何敏感因素;2、长宽高...……更多
这家国际机构,让上市公司又爱又恨 | 36碳深度
...言之后,MSCI将新增长点锚定在ESG,加强了在环境气候(E维度)的布局投入。2019年10月,MSCI收购了气候变化情景分析公司Carbon Delta,并在2020年推出气候风险估值模型Climate VaR,帮助客户识别气候变化对公司估值的潜在影响。目前...……更多
Sora“超级涌现力”将把AI引向何方
...频切分为时空子块,人工智能模型去学习这些子块在空间维度中的布局分布、在时间维度上的连续变化等信息,同时学习子块之间运动、颜色、光照、遮挡等复杂视觉特征,就可能重建、合成新的视频序列。 目前,合成视频需...……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...加速引擎,对企业数据进行定义,规范化加工原子指标、维度等,统一数据口径,在此基础上,平台还采用“积木式”组装派生和衍生指标,实现企业数据与指标语义的一一对应,让数据具有业务属性,降低后续数据使用歧义与...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...特曼在GPT-4o的技术博客中提到,该模型在网络安全等风险维度上都“不超过中等水平”,也就是说,目前只能实现中等及以下的安全能力。无论是C端用户,还是B端政企客户,谁放心将喜怒哀乐、私密信息都告诉多模态大模型?...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...y轴是100次重复的平均绝对误差结论总的来说,当模型的维度足够大时,可以通过让Transformer计算输入序列的直方图来轻松完成「计数任务」。对于较小的维度,一层Transformer则无法实现。理解这些Transformer的局限性对于新架构的...……更多
阿里安全参展世界互联网大会 为“负责任的人工智能”保驾护航
...绕内容安全、个人信息保护、模型安全和知识产权等风险维度,进行了从风险成因到实践解决方案的深入剖析,助力新技术的健康发展与创新应用。从2009年成立以来,阿里安全依托阿里集团,在各个复杂场景中充分利用人工智...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
... Demo 文档,包含了上百个可灵生成的作品,还提供了测试维度的指导。感兴趣的读者请戳:https://waytoagi.feishu.cn/wiki/GevKwyEt1i4SUVk0q2JcqQFtnRd下面这个 2 分钟的公益短片《一个很远的地方》也是完全由可灵生成的,你能看出来吗?在..……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内部维度14336,层数40,32个头分为4组(GQA),词表大小131072。视觉编码器视觉编码器部分是随Pixtral 12B一起新鲜出炉的PixtralViT。顾名思义,采用ViT架构打底,4亿参数量。同时……更多
在多维宇宙理论中,高维空间会如何影响我们的物理现实?
...维空间。想象一下,如果除了我们熟悉的三维空间和时间维度之外,还有更多未知的维度存在,这将如何改变我们对宇宙的理解呢?多维宇宙理论起源于20世纪的物理学研究,尤其是弦理论和超弦理论的发展。这些理论提出了一...……更多
...加入行业语料,然后微调后可以交付客户端使用。” 多维度考察大模型“这是一个毋庸置疑的AI时代。”袁辉在发布会上谈到。而大模型的出现让AI的未来前景变得更加清晰和广阔。面对市场面上各种大模型,一般认为,模型的...……更多
更多关于科技的资讯:
大道至简!雪铁龙、欧标售卖无中控屏新车:换成手机支架
快科技3月4日消息,在智能化配置泛滥的当下,加大加多屏幕似乎成为了主流,然而大道至简,近日,多家欧洲车企正以"反向操作"重拾基础款车型战略
2025-03-04 19:11:00
日本10亿研发费换来60%错误率AI工具!学习样本仅5000
快科技3月4日消息,随着AI的快速发展,日本政府也投入了约10亿日元(约合4879万人民币)的研发经费,试图开发一款用于判断儿童是否遭受虐待的AI工具
2025-03-04 19:11:00
赶紧试试 !微信支持进一步瘦身啦!有网友已经实测了
快科技3月4日消息,近日,微信iOS版和安卓版均出现了热更新。此次更新使得清理变得更细致,释放出更多的存储空间。打开手机微信APP界面
2025-03-04 19:11:00
58同城CEO姚劲波提议:房租年涨幅应控制在5%以内
快科技3月4日消息,据报道,全国人大代表、58同城董事长兼CEO姚劲波聚焦住房租赁市场,拟提交一份《关于进一步保护承租人合法权益》的建议
2025-03-04 19:41:00
摩尔线程新方法优化AI交互:显存节省最多82%
摩尔线程科研团队近日发布了一项新的研究成果《Round Attention:以轮次块稀疏性开辟多轮对话优化新范式》,使得端到端延迟低于现在主流的Flash Attention推理引擎
2025-03-04 19:41:00
麦当劳回应变成了没有情绪的中年人:我情绪挺好的呀
快科技3月4日消息,话题“麦当劳变成了没有情绪的中年人”登上热搜。据媒体报道,有博主发图比较2009年和2025年的麦当劳门店装饰变化
2025-03-04 19:41:00
星邦互娱IPO:爆款断档、收入下滑、由盈转亏;“小游戏流水第一”要讲出海故事
图片来源:网络出品 | 搜狐科技作者 | 张莹编辑 | 杨锦小游戏流水第一的移动游戏公司,并非外界耳熟能详的三七互娱、点点互动
2025-03-04 20:02:00
小米SU7 Ultra欧洲首秀引发关注 卢伟冰:震撼非常大
快科技3月4日消息,小米SU7 Ultra首次在海外亮相,这次小米选择了全球豪车发源地欧洲。小米集团王化表示,即便是看惯了豪车的欧洲人
2025-03-04 20:11:00
一喷瞬间补水!爆款颐莲玻尿酸喷雾:27元新低(大差价)
天猫颐莲旗舰店,颐莲玻尿酸喷雾300ml*2标价200元,今日下单领取96元优惠券+20元品类券,到手价为54元,折合每瓶约27元
2025-03-04 20:11:00
205g新疆棉:网易严选纯色纯棉短袖T恤80元3件狂促
天猫网易严选旗舰店,网易严选纯色纯棉短袖T恤日常售价39 元,今日下单3件可用19元券,点击【送给朋友】选项,根据提示下单
2025-03-04 20:11:00
电磁炉哪个牌子的质量好?热门好用的十大品牌
电磁炉凭借它的便捷性给小伙伴们带来许多方便,特别是聚会吃个火锅美哉美哉!但市面所售的电磁炉品牌型号众多,有很多小伙伴不知道该如何选择
2025-03-04 20:36:00
羊驼教育:沉浸式学习体验与高效备考策略
在日语学习日益受到重视的今天,羊驼教育凭借其独特的沉浸式学习体验和高效备考策略,成为了众多日语学习者的首选品牌。作为羊驼教育旗下的一条成熟业务线
2025-03-04 20:37:00
重庆大学产业技术研究院与企业合作成立“天枢云擎联合研究与创新中心”
3月4日下午,在位于重庆两江新区的重庆艺臻供应链(集团)有限公司(以下简称“艺臻集团”)总部,重庆大学产业技术研究院与重庆艺臻云智能科技有限公司(以下简称“艺臻科技”)举行了“天枢云擎联合研究与创新中心”成立签约暨揭牌仪式
2025-03-04 20:47:00
3月3日,由国家能源局、山西省能源局、太原市能源局多名专家组成的评审团,现场评审科达自控总承包建设的晋能控股同忻矿选煤厂智能化项目
2025-03-04 20:55:00
贵州高速集团全面接入DeepSeek大模型 “数智贵高”升级再提速
多彩贵州网讯(本网记者 张鸿杰 通讯员 杨焙)近日,贵州高速集团接入DeepSeek人工智能大模型,通过“自主可控+开源协同”双引擎驱动
2025-03-04 21:37:00