• 我的订阅
  • 科技

数据集中的不同变量(murders)

类别:科技 发布时间:2022-12-27 14:52:00 来源:卓越科技

变量在R中也有不同的类型,我们需要区分数字与字符串,表格与简单的数字列表等不同类型。class函数可以帮助我们确定对象的类型,例如,将a赋值为2,再通过class函数查看a的类型,返回的是numeric(数字型);再比如,通过class函数查看函数ls的类型,返回的是function(函数型)。

数据集中的不同变量(murders)

01数据框(DataFrames)

除了我们常用到的变量和函数,在R中最为常见的存储数据集的方式是数据框(dataframes)。从概念上来说,我们可将dataframes视为表(tables),其中的行表示观测值(observations),列则是观测值对应的不同变量。

我们可以将不同的数据类型组合成一个对象,因此dataframe对于数据集特别有用。大部分数据分析挑战都是从存储在数据框中的数据开始的。例如,我们可以通过library函数加载dslabs包,再通过data函数获取在dslabs中的数据集;与此同时,我们可以通过class函数查看数据集的类型(应为dataframe)。

数据集中的不同变量(murders)

如上图所示,我们已加载了一个名为“murders”的数据集或dataframe,作为一个对象,该dataframe具体是什么,有什么样的数据呢?

首先,通过str函数,我们可查看对象(object)的结构,如下:

数据集中的不同变量(murders)

通过str函数返回的信息,我们可以看到murders数据集有51个观测值和5个变量,并且5个变量的名称分别都列出来了,以符号“$”开始的state、abb、region、population、total。

我们还可通过head函数来查看数据集的前6行数据信息:

数据集中的不同变量(murders)

02访问数据(Accessingdata)

我们已经通过一些操作获取到所需的数据集,如何来访问其中的数据,或使用其中的数据呢?

就当前的示例而言,我们主要会访问数据集中的不同变量,或者说数据表的不同列,在此会用到存取器$,如下:

数据集中的不同变量(murders)

以上代码可返回murders数据集中region这一列的数据。在返回的结果中数据条目前用数字“[1]、[4]、[7]……”标注了顺序,此顺序即为数据条目在数据集中的数据顺序。

上面通过str函数可知道数据集有哪些列,另外一个函数可快速获取数据集的列名是names:

数据集中的不同变量(murders)

03向量(Vectors)

我们把“murders$region”作为对象来看的,此对象并不是单个数字,而是有许多个数据信息组成,我们将这些称之为向量(vector)。

单个的数字(视为一个对象)可说是一个向量,其大小为1;将pop定义为murders$population对象,用length函数查看pop,是一个大小为51的向量,且类型为数字型:

数据集中的不同变量(murders)

既然有数字型的向量,自然也会有其他类型的向量,因数据集不仅可存储数字型数据,也会有字符型数据等其他类型的数据。

数据集中的不同变量(murders)

数字型向量中每个数据条目一定是数字,而字符型向量中的所有数据条目则必是字符。

另一向量类型是因子(factors),用于存储分类数据,在murders数据集中,region便是factor类型的向量。这些地区“regions”是按照类别分的,此数据集中有四个类别,通过levels函数可查看:

数据集中的不同变量(murders)

这些地区名称看上去更像是字符类型,但为何要以分类数据的方式来保存,因为这种方式更具较高的内存使用效率。在R中,我们将这些分类级别存储为整数。从技术上讲,整数在内存方面比字符小。

本示例数据集中还有一个未提及的向量类型——逻辑向量(logicalvectors),如下所示,定义变量z为一个表达式“3==2”,“==”是一个关系运算符,3不等于,其结果为FALSE,因此z返回的就是“FALSE”,其类型为logical。

数据集中的不同变量(murders)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2022-12-27 15:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

r语言中向量的基本知识
...要使用引号,如果不使用引号的话,R会认为这些字符是变量,在这种情况下会返回错误。我们也可以在定义时,直接将字符型条目与对应的数字代码相匹配,如下:如果使用不带引号的字符串看起
2022-12-27 14:52:00
策略产品必知系列之一文详解“特征工程”
...征或特征子集的重要性或者好坏程度。因此需要量化特征变量和目标变量之间的联系以及特征之间的相互联系。为了避免过拟合,我们一般采用交叉验证的方式来评估特征的好坏;为了减少计算复杂
2023-06-07 16:00:00
强制(coercion)是什么意思?
一般来说,强制(coercion)是R灵活处理数据类型的操作。当数据条目与预期不匹配时,一些预构建的R函数会在抛出错误之前尝试猜测其含义,但这也会引起混乱。在试图用R编写代码时,
2022-12-27 14:51:00
数据分析函数sort、order、rank三个函数的功用
在对数据进行分析时,数据排序是我们经常需要进行的应用操作,在R语言中,也有几个函数可以帮助我们快速实现数据排序的操作,我们一起来了解一下他们不同的功用。01Sort函数在R语言中
2022-12-27 14:51:00
稀疏自编码器是如何工作的,这里有一份直观说明
...叠加(superposition)。之所以会这样,是因为世界上很多变量天然就是稀疏的。举个例子,某位名人的出生地可能出现在不到十亿分之一的训练 token 中
2024-08-06 09:27:00
Go语言实例 | 类型系统
...中重新定义一下。代码中的eface.typ实际上就是从interface{}变量中提取出的类型元数据地址,再来看一下toType函数
2023-02-03 10:00:00
DolphinDB 常见数据库错误代码大全
...参数形式不合规……S03000:无法用undef函数取消一个流表变量的定义S03001:创建流引擎时重名S03002
2024-03-28 10:00:00
万字长文解释 ChatGPT 在做什么,以及为什么它能发挥作用?
... bx。因此,如果我们把这里的每个像素的灰度值当作某个变量 xi,是否有一些所有这些变量的函数,在评估时告诉我们这个图像是什么数字?事实证明,有可能构建这样一个函数。不足为奇
2023-02-17 21:00:00
halcon18.11最新版下载-halcon18.11中文破解版下载
...写,修 改,执行程序,并且可以查看计算过程中的所有变量,设计完成后,可以直接输出C、C++、VB、C#、vb等程序代码,套入您的程序中。 HDevelop同时和数百个范例程序
2023-02-04 11:00:00
更多关于科技的资讯:
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00
■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系,着力打通数据壁垒与业务断点,促进产业链各环节融通发展■建立功能完善
2025-10-31 09:05:00
在数字化、网络化、智能化的当下,图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”?近日,第五届长三角公共图书馆发展论坛在上海举行
2025-10-31 09:05:00
Mutual妙趣艺:全球战略+资源整合,打造文娱IP数字资产化标杆
Mutual妙趣艺于2020年成立于美国加州,专注于文娱IP(知识产权)数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”
2025-10-31 10:57:00
鲁网10月31日讯近日,“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上,工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”
2025-10-31 11:43:00
人工智能(AI)是新一轮科技革命和产业变革的重要驱动力量,广西聚焦国家所需、广西所能、东盟所盼,正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径
2025-10-31 11:46:00
aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类供应商——以中国智造共铸无界对话的全球盛事
上海,2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛(WCGC)全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行
2025-10-31 11:52:00
让检测全面拥抱AI!科学指南针2025产品服务发布会举行
让检测全面拥抱AI!10月30日,科学指南针2025年度产品服务发布会在杭州举办,来自高校院所、企业、分析测试中心等多方行业代表到场参会
2025-10-31 11:52:00
培育钻定制哪个品牌好?2025最新测评出炉,国产珠宝高性价比领跑榜单
曾几何时,钻石承载着“钻石恒久远,一颗永流传”的爱情神话,而天然钻石的稀缺性更被赋予了极高的市场价值。然而,随着实验室培育钻石技术的突破性进展
2025-10-31 12:14:00
在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期,平台竞争力已不再局限于单一的预订功能,而是延伸至合规风控
2025-10-31 12:16:00
拓竹荣膺《时代》最佳发明,3D打印技术步入主流创新支撑体系
近期,《时代》周刊公布2025年度最佳发明榜单,揭示一个耐人寻味的现象:在300项突破性发明中,仅有4项被明确标注为3D打印创新
2025-10-31 12:19:00