发现数据趋势的一种方法是检查值的频率。 直方图 - 显示变量值以及每个变量在数据框中出现的次数的图 - 是一种快速简便的方法。 例如,datasets 包中空气质量数据框中的变量(列)表示的每日温度。
Copy > library (datasets)
> head (airquality)
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
4 18 313 11.5 62 5 4
5 NA NA 14.3 56 5 5
6 28 NA 14.9 66 5 6
通过将 x 轴更改为“温度”并将标题更改,我可以使图表更易于查看。 为此,我向 hist() 添加了参数。 要更改 x 轴,我添加了 xlab 参数; 为了更改标题,我添加了主要参数:
Copy > hist(airquality$Temp,xlab='Temperature (Degrees Fahrenheit)',main='Temperatures-City May 1 - September 30, 1973')
说明性数据来自 Cars93,这是 MASS 包中的一个数据框,显示 1993 年汽车的 93 款车型的数据。 它有 27 列。 我不会向您展示所有数据,但这里是前六行中的前三列:
Copy > library(MASS)
> head(Cars93[1:3])
Manufacturer Model Type
1 Acura Integra Small
2 Acura Legend Midsize
3 Audi 90 Compact
4 Audi 100 Midsize
5 BMW 535i Midsize
6 Buick Century Midsize
Copy > table(Cars93$Type)
Compact Large Midsize Small Sporty Van
16 11 22 21 14 9
Copy > barplot(table(Cars93$Type))