1 / 2
文档名称:

基于R语言的轿车销量分析基于R语言的轿车销量分析.doc

格式:doc   大小:49KB   页数:2页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于R语言的轿车销量分析基于R语言的轿车销量分析.doc

上传人:小博士 2017/8/21 文件大小:49 KB

下载得到文件列表

基于R语言的轿车销量分析基于R语言的轿车销量分析.doc

文档介绍

文档介绍:基于R语言的轿车销量分析基于R语言的轿车销量分析
摘要:该文主要对轿车销量的进行初步分析,数据来自数据堂网站,主要使用R语言为工具,进行数据分析,通过导入sqldf数据包,对原始数据进行筛选,排序;以及使用高级绘图函数对轿车销量进行图表分析。
中国 8/vie
关键词:R语言;数据分析;轿车销量
中图分类号:TP311 文献标识码:A :1009-3044(2017)04-0070-02
R语言是一个有着统计分析功能以及强大作图功能的语言环境,主要是统计学家为解决数据分析领域问题而开发的语言。
R语言具有功能强大的程序包,在数据计算,统计分析以及数据挖掘等方面都所向披靡,本文基于R对轿车销量数据进行分析。
1 数据情况
数据是一件麻烦事,在工作中,有多达60%的数据分析时间都花在了实际分析前数据的准备上。
现有2011年4月至2013年10月全国轿车车型销量排名数据:
数据共有6000多条,按照年份,月份,各厂商品牌统计轿车的销量,数据比较杂乱;所以首先要制定分析目标与方案。
2数据处理
首先我们将excel数据导入到R中,将excel文件以剪贴板的格式进行保存。:
我们首先制定数据分析的目标:
数据的特点是分月份,年份,品牌的,我们首先分析2013年度畅销车型。
那么我们需要对2013年各品牌进行汇总然后排序,对于求和以及排序,使用SQL语句来进行比较方便,那么在R中如何使用SQL语句呢?
R语言具有sqldf包,,所以在R中安装和加载sqldf包。需要按照年度累计进行降序排序,只保留车型和本年累计两列。

结果如下:
从排序结果可以看出,2013年,年度畅销车型为大众朗逸,别克凯越和大众速腾。
3 图表分析
上面,我们结合数据分析的目标,对原始数据进行了整理,在R中应用sqldf对数据进行了筛选和排序,得到畅销车型的分析结果。
字不如表,表不如图。由于R具有强大的绘图功能,提供了多种绘图函数,有高水平绘图函数,低水平绘图函数以及交互式绘图函数。
直方图又称为柱状图,用来估计数据的概率分布;下面我们应用高水平函数中的直方图函数来看一下汽车年度销量的分布情况。使用hist函数。
从图中可以看出,年度销量在300000~350000辆之间