2023年12月3日发(作者:2023年还会免购置税吗)

汽车数据之可视化分析二手车之家数据之可视化分析1 引用库、数据文件、清洗函数:#

作者:Irain# QQ联系方式:2573396010#

日期:2020年4月8日%matplotlib inlineimport pandasimport xlrd #读取Excel文件的包import xlsxwriter #将文件写入Excel的包import osimport sysimport matplotlib as mplimport as plt#解决绘图中的中文字体显示问题from pylab import *ms[\'-serif\'] = [\'SimHei\']#seaborn下的直方图import seaborn as snsimport warningsimport as sm #

拟合数据warnings(\'ignore\')data = _excel(\'D:/Information/Working/pycharm/jike/venv/Try/ErShouCheZhiJia/ErSC_Thread/所有汽车清理数据/二手车之家的所有汽车原始数据.xlsx\')data = (\'Unnamed: 0\', axis=1)data = data[data[\'汽车售价/万\'] < 100] #

清洗少数售价 > 100data = data[data[\'汽车原价/万\'] < 200] #

清洗少数原价 > 200

# data = data[(data[\'售/原\'] * 0.01).index()]# data# data = (index=([(data[\'售/原\'] / 100)].index)) #

清洗异常数据\'[]\'data = (index=([(data[\'颜色\']==\'[]\')].index)) #

清洗异常数据\'[]\'data = (index=([(data[\'上牌时间\'] ==\'未上牌\')].index)) #

清洗异常数据\'[]\'data1 = datadata数据源:2 数据簇状分布图2.1 汽车售价簇状分布图fig , ax = ts(1,1, figsize=(16, 8))# le(\"原价与售价对比\",fontsize=20,x=0.5,y=0.95) #

总图标题_title(\"汽车售价/万\", fontsize=25, color = \'red\') #

子图标题(data[\'汽车售价/万\'],bins = 20)(\"汽车数量\", fontsize=20, color = \'blue\') #设置X轴Y轴名称

,字体大小,颜色(\"汽车售价\", fontsize=20, color = \'blue\')

_params(labelsize=20) #

刻度字体大小labels = _xticklabels() + _yticklabels()[_fontname(\'Times New Roman\') for label in labels]_major_locator(MultipleLocator(5)) # x轴刻度值之家的差_major_locator(MultipleLocator(500)) # y轴刻度值之家的差2.2 汽车原价簇状分布图fig , ax = ts(1,1, figsize=(16, 8))# le(\"原价与售价对比\",fontsize=20,x=0.5,y=0.95) #

总图标题_title(\"汽车原价/万\", fontsize=25, color = \'red\') #

子图标题(data[\'汽车原价/万\'],bins = 20)(\"汽车数量\", fontsize=20, color = \'blue\') #设置X轴Y轴名称

,字体大小,颜色(\"汽车原价\", fontsize=20, color = \'blue\')

(0,6500) #设置Y轴上下限

_params(labelsize=13) #

刻度字体大小labels = _xticklabels() + _yticklabels()[_fontname(\'Times New Roman\') for label in labels]_major_locator(MultipleLocator(5)) # x轴刻度值之家的差_major_locator(MultipleLocator(500)) # y轴刻度值之家的差#

给条形图添加数据标注# for b in :# highth = _height()# (_x() + _width()/2 , highth, \'%d\'&int(highth), ha= \'center\',va= \'bottom\' )2.3 售/原–汽车数量簇状分布图fig , ax = ts(1,1, figsize=(16, 8))# le(\"原价与售价对比\",fontsize=20,x=0.5,y=0.95) #

总图标题_title(\"售/原--汽车数量图\", fontsize=25, color = \'red\') #

子图标题(data[\'售/原\'],bins = 20)(\"汽车数量\", fontsize=20, color = \'blue\') #设置X轴Y轴名称

,字体大小,颜色(\"售/原百分比\", fontsize=20, color = \'blue\')

# (0,6500) #设置Y轴上下限

_params(labelsize=13) #

刻度字体大小labels = _xticklabels() + _yticklabels()[_fontname(\'Times New Roman\') for label in labels]_major_locator(MultipleLocator(5)) # x轴刻度值之家的差_major_locator(MultipleLocator(500)) # y轴刻度值之家的差#

给条形图添加数据标注# for b in :# highth = _height()# (_x() + _width()/2 , highth, \'%d\'&int(highth), ha= \'center\',va= \'bottom\' )2.4 ln【售价/(原价-售价)】–汽车数量簇状分布图这个图粗糙,情况表示不准确。有待精细化,精确化。fig, ax = ts(1,1, figsize=(16, 8))# le(\"原价与售价对比\",fontsize=20,x=0.5,y=0.95) #

总图标题_title(\"ln【售价/(原价-售价)】--汽车数量图\", fontsize=25, color = \'red\') #

子图标题(ln,bins = 20)(\"汽车数量\", fontsize=20, color = \'blue\') #设置X轴Y轴名称

,字体大小,颜色(\"ln【售价/(原价-售价)】\", fontsize=20, color = \'blue\')

# (0,6500) #设置Y轴上下限

(-3.5,5.5) #设置X轴上下限

_params(labelsize=13) #

刻度字体大小labels = _xticklabels() + _yticklabels()[_fontname(\'Times New Roman\') for label in labels]_major_locator(MultipleLocator(0.3)) # x轴刻度值之家的差_major_locator(MultipleLocator(500)) # y轴刻度值之家的差#

给条形图添加数据标注# for b in :# highth = _height()# (_x() + _width()/2 , highth, \'%d\'&int(highth), ha= \'center\',va= \'bottom\' )2.5 汽车所在地–汽车数量簇状分布图#

汽车所在地数量情况fig , ax = ts(1,1, figsize=(16, 8))# le(\"原价与售价对比\",fontsize=20,x=0.5,y=0.95) #

总图标题_title(\"汽车所在地\", fontsize=25, color = \'red\') #

子图标题(data[\'汽车所在地\'],bins = 22)(\"汽车数量\", fontsize=20, color = \'blue\') #设置X轴Y轴名称

,字体大小,颜色(\"汽车所在地\", fontsize=20, color = \'blue\')

# (0,6500) #设置Y轴上下限# _params(labelsize=20)

# _params(labelsize=20, fontproperties=\'SimHei\') #

刻度字体大小# _major_locator(MultipleLocator(10)) # x轴刻度值之家的差._major_locator(MultipleLocator(200)) # y轴刻度值之家的差# labels = _xticklabels() + _yticklabels()# [_fontname(\'Times New Roman\') for label in labels]#

给条形图添加数据标注# for b in :# highth = _height()# (_x() + _width()/2 , highth, \'%d\'&int(highth), ha= \'center\',va= \'bottom\' )2.6 车身级别–汽车数量簇状分布图#

车身级别数量图fig , ax = ts(1,1, figsize=(16, 8))# le(\"原价与售价对比\",fontsize=20,x=0.5,y=0.95) #

总图标题_title(\"车身级别\", fontsize=25, color = \'red\') #

子图标题(data[\'车身级别\'],bins = 24)(\"汽车数量\", fontsize=20, color = \'blue\') #设置X轴Y轴名称

,字体大小,颜色(\"车身级别\", fontsize=20, color = \'blue\')

# (0,6500) #设置Y轴上下限

# _params(labelsize=13) #

刻度字体大小# labels = _xticklabels() + _yticklabels()# [_fontname(\'Times New Roman\', fontproperties=\'SimHei\') for label in labels]# _major_locator(MultipleLocator(10)) # x轴刻度值之家的差.# _major_locator(MultipleLocator(500)) # y轴刻度值之家的差#

给条形图添加数据标注# for b in :# highth = _height()# (_x() + _width()/2 , highth, \'%d\'&int(highth), ha= \'center\',va= \'bottom\' )3 线性回归模型与评估模型相关性3.1 驾驶行程与售/原百分比%的线性回归模型from _model import LinearRegressionX = data[\'驾驶行程/万公里\'].e(-1,1)y = data[\'售/原\'].e(-1,1)reg = LinearRegression()(X, y)print(\"The linear model is: Y = {:.5} + {:.5}X\".format(ept_[0], _[0][0]))#线性回归predictions = t(X)(figsize=(16, 8))r(data[\'驾驶行程/万公里\'], data[\'售/原\'], c=\'black\')( data[\'驾驶行程/万公里\'], predictions, c=\'blue\', linewidth=2)(\"驾驶里程/万公里\", fontsize= 20, c=\'blue\')(\"售/原百分比%\", fontsize= 20, c=\'blue\')()3.2 驾驶行程与售/原百分比%的评估模型相关性#

评估模型相关性#

接下来是检验一个模型表现是否良好,需要查看它的R值和每个系数的p值。import as smX = data[\'驾驶行程/万公里\']y = data[\'售/原\']X2 = _constant(X)est = (y, X2)est2 = ()print(y())

3.3 上牌时间与售/原百分比%的评估模型相关性#

评估模型相关性#

接下来是检验一个模型表现是否良好,需要查看它的R值和每个系数的p值。import as smX = data[\'month_data\']y = data[\'售/原\']X2 = _constant(X)est = (y, X2)est2 = ()print(y())

s # p值第一次发布:作者:IrainQQ联系方式:2573396010日期:2020年4月9日3.4 马力与售/原百分比%的线性回归模型from _model import LinearRegression# data[\'month_data\'] = monthX = data[\'马力\'].e(-1,1)y = data[\'售/原\'].e(-1,1)reg = LinearRegression()(X, y)print(\"The linear model is: Y = {:.5} + {:.5}X\".format(ept_[0], _[0][0]))#

线性回归predictions = t(X)(figsize=(16, 8))# (0,300)r(data[\'马力\'], data[\'售/原\'], c=\'black\')( data[\'马力\'], predictions, c=\'blue\', linewidth=2)# _major_locator(MultipleLocator(1))

(\"马力\", fontsize= 20, c=\'blue\')(\"售/原比值%\", fontsize= 20, c=\'blue\')()3.5 马力与售/原百分比%的评估模型相关性#

评估模型相关性#

接下来是检验一个模型表现是否良好,需要查看它的R值和每个系数的p值。import as smX = data[\'马力\'].astype(float)y = data[\'售/原\']X2 = _constant(X)est = (y, X2)est2 = ()print(y())

s3.6 排量与售/原百分比%的线性回归模型from _model import LinearRegression# data[\'month_data\'] = monthX = data[\'排量/L\'].e(-1,1)y = data[\'售/原\'].e(-1,1)reg = LinearRegression()(X, y)print(\"The linear model is: Y = {:.5} + {:.5}X\".format(ept_[0], _[0][0]))#

线性回归predictions = t(X)(figsize=(16, 8))r(data[\'排量/L\'], data[\'售/原\'], c=\'black\')( data[\'排量/L\'], predictions, c=\'blue\', linewidth=2)(\"排量/L\", fontsize= 20, c=\'blue\')(\"售/原比值%\", fontsize= 20, c=\'blue\')()3.6 排量与售/原百分比%的评估模型相关性#

评估模型相关性#

接下来是检验一个模型表现是否良好,需要查看它的R值和每个系数的p值。import as smX = data[\'排量/L\']y = data[\'售/原\']X2 = _constant(X)est = (y, (float))est2 = ()print(y())

s4 数据分布箱型图4.1 售价与车身级别箱型图#售价与车身级别箱型图( figsize=(16, 8))(\'售价与车身级别箱型图\', fontsize = 25 ,c = \'green\') #

主图主题名、大小、颜色(\"\", fontsize=20, color = \'blue\') #设置X轴Y轴名称(无效)

,字体大小,颜色(\"\", fontsize=20, color = \'blue\')

_params(labelsize=16) #

刻度字体大小t(y = data[\'售/原\'], x = data[\'车身级别\'])4.2 售价与颜色箱型图# cols = [\'紧凑型车\',\'中型车\',\'中大型车\',\'紧凑型SUV\',\'中型SUV\',\'mpv\',\'小型车\',\'大型车\',\'小型SUV\',\'跑车\']color = [\'紫色\',\'绿色\',\'橙色\',\'黄色\',]for i in color: data[\'颜色\'] = data[\'颜色\'].replace(i,\'其他\') #

修改series值data[\'颜色\'].value_counts()#售价与颜色箱型图( figsize=(16, 8))(\'售价与颜色箱型图\', fontsize = 25 ,c = \'green\') #

主图主题名、大小、颜色(\"\", fontsize=20, color = \'blue\') #设置X轴Y轴名称(无效)

,字体大小,颜色(\"\", fontsize=20, color = \'blue\')

_params(labelsize=16) #

刻度字体大小t(y = data[\'售/原\'], x = data[\'颜色\'])5 问题:ValueError: Pandas data cast to numpy dtype of object. Check input data y(data).出错图片展示:解决方案:#

评估模型相关性#

接下来是检验一个模型表现是否良好,需要查看它的R值和每个系数的p值。import as smX = data[\'马力\']y = data[\'售/原\']X2 = _constant(X)est = (y, (float))est2 = ()print(y())

s奇怪地方:先把类型转换成float,再检验模型,结果是同一个出错。不解。第二次发布:作者:IrainQQ联系方式:2573396010日期:2020年4月11日

更多推荐

汽车,数据,模型,售价