您当前的位置:首页 > 电脑办公 > excel
| PPT | 电脑打字 | 计算机基础 | word | excel |

自学教程:pandas对csv文件进行计算出一列数据的平均值、最大值和最小值

51自学网 2022-12-08 11:26:48
  excel
这篇教程pandas对csv文件进行计算出一列数据的平均值、最大值和最小值写得很实用,希望能帮到您。

对csv文件进行计算出一列数据的平均值、最大值和最小值,以及对应的箱式图

 

1.导入模块

1
2
import pandas as pd
import matplotlib.pyplot as plt

2.读取csv文件

1
2
读取文件csvin
data = pd.read_csv('catering_sale.csv')

  结果:

 

 

 

3.计算销量的最大值、最小值和平均值

1
2
3
4
5
6
7
8
print(data)
#1.求销量的最大值、最小值、平均值
sales_volume_max=data['销量'].max()
print('最大值\n',data[data['销量']==sales_volume_max])
sales_volume_min=data['销量'].min()
print('最小值\n',data[data['销量']==sales_volume_min])
sales_volume_mean=data['销量'].mean()
print('平均值\n',sales_volume_mean)

  

 

 

 

4.获取缺失的数量以及样本总量

1
2
3
4
5
#2.求缺失值
data['销量'].isnull()
n=data['销量'].shape[0] -data['销量'].count()
print('样本总数',data['销量'].shape[0])
print('缺失值的个数',n)

  

 

 

 

5.对销量进行数据分析给出相应的箱式图 

1
2
3
4
5
6
7
8
9
#3.数据分析图
#解决中文乱码
plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
fig,axes = plt.subplots()
data.boxplot(column='销量',ax=axes)
# column参数表示要绘制成箱形图的数据,可以是一列或多列
axes.set_ylabel('sales_volume of data')
fig.savefig(r'输出图片')

返回列表
如何设置打开两个EXCEL后是分开在两个窗口方法
51自学网,即我要自学网,自学EXCEL、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。
京ICP备13026421号-1