指定行列資料的讀取
import pandas as pd
import numpy as np
import matplotlib。pyplot as plt
from pylab import mpl
mpl。rcParams[‘font。sans-serif’]=[‘SimHei’] #解決圖表不能顯示中文問題
mpl。rcParams[‘axes。unicode_minus’]=False #解決負號不能正常顯示問題
pd。options。display。max_columns=999#顯示全部列
f=pd。read_excel(“E:/資料/2020年3月/響。xlsx”)
#print(f。describe())
#print(f。head(5))
#按公司名稱統計平均值
#data=f[[“日期”,“公司名稱”,“時長”]][(f[“日期”]==“2020-03-07”)]。groupby(f。公司名稱)。mean()
#d2=f[[“日期”,“公司名稱”,“時長”]][f[“公司名稱”]==“****公司”]。groupby(f。日期)。mean()
list=[“****公司”]#提取指定列中欄位資料
#d2=f[[“日期”,“公司名稱”,“時長”]][f[“公司名稱”]。isin(list)]。groupby(f。日期)。mean()
#將要提取的列,放入列表中
column=[“日期”,“公司名稱”,“時長”]
d4=f[column][f[“公司名稱”]。isin(list)]。groupby(f。日期)。mean()
print(d4。tail(10))#顯示末尾幾行
#d4。plot。line(y=“時長”)
#plt。show()
#list=[“西安***公司”,“杭州***公司”]
#d3=f[[“日期”,“外部公司名稱”,“時長”]][f[“公司名稱”]。isin(list)]。mean()
#print(d3。tail(10))
#d4=f[f[“公司名稱”]。isin(list)]。mean()
#print(d4。tail(20))
#print(data。head(10))
‘’‘
按日期稱統計平均值
#data=f[[“日期”,“接起量”]]。groupby(f。日期)。mean()
’‘’
#s=f。iloc[:,1:14]#按索引[行,列]序號讀取
#s=f。columns[1]
#檢視所有欄位
#field = f。columns。tolist()
#print(field)
#根據列名,列印某一列資料
#print(f[‘員工唯一姓名’])
#列印[10-20)行資料
#f(f[10:20])
#只顯示第四行
#print(f。loc[4])
#列印多個列資料,需要雙層[[]]
#data=f[[“日期”,“姓名”,“接起量”]]
#print(data。head(5))
#檢視基礎資料
#mean = 均值
#std = 方差
#print(data。describe())#只針對數值型
#()中沒有任何引數時,會預設只統計數值型別的欄位內容 等同於 data。describe(include = np。object[np。number])
#顯示字串的統計計數
#print(data。describe(include=[np。object]))
#count = 出現的次數
#unique = 不同數量
#top = 出現頻率最高的欄位……
#出現頻率
#data。plot。line(y=“接起量”)
#plt。show()
‘’‘
#方法一
#x=f。自然日
#y=f。呼入量
#plt。plot(x,y)
#方法二
f。plot。line(x=“自然日”,y=[“接起量”,“呼入量”])#
f。plot。line(x=“自然日”,y=“呼入量”)
plt。title(“呼入量趨勢圖”)
plt。xlabel(“日期”)
plt。ylabel(“呼入量”)
plt。grid(True)#增加網格線
x=range(len(f。自然日))
#x=f。自然日#錯誤
#y=f。呼入量
y=f。滿意度
#顯示範圍
#plt。xlim(1996, 2016)
#plt。ylim(0, 8*10**10)
#標籤顯示
#for a,b in zip(x,y):
#plt。text(a,b+0。3,str(b))
#plt。text(a,b+0。3,’%1。1fW‘%(b/10000))
plt。show()
’‘’