浙教版(2019)必修1《第四章 數據處理與應用》2022年單元測試卷(1)
發布:2024/4/20 14:35:0
一、簡單題
-
1.大力老師收集了學校高三年級7選3選課數據,存儲在“選課情況.xlsx”中,其數據格式如圖1所示,學科列下的“1”表示相應行的學生選了該學科,“0”表示未選。
(1)大力老師收集的數據存在一些問題,需要進行數據整理,下列說法合理的是
A.數據集中格式不一致的數據,需要進行格式轉換
B.數據集中的異常數據應該直接刪除或忽略
C.數據集中的缺失的數據可以用任意值填充
D.數據集中的重復數據須在審核的基礎上進行合并或刪除
(2)為實現統計各班技術選考人數,并找出技術選考人數最多的3個班級,大力老師通過Python編程進行數據處理,并以圖表2的形式呈現結果。實現上述功能的Python程序如下,請在橫線處填入合適的代碼。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rcParams[“font.jye.ai-serif“]=[“SimHei“]#中文顯示
df=pd.read_excel(“選課情況.xlsx“)
g=df.groupby(“班級“,as_index=True).技術.①
df1=pd.DataFrame({“班級“:②
df1=df1.sort_values(“③
x=④
y=df1.技術人數[0:3]
plt.jye.ai(x,y,lable=“選技術人數“)
plt.jye.ai(“技術選科人數最多的三個班級“)
plt.jye.ai(“班級“)
plt.jye.ai(“人數“)
plt.jye.ai( )
plt.jye.ai(40,50)
plt.jye.ai( )組卷:1引用:2難度:0.4
一、簡單題
-
3.某商場開業不久,老板為研判商場運營情況,調取了最近一個月的商品銷售情況,如圖表1如示。老板想知道哪些商品賣的多,哪些商品產生的利潤多,同時為表彰先進,需統計每個員工銷售商品數量,并做成圖表,現老板高薪聘請你為運營總監,要求你設計python程序,完成上述功能。
import pandas as pd
import matplotlib.jye.ai as plt
pd.set_option('display.unicode.ambiguous_as_wide',True)#處理列數據無法對齊的情況
pd.set_option('display.unicode.east_asian_width',True)
plt.rcParams['font.jye.ai-serif']='simhei'#圖表顯示中文字體
df=pd.read_csv(“sale.jye.ai“,encoding=“gbk“)#導入待處理 CSV 文件
①
df[“利潤“]=(df[“單品售價“]-df[“單品進價“])*df[“銷售數量“]#計算出每一筆業業務利潤的情況
df1=②
print(③
#同理,統計同種商品的月銷量,代碼略
#統計本月每一位銷售人員的商品銷售數量
df2=df.groupby(“銷售人員“,as_index=False)[“銷售數量“].sum( )
print(④
x=⑤
plt.figure(figsize=(8,4))
plt.jye.ai(“商場運營情況分析“)
plt.jye.ai(x,y,label=“銷售人員業績圖“,color=“r“)
plt.jye.ai( )
plt.jye.ai( )組卷:0引用:3難度:0.4 -
4.小林收集了各地區的油價存于文件“數據.xls”中(如圖1所示),他對數據進行了如下操作:
Ⅰ.將文件“數據.xls”中的數據讀入對象df中;將數據中的“八.八”修改為8.8;
Ⅱ.刪除對象“df”中的“優惠”列,并將對象“df”進行更新;
Ⅲ.添加“平均油價”列,再進行相關計算;將對象“df”中數據按地區降序排序;
Ⅳ.篩選出對象“df”中數據“0 號柴油”不大于 8.4 元的數據行,保存到對象“d5”中;
Ⅴ.統計對象“d5”中的各個地域的地區個數,并繪制圖表,如圖2所示。
請在劃線①②③④處填入合適的代碼。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rc('font',**{'family':'SimHei'})
df=pd.read_excel('數據.xls')
df.①
df=df.②
df['平均油價']=(df['92 號汽油']+df['95 號汽油']+df['0 號柴油'])/3
df=df.sort_values('地區',ascending=False)
d5=③
g=d5.④
plt.jye.ai(g.jye.ai,g.jye.ai)
plt.jye.ai(“地域分布圖“)
plt.jye.ai( )組卷:0引用:2難度:0.3