項目:探究高一各學科相關性分析
[項目情境]
在信息化浪潮的推動下,互聯網技術不斷發展,云計算、移動互聯網、大數據和人工智能
等新興技術嶄露頭角。使用數據挖掘相關技術對中學教學活動中產生的數據進行收集與處理,獲取有利于教學的相關信息,也是推進智慧教育的舉措之一。在教學過程中,學科考試成績能夠在一定程度反映學生的認知發展水平,某校對高一年級學生的成績進行數據處理,分析各學科之間的關聯度找出優勢學科,對教學及學生選科有重要的參考價值。
[項目綜述]
(一) 概述項目目的、方法和過程。根據要求,回答問題。
(1)數據分析需要使用恰當的方法和工具,對數據進行各種分析。我們可以通過 關聯分析關聯分析尋找數據之間的關聯性或相關性,可以通過 聚類分析聚類分析在分類標準未知的情況下進行數據自動分類,可以根據分類準則通過 數據分類數據分類對未知數據進行預測。(選填:數據分類、關聯分析、聚類分析)
(2)本項目主要通過模擬大數據采集與分析方法,采用 關聯分析關聯分析(選填:數據分析、關聯分析、聚類分類)的方法進行數據分析,試圖分析高一年級學生各 學科之間的關聯度,找出兩到三門優勢學科,作為指導教學及學生選科的重要參考依據。
(3)確定需要收集的數據為歷年高一年級期中期末的各學科成績,在數據收集、發布、傳播、共享時,為保護學生的隱私應采用 匿名處理匿名處理(選填:數據精度處理、人工干擾、匿名處理、訪問控制)等技術手段。
(4)選用Python語言作為數據分析工具,需要通過調用諸如標準模塊、自定義模塊以及第三方擴展庫的支持,從而高效的完成數據采集處理、分析、可視化。數據分析步驟有①數據呈現②數據分類/關聯分析/聚類分析③數據采集④分析報告⑤數據預處理,正確的順序是 ③⑤②①④③⑤②①④。(寫出序號即可)
[項目實施]
(一)數據采集與預處理
Ⅰ、(24分)圖1-1為記錄歷年高中各科成績的部分文件,圖1-2為獲取所有高一成績并寫人指定文件“高-考試成績總.xlsx“的部分程序代碼。圖1-3為獲取的高一考試成績的部分數據內容。根據要求,回答問題。

(1)觀察圖1-2,該程序用 循環循環結構嵌套 選擇或分支選擇或分支結構(選填:順序、選擇、循環)描述算法,實現從若干個xlsx文件中篩選出高一成績并保存 為數據文件,其中在Python語言中表示判斷數據大小關系的運算符“==”表示 等于等于 ( 選填:不等于等于)。補充程序代碼中缺失的語句,應在下橫線處填寫 ”高一””高一”。
(2)對采集的數據進行有效存儲,以便對數據進行分析和使用。海量的數據幾乎包含一切形式的結構化、半結構化以及非結構化的數據。網絡中的音視頻、圖片、地理位置、網絡日志等數據屬于 非結構化非結構化數據,如圖1-3,“高一考試成績總.xlsx“中的數據屬于 結構化結構化數據。(選填:結構化、非結構化)
(3)在數據分析之前,需要運用 特征探索特征探索方法(選填:特征探索、關聯分析、聚類分析、數據分類)對數據進行預處理,發現和處理缺失值以保證數據的完整,還需要對異常數據進行清理,分析是否有冗余數據等。觀察圖1-3,“201”屬于 異常值異常值數據,虛線部分屬于 缺失值缺失值數據(選填:缺失值、異常值、冗余值),應當刪除數據所在 行行(選填:行、列)。
(4)觀察圖1-3表格的數據,在收集數據的過程中,你認為哪些數據可以不采集?為什么?
(二)數據分析與可視化
Ⅱ.(14分)運用Python語言編程進行數據分析與可視化表達,分析部分結果如圖2-1、2-2。根據要求,回答問題。

(1)觀察圖2-1,該校學生地理物理生物同時優秀的概率最 高高,政治、物理、化學同時優秀的概率較低。
(2)為便于理解數據之間的關系,使用數據可視化工具可以圖表形式直觀呈現。如折線圖可以表示關于 趨勢趨勢的分析、散點圖可以表示關于 邏輯關系邏輯關系的分析、數據地圖可以表示關于 空間關系空間關系的分析(選填:邏輯關系、空間關系、趨勢)。如圖2-2所示選用 柱形(狀)柱形(狀)圖將數據分析可視化呈現。
(3)下列關于數據可視化的描述中,正確的是 ABCDABCD。(多選)
A.可視化也可以將數據以地圖、動畫等形式表示
B.可視化可以有效提升數據分析的效率
C.可視化可以讓人們快速抓住要點信息
D.可視化可以幫助人們發現數據背后的價值
(三)分析報告
Ⅲ.(7分)在數據分析中,使用數據可視化工具可以直觀的呈現數據之間的關系,尋找數據之間的內在規律,最終實現數據的應用。
(1)觀察圖2-2,說說你從圖中發現了什么?挖掘出哪些信息?
(2)結合自己的學習和生活,談一談數據的重要性。(100字左右)
【答案】關聯分析;聚類分析;數據分類;關聯分析;匿名處理;③⑤②①④;循環;選擇或分支;等于;”高一”;非結構化;結構化;特征探索;異常值;缺失值;行;高;趨勢;邏輯關系;空間關系;柱形(狀);ABCD
【解答】
【點評】
聲明:本試題解析著作權屬菁優網所有,未經書面同意,不得復制發布。
發布:2024/5/23 20:38:36組卷:4引用:2難度:0.3
相似題
-
1.以下哪一個選項不是數據分析主要應用場景。( )
A.現狀分析 B.數據運算 C.原因分析 D.預測分析 發布:2024/12/14 1:0:1組卷:5引用:5難度:0.6 -
2.關于數據分析,說法正確的是( )
A.針對調查問卷收集的數據,我們只能針對一個指標進行分析 B.一般情況下,調查平臺不提供分析功能 C.針對調查問卷收集的數據,我們可以對問卷指標進行交叉分析 D.數據分析是指用適當的統計分析方法對收集來的少量數據進行分析 發布:2024/12/14 1:0:1組卷:7引用:2難度:0.7 -
3.數據分析中采取調查問卷,問題設計越多,得到的信息越多。
發布:2024/12/14 22:30:1組卷:3引用:4難度:0.8