試卷征集
          加入會員
          操作視頻

          項目:探究高一各學科相關性分析
          [項目情境]
          在信息化浪潮的推動下,互聯網技術不斷發展,云計算、移動互聯網、大數據和人工智能
          等新興技術嶄露頭角。使用數據挖掘相關技術對中學教學活動中產生的數據進行收集與處理,獲取有利于教學的相關信息,也是推進智慧教育的舉措之一。在教學過程中,學科考試成績能夠在一定程度反映學生的認知發展水平,某校對高一年級學生的成績進行數據處理,分析各學科之間的關聯度找出優勢學科,對教學及學生選科有重要的參考價值。
          [項目綜述]
          (一) 概述項目目的、方法和過程。根據要求,回答問題。
          (1)數據分析需要使用恰當的方法和工具,對數據進行各種分析。我們可以通過
          關聯分析
          關聯分析
          尋找數據之間的關聯性或相關性,可以通過
          聚類分析
          聚類分析
          在分類標準未知的情況下進行數據自動分類,可以根據分類準則通過
          數據分類
          數據分類
          對未知數據進行預測。(選填:數據分類、關聯分析、聚類分析)
          (2)本項目主要通過模擬大數據采集與分析方法,采用
          關聯分析
          關聯分析
          (選填:數據分析、關聯分析、聚類分類)的方法進行數據分析,試圖分析高一年級學生各 學科之間的關聯度,找出兩到三門優勢學科,作為指導教學及學生選科的重要參考依據。
          (3)確定需要收集的數據為歷年高一年級期中期末的各學科成績,在數據收集、發布、傳播、共享時,為保護學生的隱私應采用
          匿名處理
          匿名處理
          (選填:數據精度處理、人工干擾、匿名處理、訪問控制)等技術手段。
          (4)選用Python語言作為數據分析工具,需要通過調用諸如標準模塊、自定義模塊以及第三方擴展庫的支持,從而高效的完成數據采集處理、分析、可視化。數據分析步驟有①數據呈現②數據分類/關聯分析/聚類分析③數據采集④分析報告⑤數據預處理,正確的順序是
          ③⑤②①④
          ③⑤②①④
          。(寫出序號即可)
          [項目實施]
          (一)數據采集與預處理
          Ⅰ、(24分)圖1-1為記錄歷年高中各科成績的部分文件,圖1-2為獲取所有高一成績并寫人指定文件“高-考試成績總.xlsx“的部分程序代碼。圖1-3為獲取的高一考試成績的部分數據內容。根據要求,回答問題。

          (1)觀察圖1-2,該程序用
          循環
          循環
          結構嵌套
          選擇或分支
          選擇或分支
          結構(選填:順序、選擇、循環)描述算法,實現從若干個xlsx文件中篩選出高一成績并保存 為數據文件,其中在Python語言中表示判斷數據大小關系的運算符“==”表示
          等于
          等于
           ( 選填:不等于等于)。補充程序代碼中缺失的語句,應在下橫線處填寫
          ”高一”
          ”高一”

          (2)對采集的數據進行有效存儲,以便對數據進行分析和使用。海量的數據幾乎包含一切形式的結構化、半結構化以及非結構化的數據。網絡中的音視頻、圖片、地理位置、網絡日志等數據屬于
          非結構化
          非結構化
          數據,如圖1-3,“高一考試成績總.xlsx“中的數據屬于
          結構化
          結構化
          數據。(選填:結構化、非結構化)
          (3)在數據分析之前,需要運用
          特征探索
          特征探索
          方法(選填:特征探索、關聯分析、聚類分析、數據分類)對數據進行預處理,發現和處理缺失值以保證數據的完整,還需要對異常數據進行清理,分析是否有冗余數據等。觀察圖1-3,“201”屬于
          異常值
          異常值
          數據,虛線部分屬于
          缺失值
          缺失值
          數據(選填:缺失值、異常值、冗余值),應當刪除數據所在
          (選填:行、列)。
          (4)觀察圖1-3表格的數據,在收集數據的過程中,你認為哪些數據可以不采集?為什么?
          (二)數據分析與可視化
          Ⅱ.(14分)運用Python語言編程進行數據分析與可視化表達,分析部分結果如圖2-1、2-2。根據要求,回答問題。

          (1)觀察圖2-1,該校學生地理物理生物同時優秀的概率最
          ,政治、物理、化學同時優秀的概率較低。
          (2)為便于理解數據之間的關系,使用數據可視化工具可以圖表形式直觀呈現。如折線圖可以表示關于
          趨勢
          趨勢
          的分析、散點圖可以表示關于
          邏輯關系
          邏輯關系
          的分析、數據地圖可以表示關于
          空間關系
          空間關系
          的分析(選填:邏輯關系、空間關系、趨勢)。如圖2-2所示選用
          柱形(狀)
          柱形(狀)
          圖將數據分析可視化呈現。
          (3)下列關于數據可視化的描述中,正確的是
          ABCD
          ABCD
          。(多選)
          A.可視化也可以將數據以地圖、動畫等形式表示
          B.可視化可以有效提升數據分析的效率
          C.可視化可以讓人們快速抓住要點信息
          D.可視化可以幫助人們發現數據背后的價值
          (三)分析報告
          Ⅲ.(7分)在數據分析中,使用數據可視化工具可以直觀的呈現數據之間的關系,尋找數據之間的內在規律,最終實現數據的應用。
          (1)觀察圖2-2,說說你從圖中發現了什么?挖掘出哪些信息?
          (2)結合自己的學習和生活,談一談數據的重要性。(100字左右)

          【答案】關聯分析;聚類分析;數據分類;關聯分析;匿名處理;③⑤②①④;循環;選擇或分支;等于;”高一”;非結構化;結構化;特征探索;異常值;缺失值;行;高;趨勢;邏輯關系;空間關系;柱形(狀);ABCD
          【解答】
          【點評】
          聲明:本試題解析著作權屬菁優網所有,未經書面同意,不得復制發布。
          發布:2024/5/23 20:38:36組卷:4引用:2難度:0.3
          相似題
          • 1.以下哪一個選項不是數據分析主要應用場景。(  )

            發布:2024/12/14 1:0:1組卷:5引用:5難度:0.6
          • 2.關于數據分析,說法正確的是(  )

            發布:2024/12/14 1:0:1組卷:7引用:2難度:0.7
          • 3.數據分析中采取調查問卷,問題設計越多,得到的信息越多。
             
            (判斷對錯)

            發布:2024/12/14 22:30:1組卷:3引用:4難度:0.8
          APP開發者:深圳市菁優智慧教育股份有限公司| 應用名稱:菁優網 | 應用版本:5.0.7 |隱私協議|第三方SDK|用戶服務條款
          本網部分資源來源于會員上傳,除本網組織的資源外,版權歸原作者所有,如有侵犯版權,請立刻和本網聯系并提供證據,本網將在三個工作日內改正