小申很喜歡編程,自學一段時間Python后,想體驗它在數據采集和處理方面功能,在老師的建議下他首先嘗試使用python到網絡上“爬”數據。他試著編寫了一個簡單的程序:從某網站爬取了一些單車使用的數據,保存在bike.csv文件中,在用Excel打開此文件時出現了亂碼,如圖所示。

(1)小申從網絡上“爬”數據,即通過互聯網進行數據采集。其完整的流程有三個步驟,分別是:獲取網頁獲取網頁、解析網頁和保存數據。
(2)以下 DD庫與互聯網數據采集有關的。
A.Pandas
B.numpy
C.matplotlib
D.requests
(3)網頁請求方式有多種,GET是最常見的方式,一般用于獲取或者查詢資源信息,響應速度較快。若已經導入了方便發送HTTP請求的庫,要用get方式獲取網頁數據的python代碼(第3行的橫線上)需填寫 requests.jye.ai(url)requests.jye.ai(url);獲取了網頁信息后需要使用BeautifulSoup庫中的方法進行網頁解析,則代碼中對應橫線(第6行)處應填寫 html.jye.aihtml.jye.ai。

(4)接上題,要輸出網頁源碼中title標簽的文本則先要用select屬性抓取title標題,然后再使用print命令輸出,那么print后的橫線處(第8行)應填寫 AA。
A.title.Text
B.sp.text
C.html.title.text
D.sp.title.text
(5)以下 DD是爬蟲技術可能存在的風險。
A.大量占用爬取網站的資源
B.網站敏感信息的獲取造成的不良后果
C.大量訪問目標系統,帶寬被強制占用
D.以上都是
(6)小申又觀察了這份數據文件,發現所有的英文、數字均正常顯示,這是因為西文字符集很小,只需要 11個字節就能表示所有西文字符。其中字節(Byte)是計算機中信息組織和存儲的基本單位,生活中我們還用過KB、MB、TB等單位,若需要進行換算的化:1TB=240240Byte(用冪次表示)。
(7)請簡單說明bike.csv文件里中文字符出現亂碼的原因。
【考點】Python語言基本數據結構.
【答案】獲取網頁;D;requests.jye.ai(url);html.jye.ai;A;D;1;240
【解答】
【點評】
聲明:本試題解析著作權屬菁優網所有,未經書面同意,不得復制發布。
發布:2024/11/13 3:0:1組卷:10引用:1難度:0.1
相似題
-
1.為了了解不同班級間的信息技術成績差異,老師搜集了某次周練的選擇題部分數據如圖a;
(1)結合圖a,其中屬于數據整理的是
A.對重復的數據可進行合并處理
B.通過公式計算全班平均分
C.修正A78單元格的數據
D.若有缺失的數據,可采用隨意數據來填充
(2)利用Python程序繪制如圖b所示的圖表,請在橫線處補充代碼:①發布:2025/1/2 10:30:2組卷:5引用:1難度:0.4 -
2.龍龍家養了很多植物,學習了信息系統知識后,想做一個給植物自動澆水的信息系統。系統可以根據土壤的濕度情況,對植物適當澆水;不在家時還可以通過瀏覽器來查看植物土壤濕度,也可以遠程控制系統給植物額外加水。信息系統的架構如圖a所示:
此系統使用micro:bit 獲取土壤傳感器的模擬數據,并將數據通過WiFi傳輸到服務器,保存在數據庫文件“data.jye.ai“中,數據表如圖b所示。服務器通過瀏覽器顯示最新檢測到的十次土壤濕度數據、當前水泵的狀態及相關信息,如圖c。服務器根據最近一次的土壤濕度數據控制開發板來決定是否執行對應水泵的供水。
完成此系統功能的部分功能代碼如下:
(1)該信息系統采用的架構為
(2)顯示最近十次土壤濕度數據頁面對應的視圖函數名為
(3)請在橫線處填入合適的代碼,完成程序。發布:2025/1/2 10:30:2組卷:3引用:1難度:0.2 -
3.社團招新。每人可填報一個項目并進行面試,各社團錄取面試成績不低于60分的學生并按成績從高到低排列。假設社團預錄取人數為k人,面試成績不低于60分的有m人。若m<k,則m人全部錄取;否則按成績從高到低錄取前k人(與第k人成績相同者均錄取)。
編寫VB程序,功能如下:在列表框Listl中顯示n個社團的預錄取人數,在列表框List2中顯示所有參與面試的學生數據,單擊“錄取”按鈕Commandl,在列表框List3中按社團編號升序,面試成績降序顯示錄取結果。程序運行界面如圖所示。
(1)在VB語句 Labell.Caption=Textl.Text中,Label1、Caption、Text1.Text 依次表示 為
(2)實現上述功能的部分VB程序如下,請在橫線處填入合適的代碼。
(3)程序中加框處代碼有錯,請改正。發布:2025/1/2 12:0:1組卷:0引用:1難度:0.3