国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python爬蟲面試寶典(常見問題)

2020-02-22 23:22:02
字體:
來源:轉載
供稿:網友
是否了解線程的同步和異步?

線程同步:多個線程同時訪問同一資源,等待資源訪問結束,浪費時間,效率低

線程異步:在訪問資源時在空閑等待時同時訪問其他資源,實現多線程機制

是否了解網絡的同步和異步?

同步:提交請求->等待服務器處理->處理完畢返回 這個期間客戶端瀏覽器不能干任何事

異步: 請求通過事件觸發->服務器處理(這是瀏覽器仍然可以作其他事情)->處理完畢

鏈表和順序表儲存時各自有什么優點?

1.順序表存儲

原理:順序表存儲是將數據元素放到一塊連續的內存存儲空間,存取效率高,速度快。但是不可以動態增加長度

優點:存取速度高效,通過下標來直接存儲

缺點:1.插入和刪除比較慢,2.不可以增長長度

比如:插入或者刪除一個元素時,整個表需要遍歷移動元素來重新排一次順序

2.鏈表存儲

原理:鏈表存儲是在程序運行過程中動態的分配空間,只要存儲器還有空間,就不會發生存儲溢出問題

優點:插入和刪除速度快,保留原有的物理順序,比如:插入或者刪除一個元素時,只需要改變指針指向即可

缺點:查找速度慢,因為查找時,需要循環鏈表訪問

使用redis搭建分布式系統時如何處理網絡延遲和網絡異常?

由于網絡異常的存在,分布式系統中請求結果存在“三態”的概念,即三種狀態:“成功”、“失敗”、“超時(未知)”

當出現“超時”時可以通過發起讀取數據的操作以驗證 RPC 是否成功(例如銀行系統的做法)

另一種簡單的做法是,設計分布式協議時將執行步驟設計為可重試的,即具有所謂的“冪等性”

數據倉庫是什么?

數據倉庫是一個面向主題的、集成的、穩定的、反映歷史變化的、隨著時間的流逝發生變化的數據集合。它主要支持管理人員的決策分析。

數據倉庫收集了企業相關內部和外部各個業務系統數據源、歸檔文件等一系列歷史數據,最后轉化成企業需要的戰略決策信息。

特點:

面向主題:根據業務的不同而進行的內容劃分;
集成特性:因為不同的業務源數據具有不同的數據特點,當業務源數據進入到數據倉庫時,需要采用統一的編碼格式進行數據加載,從而保證數據倉庫中數據的唯一性;
非易失性:數據倉庫通過保存數據不同歷史的各種狀態,并不對數據進行任何更新操作。
歷史特性:數據保留時間戳字段,記錄每個數據在不同時間內的各種狀態。

假設有一個爬蟲,從網絡上獲取數據的頻率快,本地寫入數據的頻率慢,使用什么數據結構好?

在線求解(o°ω°o)
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 大兴区| 抚松县| 库尔勒市| 盈江县| 雅江县| 宜宾市| 龙口市| 海淀区| 兴海县| 建昌县| 灌南县| 阿拉善右旗| 清河县| 呼伦贝尔市| 长治市| 元朗区| 汝阳县| 武隆县| 礼泉县| 淮滨县| 吕梁市| 盐池县| 福州市| 铜川市| 肃南| 日喀则市| 南通市| 额尔古纳市| 宣恩县| 石阡县| 南宁市| 鹿邑县| 乌兰浩特市| 绍兴县| 清徐县| 汤原县| 镇平县| 吉首市| 康定县| 江西省| 麦盖提县|