一碗酸梅湯作品

第52章 “感知機”的初次實戰

 

    業餘黑客有個潛規則。

    政府機關、金融系統、電子商務……這類網站的後臺，是機密重地，通常有高手坐鎮，沒事最好別去溜達。

    被網監或者安全專家盯上，十有八九落不了好。

    而個人網站、小型辦公網絡、學校網站……

    這種信息安全不太敏感的，僅僅是瀏覽或下載一些數據，一般不會有什麼大問題。

    比如從鐵道部官網12306爬點數據，做個輔助訂票系統什麼的……

    但無論任何地方，肆意破壞總是不被允許的，這是底線。

    《原始數據表》的奇怪情況，身份證位數不對，側面支持了這種可能性。

    通過黑客手段獲取數據，有時候會遇到一些匪夷所思的問題，比如數據格式特殊，下載的數據寬度受限……

    有時候，甚至在後臺數據庫裡，只能找到數據的一部分，而其餘部分被保存在無法訪問的文件裡。

    寫後臺程序的人，會基於各種各樣的理由，寫出可讀性極差的代碼。

    比如:讀寫效率、數據安全、修補bug、系統健壯……

    又或者不想被人繼承代碼，取代自己的位置，甚至單純為了個人興趣、編程風格……

    都可能導致這些人，搞出種種令人費解的騷操作。

    當然，也可能老高的技術還有缺陷，或者他是從虛擬內存、交換文件裡挖掘出來的數據。

    也有可能在“作案”過程中被人盯上，不得不提前斷開連接……

    總之，擺在江寒面前的，就是這麼兩張各有缺陷的表格，外加一個圖片壓縮包。

    接下來，江寒首先要做的，是從《原始數據表》裡，篩選出需要的記錄，複製到《報名信息表》裡。

    這一步非常簡單，只要用excel自帶的vbscript編寫一個小腳本，將兩個表格按照姓名匹配，就可以得到每個考生在原始表裡的行號。

    當然，同名同姓是避免不了的，可能報名信息裡一個“張三”，在原始數據裡會找到一堆“張三”……這個一會兒再說。

    腳本編程非常簡單，江寒只用了二十分鐘，就寫完程序並調試無誤。

    按了一下預設的快捷鍵，腳本開始執行。

    一邊是3萬多行的考生姓名，一邊是10萬多行的原始數據，腳本足足跑了八分鐘，才得到了一個映射關係表。

    接下來，是第二個腳本，參照映射關係表，將原始數據文件篩選出需要保留的行，其他行全都刪除，然後按照《報名信息表》的序號，重新進行排序，得到臨時文件1。