獲取舊數(shù)據(jù),智能硬件讓磁盤起死回生
發(fā)布時(shí)間:2017-06-21 責(zé)任編輯:susan
【導(dǎo)讀】 將文件轉(zhuǎn)移到現(xiàn)代媒介上只是第一步。接下來要搞清楚其中的內(nèi)容,而這需要另一套工具。Parker的IT服務(wù)商將其介紹給一家數(shù)據(jù)恢復(fù)公司。事實(shí)證明,較老的磁盤是一種小型軟盤,即以極少數(shù)驅(qū)動(dòng)器能讀取的格式寫入的雙面磁盤。
2012年,William Parker和同事試圖尋找一個(gè)追蹤5萬余棵精心栽培的白云杉在10年間和1500公里范圍內(nèi)生長情況的數(shù)據(jù)集。他們發(fā)現(xiàn)了一盒計(jì)算機(jī)磁帶—— 一個(gè)相對(duì)現(xiàn)代的3.5英寸磁盤和一箱子較老的5.25英寸磁盤。這些磁盤包含了來自上世紀(jì)70年代田間試驗(yàn)、被用于提高商用木材產(chǎn)量的數(shù)據(jù)。在加拿大安大略森林研究所任職的Parker需要一些方法,以評(píng)估諸如“協(xié)助遷移”等策略可能如何在這個(gè)日益變暖的星球上保護(hù)森林。而這種長期的系統(tǒng)研究正是他要找的東西。“當(dāng)我們發(fā)現(xiàn)它時(shí),那種感覺就像‘上帝呀!我們終于找到它啦!’”
不過,事情并沒有發(fā)展得那么快。Parker啟動(dòng)一臺(tái)舊電腦,但它無法讀取最新的磁盤。同時(shí),也沒有人擁有嘗試讀取其他磁盤的設(shè)備。
Parker的IT服務(wù)商將其介紹給一家數(shù)據(jù)恢復(fù)公司。事實(shí)證明,較老的磁盤是一種小型軟盤,即以極少數(shù)驅(qū)動(dòng)器能讀取的格式寫入的雙面磁盤。專家們利用一個(gè)打孔機(jī)(有點(diǎn)類似于數(shù)字取證)以及一些將過時(shí)的軟件轉(zhuǎn)化成現(xiàn)代電子表格的程序,最終讀取了這些磁盤。
Parker的經(jīng)歷是很多研究人員所遇到的問題的縮影。位于美國威斯康辛州麥迪遜市的AVPreserve公司檔案保管員Bertram Lyons表示,從過時(shí)的數(shù)據(jù)存儲(chǔ)媒介中獲取信息就像解鎖一系列籠子。“科學(xué)家擁有很多困在舊格式中的信息。有些是硬件障礙,有些是編碼結(jié)構(gòu)的問題。”
希望從過時(shí)的媒介中獲取數(shù)據(jù)的科學(xué)家首先需要找到能讀取它的設(shè)備,并將其連接到一臺(tái)現(xiàn)代電腦上。不過,將文件轉(zhuǎn)移到現(xiàn)代媒介上只是第一步。接下來要搞清楚其中的內(nèi)容,而這需要另一套工具。
去當(dāng)?shù)貓D書館尋求幫助
當(dāng)提到舊硬件時(shí),一個(gè)不錯(cuò)的開始方式是去當(dāng)?shù)貓D書館。位于美國華盛頓特區(qū)的公共圖書館記憶實(shí)驗(yàn)室提供了一個(gè)自己動(dòng)手(DIY)的工作站,比如人們可將3.5英寸磁盤轉(zhuǎn)移成現(xiàn)代格式。斯坦福大學(xué)圖書館則為5.25英寸磁盤提供類似資源。澳大利亞墨爾本大學(xué)電子學(xué)術(shù)研究中心主任Gavan McCarthy擁有一個(gè)能處理很多格式的“冗余技術(shù)圖書館”。“如果你有磁帶、磁盤以及它能放進(jìn)去的任何東西,我們就有對(duì)應(yīng)的轉(zhuǎn)換插頭。”McCarthy表示。
只需要為每張磁盤支付幾美元,諸如位于加州的軟盤公司等轉(zhuǎn)換服務(wù)企業(yè)便能提供幫助。專門處理受損媒介的數(shù)據(jù)恢復(fù)服務(wù)也是這種情況??偛课挥诩又葜Z瓦托市的數(shù)據(jù)恢復(fù)公司DriveSavers擁有約2萬個(gè)存儲(chǔ)設(shè)備,其中最老的一個(gè)是1980年舒加特聯(lián)合公司的ST-506硬盤驅(qū)動(dòng)器。Parker利用位于多倫多且同穆勒媒介服務(wù)公司簽訂了分包合同的CBL數(shù)據(jù)恢復(fù)公司恢復(fù)他的數(shù)據(jù),并為此支付了約3000美元。
成功取決于媒介的脆弱性及其被儲(chǔ)存的方式。5.25英寸磁盤很容易遭到油和壓力的破壞,艾美加公司的壓縮盤則很不穩(wěn)定。不過,McCarthy介紹說,這不僅僅是“電子信息的衰減”問題,或者說對(duì)媒介本身造成的破壞,從而使舊的媒介無法被讀取。“機(jī)器和零部件的數(shù)量也在以令人難以置信的速度不斷減少。”具有諷刺意味的是,紙張反而更加穩(wěn)定。
與時(shí)俱進(jìn)
擁有舊驅(qū)動(dòng)器和電源線的人們或許會(huì)受誘惑建立自己的DIY工作站,但最終發(fā)現(xiàn),新的電腦不再含有將其同驅(qū)動(dòng)器連接起來的插件板和接口。比如,一些舊的壓縮盤要插進(jìn)并行端口—— 一個(gè)如今幾乎已經(jīng)消失的接口。不過,現(xiàn)在有很多可以幫上忙的適配器。它們主要被檔案保管員和視頻游戲的狂熱愛好者使用,其中最尖端的是由軟件保護(hù)協(xié)會(huì)開發(fā)的KryoFlux設(shè)備。它能通過USB接口轉(zhuǎn)移軟盤數(shù)據(jù)。位于英國梅德斯通的KryoFlux保護(hù)技術(shù)集團(tuán)就該設(shè)備向私人用戶收取約100美元的費(fèi)用。
與此同時(shí),現(xiàn)代電腦上的操作系統(tǒng)可能無法讀取舊格式的文件??屏_拉多大學(xué)媒介考古學(xué)實(shí)驗(yàn)室主任Lori Emerson表示,他們?cè)鴰椭?dāng)?shù)匾患铱茖W(xué)博物館恢復(fù)壓縮盤上的秘密文件,而這取決于找到了合適的電腦(來自1994年的運(yùn)行OS 7系統(tǒng)的威力麥金塔8100計(jì)算機(jī))讀取這份文件。最終證明,這是一個(gè)來自舊版本的引文管理軟件EndNote的程序庫。
伊利諾依大學(xué)藥物化學(xué)研究員Guido Pauli建議,對(duì)付數(shù)據(jù)衰減的最好方法是與時(shí)俱進(jìn)。Pauli維護(hù)著讓研究人員尋找天然產(chǎn)物(比如植物提取物)以及報(bào)道過的生物活性的NAPRALERT數(shù)據(jù)庫。它起始于由Pauli博士生導(dǎo)師組織起來的索引卡,并且自此以后經(jīng)歷了磁帶和各種磁盤格式,如今則以云存儲(chǔ)和硬盤驅(qū)動(dòng)器的形式分布在兩個(gè)大洲。“我確實(shí)有一些舊的媒介,但不會(huì)因?yàn)闊o法讀取它們而影響工作。”Pauli表示。
理解和評(píng)估數(shù)據(jù)文件
恢復(fù)舊數(shù)據(jù)的下一個(gè)挑戰(zhàn)是搞清楚數(shù)據(jù)文件本身。對(duì)于數(shù)字檔案保管員來說,維護(hù)數(shù)據(jù)的第一步是獲取磁盤鏡像,即將所有電子數(shù)據(jù)逐位對(duì)應(yīng)地拷貝到一個(gè)設(shè)備上,包括覆蓋的和隱藏的文件。雖然這是數(shù)字取證技術(shù)的范圍,但針對(duì)此類工具的商業(yè)許可會(huì)花費(fèi)上千美元。此外,由于它們關(guān)注的是法律應(yīng)用,因此忽略了一些對(duì)檔案保管員來說非常重要的特定功能,比如編寫敏感信息。
這促使檔案保管人員創(chuàng)建了開源“虛擬機(jī)器”——BitCurator。它對(duì)磁盤進(jìn)行鏡像,并且指導(dǎo)人們自行操作內(nèi)容解讀的最初幾步,比如檢測(cè)比特和字節(jié)如何被格式化成供諸如Windows NT操作系統(tǒng)、Linux或者DOS等讀取的文件。格式越模糊,解讀起來便會(huì)越困難。
創(chuàng)建穆勒媒介服務(wù)公司的Chris Muller編寫了軟件來解鎖舊文件。不過,在他看來,人類線索有時(shí)會(huì)更有價(jià)值。在一個(gè)潛在項(xiàng)目的初期,Muller會(huì)讓客戶把初始媒介的照片用電子郵件發(fā)送給他。有時(shí),對(duì)客戶毫無意義的某個(gè)專家的信手涂鴉正是讓Muller推導(dǎo)出備份數(shù)據(jù)時(shí)可能利用了哪種格式和軟件的字母或數(shù)字。
BitCurator的主要推動(dòng)者之一、來自北卡羅萊納大學(xué)教堂山分校信息和圖書館科學(xué)學(xué)院的Christopher Lee解釋說,下一步是評(píng)估文件。文件可能以無法識(shí)別的形式存在,因此很難知道哪種程序可以打開它。“軟件經(jīng)常會(huì)成為障礙。”Lee表示。研究人員可以利用名為“文書編輯”的計(jì)算機(jī)程序,顯示此類文件初始的二進(jìn)制內(nèi)容。運(yùn)氣好的話,這或許能揭示某個(gè)文件是用什么軟件生成的,或者使可用數(shù)據(jù)被直接提取出來。BitCurator還同美國國家標(biāo)準(zhǔn)與技術(shù)研究所軟件參考圖書館建立互動(dòng),以試圖將文件同創(chuàng)建它們的軟件匹配起來。
不過,在數(shù)字檔案保管員看來,有時(shí)最大的障礙不是技術(shù)上的而是人。將文件提取出來然后僅知道它有6列和10萬行是不夠的。研究人員需要知道這些數(shù)字意味著什么。例如,由來自密歇根州高校校際政治與社會(huì)研究聯(lián)盟的Amy Pienta領(lǐng)導(dǎo)的檔案保管員購買了翻新的穿孔卡片讀出器,以便從上世紀(jì)50年代一項(xiàng)關(guān)于退休的大規(guī)模隊(duì)列研究中獲取數(shù)據(jù)。不過,在這些卡片被轉(zhuǎn)換成數(shù)字代碼后,他們需要密碼本以便知道這些數(shù)字指的是什么——代碼“1”意味著“是”還是“否”?
Parker的故事則有了一個(gè)有趣的結(jié)尾:電子數(shù)據(jù)僅包含了每組樹木的平均值,但一個(gè)幸運(yùn)的電話表明,關(guān)于每棵樹測(cè)量數(shù)據(jù)的紙質(zhì)記錄被保存下來。為此,他驅(qū)車好幾個(gè)小時(shí),去會(huì)見創(chuàng)造這些原始數(shù)據(jù)的科學(xué)家并且收集了數(shù)據(jù)表。
特別推薦
- 是否存在有關(guān) PCB 走線電感的經(jīng)驗(yàn)法則?
- 一文看懂電壓轉(zhuǎn)換的級(jí)聯(lián)和混合概念
- 第12講:三菱電機(jī)高壓SiC芯片技術(shù)
- 準(zhǔn) Z 源逆變器的設(shè)計(jì)
- 貿(mào)澤電子持續(xù)擴(kuò)充工業(yè)自動(dòng)化產(chǎn)品陣容
- 低功耗嵌入式設(shè)計(jì)簡介
- 如何通過基本描述找到需要的電容?
技術(shù)文章更多>>
- 瑞典名企Roxtec助力構(gòu)建安全防線
- 貿(mào)澤與Cinch聯(lián)手發(fā)布全新電子書深入探討惡劣環(huán)境中的連接應(yīng)用
- 第二十二屆中國國際軟件合作洽談會(huì)在成都順利舉行
- 混合信號(hào)示波器的原理和應(yīng)用
- 功率器件熱設(shè)計(jì)基礎(chǔ)(十)——功率半導(dǎo)體器件的結(jié)構(gòu)函數(shù)
技術(shù)白皮書下載更多>>
- 車規(guī)與基于V2X的車輛協(xié)同主動(dòng)避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車安全隔離的新挑戰(zhàn)
- 汽車模塊拋負(fù)載的解決方案
- 車用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
空心線圈
控制變壓器
控制模塊
藍(lán)牙
藍(lán)牙4.0
藍(lán)牙模塊
浪涌保護(hù)器
雷度電子
鋰電池
利爾達(dá)
連接器
流量單位
漏電保護(hù)器
濾波電感
濾波器
路由器設(shè)置
鋁電解電容
鋁殼電阻
邏輯IC
馬達(dá)控制
麥克風(fēng)
脈沖變壓器
鉚接設(shè)備
夢(mèng)想電子
模擬鎖相環(huán)
耐壓測(cè)試儀
逆變器
逆導(dǎo)可控硅
鎳鎘電池
鎳氫電池