欧美日韩亚洲一区二区精品_亚洲无码a∨在线视频_国产成人自产拍免费视频_日本a在线免费观看_亚洲国产综合专区在线电影_丰满熟妇人妻无码区_免费无码又爽又刺激又高潮的视频_亚洲一区区
公務員期刊網(wǎng) 論文中心 正文

談電子文件格式可持續(xù)性風險評估

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談電子文件格式可持續(xù)性風險評估范文,希望能給你帶來靈感和參考,敬請閱讀。

談電子文件格式可持續(xù)性風險評估

摘要:格式可持續(xù)性是確保電子文件永久保存和長期可讀的關鍵因素。本文介紹了國外典型的文件格式風險評估項目,總結了評價電子文件格式可持續(xù)性的7個關鍵指標,包括開放性、采納程度、自描述性、穩(wěn)定性、外部依賴性、技術保護機制、版權和專利,并對這些指標做出了說明。

關鍵詞:電子文件;風險評估;可持續(xù)性;格式評價

文件格式是數(shù)字資源最重要的屬性,決定著數(shù)字資源的可用性。在電子文件管理的很多階段(如選擇、獲取、保存和訪問等)都需要考慮文件格式問題[1]。文件格式可以形象地看成是一種“翻譯語言”,它將數(shù)字資源存于載體上的二進制代碼“翻譯”成用戶可識讀、理解的文件內容。同樣的文件內容,不同的“翻譯語言”(文件格式)轉換出的二進制代碼完全不同。檔案館面對的文件格式種類越多,面臨的可讀性風險越大。正確選擇文件格式,事關電子文件的安全保管。對電子文件格式的可持續(xù)性進行風險評估,有助于檔案館遴選出適合長期保存的文件格式。

1國外典型的文件格式風險評估項目

1.1互聯(lián)網(wǎng)長期保存項目

該項目由丹麥國家與大學圖書館和皇家圖書館合作開展,主要通過管控數(shù)字格式達到長期保存數(shù)字資源的目的,確保在50年或100年后仍可讀取和理解數(shù)字對象。2004年5月,兩家圖書館聯(lián)合《文件格式對策》(HandlingFileFormats)[2]報告。該報告針對檔案數(shù)字格式需求展開,指出適合長期保存的文件格式需要具有可讀性、原始外觀、要素完整、功能完備和保持操控性能等關鍵屬性。報告還重點闡述了評價文件格式未來可用性的幾個標準,包括開放性、可移植性、性能指標、退化程度等,并進一步指出了影響文件格式可持續(xù)性的重要因素,據(jù)此提出了電子文件長期保存的策略。

1.2數(shù)字格式的可持續(xù)性分析

為實施數(shù)字館藏計劃,美國國會圖書館(LibraryofCongress)開展了有關數(shù)字格式可持續(xù)的研究項目,研究具體內容包括:數(shù)字文件格式的戰(zhàn)略規(guī)劃;具有長期可持續(xù)性的文件格式選擇;長期可持續(xù)性格式的維護策略;存在格式風險的文件管理對策及其內容保護[3]。該項目研究成果在《數(shù)字格式:可持續(xù)性、性能和質量因素》(DigitalFormats:FactorsforSustainability,Functionality,andQuality)報告中,報告重點闡述了確定某種數(shù)字文件格式是否具有可持續(xù)性抑或存在風險的方法,指出影響?zhàn)^藏文件格式可持續(xù)性的因素分兩類:一類是影響所有數(shù)字格式可持續(xù)性的基本因素;另一類是針對某類數(shù)字資源質量或性能的特殊因素。前者包括開放性、采用程度、透明度、自描述、外部依賴關系、專利影響和技術保護機制,這些因素涉及所有類別的數(shù)字格式;后者主要針對靜止圖像、聲音、文本文件和視頻文件格式等類別。以靜止圖像格式為例,有關其質量或性能的特殊因素包括渲染能力、清晰度、色彩方案、排版以及是否支持圖形效果等。美國國會圖書館還通過其官方網(wǎng)站了具備(或不具備)長期可持續(xù)性的數(shù)字文件格式,并作出解釋說明。同時,還了保管這些格式資源的對策。

1.3文件格式風險量化評估

荷蘭國家圖書館從電子文件長期保存這一目標出發(fā),采取風險評估的方式對文件格式的可持續(xù)性進行研究,于2008年開發(fā)出可量化的文件格式風險評估方法[4]。該方法包含了衡量文件格式可持續(xù)性的7個指標,分別為開放性、采用性、復雜性、技術保護機制、自我解釋性、穩(wěn)定性、依賴性,每一個指標下再分解出若干個可應用于所有文件格式的特性。所有指標和特性均被賦予分值,分配給每個指標的分值范圍是0—7、每個特性的分值范圍是0—2。對數(shù)字保存和長期利用構成威脅的特征值將被賦予低的分數(shù)值,而對數(shù)字保存和長期可用具有重要作用的特征值會獲得高分數(shù)值。將這種定量評估方法具體應用于某種格式,可以計算出該格式的總分,總分越高,格式越適合長期保存。當然,每種格式的評分會隨時間推移發(fā)生變化。

1.4風險和優(yōu)選格式模板

美國國家檔案與文件署(NARA)早年間接收了大量來自白宮、各聯(lián)邦機構、國會的永久性電子檔案。為化解風險,并對其原生電子檔案的格式狀況進行評判,NARA于2014年創(chuàng)建了一個量化的可用格式模板[5]。該模板用于評估移交至NARA的文件格式的適用性,包含37個評估項,這些評估項按照公開程度、采用程度/流行性、透明度、自描述、外部依賴性、許可和專利、使用加密/權限管理七大類排列,每個類別及其評估項的權重各不相同。與上述美國國會圖書館提供的數(shù)字格式可持續(xù)性分析項目相比,NARA的模板引入了權重概念,并且更具針對性,其評估指標中加入了該格式文件的進館時間、占館藏電子檔案總量的百分比、格式已流行年數(shù)、格式更新情況、格式轉換時的內在風險等指標。因此,NARA的模板已被編制檔案移交指南的團隊所采用,在NARA的移交指南中,所有擬進館永久保存的格式基于上述評估而被分別標注為“首選格式”或“可接受格式”。而對所有已進館電子檔案,則根據(jù)評估狀況區(qū)分為2種高風險、26種中等風險和42種低風險格式。

1.5數(shù)字連續(xù)性項目

英國國家檔案館開展的數(shù)字連續(xù)性項目旨在從可持續(xù)性的角度去評價文件格式[6]。該項目制定了評價文件格式的4個標準,即能力方面:業(yè)務需求得到滿足的程度;質量方面:信息存儲的準確程度,包括精確與損失程度;耐久性方面:時間對文件格式的影響程度,包括流行度、穩(wěn)定性、可恢復性;靈活性方面:格式適應不斷變化環(huán)境的能力,包括互操作性(現(xiàn)有軟件可以訪問的格式種類)、可實現(xiàn)性(編寫軟件與格式交互的難易程度)。每個標準得分范圍在0—5之間,通過一個共同的測量尺度來評估、比較不同的格式。如,若需要評估4種電子文件格式,則制作一個分數(shù)在0—5的表格,再根據(jù)不同的子標準來評估文件格式,確定每個特性的分數(shù),用子標準分數(shù)的平均值確定最后的分數(shù),進行比較判斷。以上都是從維護數(shù)字資源長久保存的角度出發(fā),對電子檔案進行風險評價,但各個項目的評估角度、指標與深度有所不同。綜合來看,格式風險能夠得到量化將更有助于格式遷移工作的展開,降低電子文件長久保管的風險。

2長期保存的電子文件格式風險評估指標

2.1格式開放性

開放性指格式使用者可無障礙地獲取用于創(chuàng)建、維護和驗證該格式文件的工具、技術規(guī)范及說明性文檔。開放性包括以下要求:文件的編碼、壓縮、封裝方式等有明確的規(guī)范或標準;帶有開源的閱讀或創(chuàng)建工具;具有公開、完整的技術說明文檔。一種文件格式如果公開技術標準,并提供完整的技術說明文檔,意味著未來對該格式文件進行解讀或重新構建的技術途徑是暢通的。而如果能提供開源代碼的讀寫軟件,今后遷移、維護該格式文件的成本就要低很多。

2.2格式采納程度

采納程度指該文件格式被接受使用的程度。被廣泛采用的格式淘汰的速度相對較慢,文件格式被廣泛采用主要表現(xiàn)有:存在許多可用產品用于以該格式的創(chuàng)建、操作或內容呈現(xiàn);Web瀏覽器或市場領先的內容創(chuàng)建工具提供對該格式的支持;該格式在全球范圍被廣泛使用,該格式在遺產保護領域(檔案、文博、圖情等需要長期保管數(shù)字資源的行業(yè))普遍認可。

2.3格式自描述性

文件格式的“自我記錄”特征主要指文件中包含的描述性信息的多少,這些描述性信息構成“元數(shù)據(jù)”嵌于文件之中。說明文件屬性的描述性信息,可以是關于文件內容的,也可以是關于文件技術或背景信息的。所有文件格式都內嵌部分元數(shù)據(jù),因此均有某種程度的自描述特征,但如果某種格式可以在創(chuàng)建過程中自動包含或借助外部工具人為嵌入更多描述性元數(shù)據(jù),將來對其的理解就越到位。

2.4格式穩(wěn)定性

文件格式的穩(wěn)定性體現(xiàn)在兩個方面:格式升級的頻度較低和升級后的格式相對之前版本變化較小。具有可持續(xù)性的文件格式對外部技術環(huán)境的變化有較好的適應性,或者說對技術環(huán)境的變化不太敏感。格式經(jīng)常升級或版本間變化過大,兼容性差,將對文件的長期可用造成威脅。文件格式的穩(wěn)定性要求該格式的設計具有一定的前瞻性,具有跨平臺性和良好的交互性。

2.5格式外部依賴性

一個好的文件格式應該做到不依賴于特定的硬件、不依賴于特定的操作系統(tǒng)、不依賴于特定的軟件以及其他外部資源等。格式對某種特定環(huán)境或外部資源的高度依賴,會為數(shù)字文件的保存和長期訪問帶來風險。一旦難以重現(xiàn)其所依賴的特定環(huán)境,文件內容的讀取將變得復雜,甚至根本無法讀取。因此只有文件格式保持一定的獨立性,才不會處于被動境地,失去其可讀性。

2.6格式技術保護機制

技術保護機制是指文件格式中攜帶有某寫技術措施來管控數(shù)字資源的使用和權限歸屬。常見的有密碼保護、復制打印保護、數(shù)字簽名和內容提取保護等。這些措施的設計雖然起到了維護形成者權利的效果,但卻有可能影響檔案機構對電子文件的有效管理和維護。事實上,為有效保存電子文件,檔案部門在必要時需要對文件進行格式遷移或規(guī)范化處理,如果某種格式的文件提供了技術保護機制,那么遷移轉換過程將無法實施。

2.7格式版權和專利

格式的版權和專利將限制檔案機構保存文件內容的能力。雖然解碼某種格式的許可證無需太多成本,甚至是免費的,但專利的存在可能會減緩開源編碼、解碼器的開發(fā)。

作者:王揚揚 張照余 單位:蘇州大學社會學院

诏安县| 额济纳旗| 平度市| 吐鲁番市| 綦江县| 龙山县| 荆门市| 措勤县| 且末县| 威远县| 宽甸| 镇康县| 宕昌县| 石楼县| 新绛县| 孝义市| 通化市| 灯塔市| 五原县| 玉环县| 宜兴市| 祁连县| 文成县| 宣武区| 甘谷县| 泌阳县| 晋州市| 富民县| 安溪县| 奉节县| 乌兰浩特市| 锦州市| 渭南市| 三门县| 射洪县| 临西县| 吴川市| 江华| 云浮市| 汶上县| 白银市|