隨著互聯(lián)網(wǎng)技術(shù)、云計算、物聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展, 電子政務(wù)也向著大數(shù)據(jù)方向發(fā)展開來, 整合、互聯(lián)、共享、重構(gòu)、高效將成為政務(wù)大數(shù)據(jù)發(fā)展的趨勢。

  但政務(wù)大數(shù)據(jù)的開放共享在提升辦事效率、輔助政府決策的同時, 也面臨著數(shù)據(jù)安全問題, 考驗著數(shù)據(jù)治理能力。復(fù)旦大學(xué)國際關(guān)系與公共事務(wù)學(xué)院副教授、數(shù)字與移動治理實驗室主任鄭磊告訴本刊記者, 政務(wù)數(shù)據(jù)開放后的關(guān)鍵問題是對這些數(shù)據(jù)的利用和再利用, 目前政府的數(shù)據(jù)治理能力還有待提高。

  數(shù)據(jù)開放不等于簡單的信息公開

  《中國電子政務(wù)發(fā)展報告 (2017) 》 (以下簡稱《報告》) 指出, 政務(wù)大數(shù)據(jù)的來源不同于其他行業(yè)和領(lǐng)域的大數(shù)據(jù), 有其獨特的含義和價值。數(shù)據(jù)來源多樣復(fù)雜, 政務(wù)大數(shù)據(jù)來源大致可包含以下四類:第一是業(yè)務(wù)數(shù)據(jù), 是政府在權(quán)力行使過程中采集和產(chǎn)生的數(shù)據(jù), 特征是價值密度大、以架構(gòu)化數(shù)據(jù)為主;第二是社會化數(shù)據(jù), 是銀行、水電、交通等企業(yè)、公民在社會活動中產(chǎn)生的數(shù)據(jù), 特征是相對集中、體量大、價值密度中等;第三是互聯(lián)網(wǎng)數(shù)據(jù), 是在互聯(lián)網(wǎng)上活動時產(chǎn)生的數(shù)據(jù), 部分反映社會活動狀況, 特征是數(shù)據(jù)分散、體量大、結(jié)構(gòu)多樣;第四是物聯(lián)網(wǎng)數(shù)據(jù), 是通過互聯(lián)網(wǎng)設(shè)備采集獲得的氣象、環(huán)境、影像等數(shù)據(jù), 特征是體量大、高增長、噪聲大。

  大容量、多類型的政務(wù)數(shù)據(jù)面臨著復(fù)雜的開放共享問題。

  香港大學(xué)法律學(xué)院博士后研究員陳詠熙指出, 政府?dāng)?shù)據(jù)開放共享不同于簡單的政府信息公開。從價值取向上看, 前者是用數(shù)據(jù)驅(qū)動來改善經(jīng)濟、政務(wù)、社會服務(wù), 后者是通過保障公民知情權(quán)來促進民主監(jiān)督;從數(shù)據(jù)量上看, 前者是大規(guī)模的數(shù)據(jù)化, 后者主要是紙面信息和少量電子化;從數(shù)據(jù)處理流程上看, 前者是多向且動態(tài)流轉(zhuǎn)的, 后者是單向且相對靜態(tài);從數(shù)據(jù)處理能力上看, 前者是基于大數(shù)據(jù)運算能力的普及化, 后者主要取決于個人的處理能力。

  鄭磊也認為, 開放數(shù)據(jù)跟傳統(tǒng)的信息公開有所不同。世界銀行對開放數(shù)據(jù)的定義是, 數(shù)據(jù)可以被任何人出于任何目的自由地利用和再利用。完整的、可機讀、一手的、非歧視、及時的、非專屬性、可獲取、免授權(quán)是開放數(shù)據(jù)具有的主要特征?!八貏e強調(diào)的一點是數(shù)據(jù)開放之后的利用和再利用, 而不僅僅是開放之后被別人知情。而且開放的是海量的、電子化的數(shù)據(jù), 而不僅是開放一些文件那么簡單。”鄭磊說。

  《報告》指出, 政務(wù)大數(shù)據(jù)在開放、共享和應(yīng)用中主要面臨四方面挑戰(zhàn), 需要建設(shè)者重點關(guān)注。

  一是平臺服務(wù)能力的挑戰(zhàn)。通過構(gòu)建不同類型數(shù)據(jù)融合的大數(shù)據(jù)平臺, 支撐數(shù)據(jù)統(tǒng)一存儲、統(tǒng)一管理、構(gòu)建多樣化應(yīng)用, 但隨之而來需要面對幾種典型問題, 首先利用同一個大數(shù)據(jù)平臺支撐不同部門、不同的應(yīng)用系統(tǒng)構(gòu)建各自的大數(shù)據(jù)應(yīng)用, 如何能避免應(yīng)用對平臺資源調(diào)用的沖突;在構(gòu)建了融合的大數(shù)據(jù)平臺后, 如何在共享數(shù)據(jù)資產(chǎn)的同時, 保證數(shù)據(jù)權(quán)屬的完整性, 有效避免數(shù)據(jù)資產(chǎn)的泄露。

  二是數(shù)據(jù)處理能力的挑戰(zhàn)。隨著政務(wù)大數(shù)據(jù)的增加, 各類新的數(shù)據(jù)類型層出不窮, 對數(shù)據(jù)處理能力提出越來越高的要求。一方面, 隨著政務(wù)相關(guān)數(shù)據(jù)來源范圍的擴大, 以及音視頻內(nèi)容的增長, 每天都會有海量的增量數(shù)據(jù)生成, 對這些數(shù)據(jù)及時進行抽取、轉(zhuǎn)換、加載的批量處理, 將面臨巨大挑戰(zhàn)。另一方面, 對數(shù)據(jù)的實時處理能力要求越來越高, 政務(wù)服務(wù)即辦件比例的提升, 信用體系對外即時響應(yīng)服務(wù)的擴展等, 都要求對各類數(shù)據(jù)及時進行有效性驗證。

  三是, 數(shù)據(jù)安全的挑戰(zhàn)。大數(shù)據(jù)的安全與傳統(tǒng)信息安全相比變得更加復(fù)雜, 主要有三個方面:首先, 大量數(shù)據(jù)匯集, 其中包括大量政務(wù)服務(wù)數(shù)據(jù)、用戶信息、個人的隱私和各種行為的細節(jié)記錄, 這些數(shù)據(jù)的集中存儲增加了數(shù)據(jù)泄露風(fēng)險;其次, 因為一些敏感數(shù)據(jù)的所有權(quán)和使用權(quán)并沒有被明確界定, 很多基于大數(shù)據(jù)的分析需要考慮到其中涉及的個體隱私問題;再次, 大數(shù)據(jù)對數(shù)據(jù)完整性、可用性和秘密性帶來挑戰(zhàn), 在防止數(shù)據(jù)丟失、被盜取、被濫用和被破壞上存在一定的技術(shù)難度。

  四是數(shù)據(jù)融合共享的挑戰(zhàn)。數(shù)據(jù)的海量增長伴隨著有用信息的不足, 想用的、能用的數(shù)據(jù)無處可尋, 可用的、可信的數(shù)據(jù)極端匱乏, 政務(wù)領(lǐng)域的海量數(shù)據(jù)多處于“休眠”狀態(tài), 真正用于提升業(yè)務(wù)效率、改變業(yè)務(wù)流程、變革業(yè)務(wù)發(fā)展的應(yīng)用并不多。有些職能部門對數(shù)據(jù)的共享開放消極被動, 有些部門基于風(fēng)險的考慮不愿將業(yè)務(wù)數(shù)據(jù)拿出來與其他部門共享, 有些部門限于信息壁壘和標(biāo)準(zhǔn)缺失無法共享開放。

  數(shù)據(jù)開放與隱私保護產(chǎn)生沖突

  在政務(wù)大數(shù)據(jù)開放的過程中, 最受人們關(guān)注的就是隱私問題。陳詠熙指出, 海量的個人信息正在進入政府?dāng)?shù)據(jù), 這些信息有可能被第三方再利用, 而非個人信息經(jīng)大數(shù)據(jù)挖掘、剖析也轉(zhuǎn)化為個人信息, 這些問題使得政府?dāng)?shù)據(jù)開放可能與個人隱私保護產(chǎn)生沖突。

  據(jù)陳詠熙介紹, 香港曾經(jīng)出現(xiàn)過一款名為“起你底”的App, 就引發(fā)了有關(guān)數(shù)據(jù)開放和隱私保護的爭議。

  “起你底”是香港數(shù)據(jù)庫公司GDI2012年推出的一款軟件, 軟件錄入逾200萬宗法庭審訊紀錄資料, 使用者只要下載軟件, 輸入所查之人的中文或英文姓名, 便可查閱這個軟件從司法機構(gòu)、破產(chǎn)管理署、公司注冊處等不同渠道收集到的市民訴訟、破產(chǎn)及公司董事資料, 有的連身份證號碼、住址等都可查到。

  公司表示, 有關(guān)訴訟的資料都是由公開渠道及合法途徑取得, 所有數(shù)據(jù)及記錄的內(nèi)容均無篡改。但有市民認為, 此舉卻隨時侵犯個人私隱, 對被查閱人士造成不公平, 加上同名同姓的人甚多, 所得數(shù)據(jù)未必準(zhǔn)確。香港個人資料私隱專員公署2012年接獲了12宗市民針對“起你底”的投訴及60宗查詢。

  公署對此介入調(diào)查后認為, 軟件收集已公開于公共領(lǐng)域的零碎個人數(shù)據(jù), 經(jīng)整合后給人作審查用途及商業(yè)用途, 明顯偏離數(shù)據(jù)公開原意, 于是與2013年7月31日發(fā)出執(zhí)行通知, 要求停止程序繼續(xù)披露其持有的個人數(shù)據(jù)。陳詠熙指出, 公署認為公諸于眾的個人數(shù)據(jù)仍受《個人資料 (私隱) 條例》等香港現(xiàn)行的法律法規(guī)的保護, 因此“起你底”App嚴重侵犯個人私隱。首先, App違背了一系列數(shù)據(jù)保障原則, 比如個人數(shù)據(jù)的使用, 必須與數(shù)據(jù)最初收集的目的相同或直接相關(guān), 除非事先取得數(shù)據(jù)主體的同意;數(shù)據(jù)準(zhǔn)確無誤;數(shù)據(jù)主體有權(quán)查閱其數(shù)據(jù)并更正不準(zhǔn)確者。其次, 影響了曾經(jīng)犯事者自新的機會。第三, 違反了數(shù)據(jù)主體對數(shù)據(jù)私隱的合理期待。

  但公署的決定也引起了一些反對意見。有資訊業(yè)界人士認為, 如果說對公共領(lǐng)域內(nèi)的個人信息進行再利用得出新的結(jié)論, 屬于背離了信息使用的最初目的, 那么就是斬斷了大數(shù)據(jù)應(yīng)用的關(guān)鍵一環(huán)。

  這一案例中反映出的大數(shù)據(jù)開放應(yīng)用與傳統(tǒng)信息保護制約的沖突值得人們深思。陳詠熙指出, 從全球來看, 協(xié)調(diào)公開與隱私問題主要有兩種模式, 一種是以美國為代表的偏向信息公開的模式, 一種是以歐盟為代表的偏向隱私保護的模式。但在大數(shù)據(jù)時代, 這兩種模式已經(jīng)開始出現(xiàn)趨同。不少國家開始認識到政府?dāng)?shù)據(jù)開放對隱私的沖擊是全面而嚴峻的, 不再強調(diào)“公開優(yōu)先”或“隱私優(yōu)先”的靜態(tài)原則, 而是傾向于對個案具體問題具體分析, 細究利用信息的目的, 尤其是特定的再利用是否正當(dāng)?shù)取2贿^到底怎樣才是最佳的解決方案, 各國還都在探索之中。

  政府?dāng)?shù)據(jù)治理能力還跟不上

  在鄭磊看來, 政府在數(shù)據(jù)開放過程中, 除了在隱私保護這樣的問題上缺少法律法規(guī)和政策指引, 還存在不少挑戰(zhàn)。通過對一些地方政府?dāng)?shù)據(jù)開放和應(yīng)用情況的調(diào)研, 他發(fā)現(xiàn), 政府不僅是數(shù)據(jù)開放的意愿不強烈, 更重要的是數(shù)據(jù)治理的能力跟不上。

  一方面, 目前很多政府部門不愿意開放數(shù)據(jù), 主要是怕開放后出現(xiàn)安全問題被追責(zé)。鄭磊指出, 數(shù)據(jù)開放后確實可能面臨各方面安全風(fēng)險。開放數(shù)據(jù)本身涉及國家機密、商業(yè)機密和個人隱私;被關(guān)聯(lián)分析后泄露國家安全、商業(yè)機密和個人隱私;被濫用損害公共利益或第三方利益;數(shù)據(jù)質(zhì)量有問題被利用后也會造成損失。因此, 政府還是存在“多做多錯、少做少錯”這樣的想法, 并且認為數(shù)據(jù)是部門資源, 不愿意對外開放。

  另一方面, 有些政府部門還不具備數(shù)據(jù)開放的能力。原因有缺乏體制機制支撐;主管部門不明確, 職能繁雜、職責(zé)交叉;組織與人員能力建設(shè)、經(jīng)費保障、技術(shù)基礎(chǔ)設(shè)施跟不上等。

  鄭磊強調(diào), 最重要是數(shù)據(jù)治理能力跟不上。最突出的問題就是數(shù)據(jù)碎片化很嚴重, 散落在各個部門, 沒有整理起來。除此之外, 數(shù)據(jù)共用共享、數(shù)據(jù)權(quán)屬、數(shù)據(jù)采集、數(shù)據(jù)編目、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全等, 都是數(shù)據(jù)治理的重要內(nèi)容。而目前還很少有政府部門能形成較為完善的數(shù)據(jù)治理體系, 這導(dǎo)致政務(wù)大數(shù)據(jù)并不能得到很好的利用。

  由復(fù)旦大學(xué)和提升政府治理能力大數(shù)據(jù)應(yīng)用技術(shù)國家工程實驗室聯(lián)合發(fā)布的《中國地方政府?dāng)?shù)據(jù)開放平臺報告 (2017) 》指出, 目前各地開放數(shù)據(jù)平臺上線的數(shù)據(jù)集在數(shù)量上已成規(guī)模, 多個地方的數(shù)據(jù)集總數(shù)已突破或接近1000, 但其中能真正符合完整的、原始的、可機讀的、非專屬的、以接口形式提供等開放數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集仍然偏少。不符合標(biāo)準(zhǔn)要求的所謂“數(shù)據(jù)集”卻比比皆是, 或為加工歸總后的統(tǒng)計報表, 或為非結(jié)構(gòu)化、不可機讀的文本內(nèi)容, 或為拆分后或未整合的單行數(shù)據(jù), 甚至還有數(shù)據(jù)集名稱下面不存在可獲取的數(shù)據(jù)集。這些“數(shù)據(jù)集”無法被利用, 更不可能產(chǎn)生價值, 將會使數(shù)據(jù)開放最終流于形式。

  對此, 鄭磊對政府部門提出的建議是, 政策法規(guī)方面, 完善法律法規(guī)政策, 明確開放與保護的邊界, 制定開放數(shù)據(jù)標(biāo)準(zhǔn), 規(guī)范開放數(shù)據(jù)利用和流通;管理組織方面, 明確主管部門、制定管理制度、分級分類差異化管理、事中前后全過程管理、開展內(nèi)部和第三方風(fēng)險評估、建立預(yù)警機制、制定應(yīng)急預(yù)案、建立動態(tài)糾錯機制、開放社會評議舉報、明確責(zé)任追究與免責(zé);數(shù)據(jù)與技術(shù)方面, 要注重提升整體數(shù)據(jù)治理水平、開放平數(shù)據(jù)安全防護體系、數(shù)據(jù)脫敏、防范數(shù)據(jù)間相互關(guān)聯(lián)產(chǎn)生的風(fēng)險、開放數(shù)據(jù)的質(zhì)量控制、對已開放數(shù)據(jù)的長期監(jiān)測。

  上述報告也建議, 對主管部門加強有關(guān)開放數(shù)據(jù)基本知識的培訓(xùn), 厘清概念, 達成共識;然后基于開放數(shù)據(jù)的基本原則和標(biāo)準(zhǔn), 從數(shù)據(jù)利用者的視角和需求出發(fā), 開放完整的、原始的、可機讀的、非專屬的、結(jié)構(gòu)化的、高價值的數(shù)據(jù)集, 并配備實用詳實的元數(shù)據(jù)條目, 幫助用戶用好數(shù)據(jù)、用對數(shù)據(jù)。物盡其用, 數(shù)盡其利, 只有開放真正能被“用”起來的數(shù)據(jù)才能創(chuàng)造價值。

責(zé)任編輯:qinpeng