摘要:大數(shù)據(jù)時代的來臨為我國社會信用體系建設提出了新的發(fā)展要求, 順應時代潮流, 構建全國統(tǒng)一的信用信息數(shù)據(jù)平臺是必然趨勢, 據(jù)此提出了公共信用信息數(shù)據(jù)歸集應遵循的一般性原則。運用實證法對“蘇州市公共信用信息基礎數(shù)據(jù)庫和服務平臺”建設實踐進行了分析??隙诵庞眯畔⑵脚_取得的現(xiàn)實性成果, 同時分析了數(shù)據(jù)歸集與共享中存在的質量問題, 從技術和制度層面論述了提高數(shù)據(jù)質量的對策, 并展望了大數(shù)據(jù)視角下數(shù)據(jù)歸集的新思路。
隨著云計算等現(xiàn)代新興信息技術的廣泛深入應用, 大數(shù)據(jù) (big data) 吸引了越來越多的關注, 其應用領域也逐漸融入到社會的各行各業(yè), 帶來了一個嶄新的大數(shù)據(jù)時代。在征信領域中, 數(shù)據(jù)是其業(yè)務開展的基本資料, 通過大數(shù)據(jù)的相關技術可以將各種數(shù)據(jù)進行采集、分類、整理、加工從而形成信息產(chǎn)品, 并在必要時提供給用戶使用, 提高了征信服務的質量和工作效率。為應對大數(shù)據(jù)潮流, 江蘇省政府下發(fā)了《江蘇省大數(shù)據(jù)發(fā)展行動計劃》, 明確規(guī)定在信用大數(shù)據(jù)方面, 實現(xiàn)信用信息歸集、交換的全覆蓋。蘇州市也積極響應政策, 調整優(yōu)化網(wǎng)絡結構, 完善功能, 建成“一網(wǎng)三庫一平臺”的架構, 持續(xù)實施信用信息“提質擴面”工程, 提高數(shù)據(jù)歸集質量和效率, 積極推進“互聯(lián)網(wǎng)+信用”, “以用促進”, 完善服務平臺。然而, 由于我國征信行業(yè)發(fā)展較晚, 尚處于起步階段, 還有諸多問題待解決。
本文基于各省市出臺的相關信用信息管理條例, 首先提出了信用信息數(shù)據(jù)歸集應遵循的一般性原則, 然后從數(shù)據(jù)歸集的質量問題出發(fā), 通過一個典型的信息共享平臺實例——“蘇州市公共信用信息基礎數(shù)據(jù)庫和服務平臺”的建設實踐, 分析數(shù)據(jù)歸集與共享中存在的問題, 從技術和制度層面研究提高數(shù)據(jù)歸集質量的對策和方法, 以期為信用信息系統(tǒng)建設和信息服務水平提升提供參考。
一、公共信用信息數(shù)據(jù)歸集的原則
目前, 雖然各級地方政府都陸續(xù)出臺相關信用信息管理條例, 例如《湖北省社會信用信息管理條例》《威海市公共信用信息管理辦法》《深圳市公共信用信息管理辦法》等相關文件, 都從法律上肯定了信用信息的重要性;然而, 對于數(shù)據(jù)歸集, 大多數(shù)條例僅僅是提及, 深層次的歸納總結尚不明確, 各地在歸集數(shù)據(jù)時沒有統(tǒng)一標準規(guī)范, 從而導致各種數(shù)據(jù)丟失、失真等現(xiàn)象。據(jù)此, 從各省市頒布的條例、辦法中總結出數(shù)據(jù)歸集應遵循的一般性原則。
第一, 共享性原則。為深入貫徹落實“創(chuàng)新、協(xié)調、綠色、開放、共享”的發(fā)展理念, 政府各部門歸集形成的公共信用信息原則上應予以共享, 涉及國家秘密和安全的, 應按相關法律法規(guī)執(zhí)行。公共信用信息按共享類型可以分為無條件共享 (即可提供給所有部門以及社會群體使用的信息) 、有條件共享 (即可提供給相關社會群體共享使用或僅能夠部分提供給所有社會群體共享使用的信用信息) 和不予共享 (即不宜提供給其他部門共享使用的信用信息) 三種類型。各部門業(yè)務信息系統(tǒng)原則上通過國家電子政務內網(wǎng)或國家電子政務外網(wǎng)承載, 通過共享平臺與其他政務部門共享交換數(shù)據(jù), 并加快建設本地共享平臺以進行數(shù)據(jù)對接。共享平臺牽頭部門應該建立完善的信用信息資源目錄分類、采集、共享交換、平臺對接、網(wǎng)絡安全保障等方面的標準, 形成完善的公共信用信息資源共享標準體系。
第二, 安全性原則。為保護數(shù)據(jù)的內向性和機密性, 維護國家利益和社會秩序, 保護數(shù)據(jù)形成者自身的合法權益, 在信用信息數(shù)據(jù)歸集的過程中必須重視數(shù)據(jù)的安全性, 特別是在網(wǎng)絡環(huán)境下, 數(shù)據(jù)的安全性問題更應引起人們的關注。安全性原則應包括以下具體內容:一是要求相關部門統(tǒng)籌建立公共信用信息數(shù)據(jù)歸集管理機制和評價機制, 各部門和數(shù)據(jù)歸集平臺管理單位應加強對信用信息歸集、使用等全過程的身份鑒別、授權管理和安全保障, 確保歸集數(shù)據(jù)的安全。二是各社會主體在利用信用信息時要保護商業(yè)秘密和個人隱私不受侵害, 同時, 應當注意維護數(shù)據(jù)形成單位與個人的合法利益, 尊重他們提出的對部分涉及商業(yè)秘密和個人隱私信息的限制利用的意見。
第三, 準確性原則。數(shù)據(jù)的準確性在歸集過程中是至關重要的, 只有歸集準確的數(shù)據(jù)才能實現(xiàn)各系統(tǒng)的無縫對接以及平臺之間的互通互享, 從而實現(xiàn)系統(tǒng)的實時和動態(tài)更新, 以滿足各社會主體查詢利用的需要。所以, 必須確保所歸集的數(shù)據(jù)與本部門所掌握數(shù)據(jù)的一致性, 同時, 應按照國家信息資源相關標準進行信息資源的采集、存儲、交換和共享工作, 堅持“一數(shù)一源”、多元校核, 統(tǒng)籌建設公共信用信息資源目錄體系和共享交換體系。歸集其元數(shù)據(jù), 根據(jù)標準元數(shù)據(jù)定義消除數(shù)據(jù)項的歧義性, 從根本上保證數(shù)據(jù)的原始記錄性, 統(tǒng)籌規(guī)劃, 合理歸集。
上述三大原則分別從不同的方面保證了數(shù)據(jù)的準確性和安全性, 優(yōu)化了數(shù)據(jù)歸集的質量, 在一定程度上有利于歸集工作的順利開展。另外, 公共信用信息歸集應實行目錄管理, 公共信用信息的項目內容、公開屬性、更新頻率、使用權限、數(shù)據(jù)格式、歸集程序、歸集路徑、歸集時限、披露方式等要素應由信用信息目錄規(guī)定, 從而確保信息的準確性和安全性。
二、案例簡介——蘇州市公共信用信息基礎數(shù)據(jù)庫和服務平臺
自2003年起, 蘇州市就著手建設征信平臺, 成立市社會信用體系建設領導小組并于同年頒布了《蘇州市企業(yè)信用管理辦法》, 整個項目圍繞信用制度、征信平臺、行業(yè)信用建設、信用服務市場培育、企業(yè)信用管理等目標強力推進。2012年, 市公共信用基礎數(shù)據(jù)庫和服務平臺系統(tǒng)建設正式拉開序幕, 并于2014年成立了市公共信用信息中心。此后, 整個信用服務平臺的運作已逐漸成熟并形成了自己的架構模式。
(一) “一網(wǎng)三庫一平臺”的架構模式
目前, 蘇州市公共信用信息服務平臺已形成了以“一網(wǎng)三庫一平臺”為核心的架構模式。具體包括:一個目標 (一網(wǎng)三庫一平臺) , 兩級模式 (市、縣兩級) , 四層結構 (對外服務層、業(yè)務功能層、基礎設施層、系統(tǒng)軟件層) , 五大模塊 (部門前置機子系統(tǒng)、數(shù)據(jù)交換接口系統(tǒng)、中心數(shù)據(jù)處理系統(tǒng)、中心業(yè)務管理系統(tǒng)、信息服務及生成信息產(chǎn)品系統(tǒng)) , 六大安全措施 (安全管理制度、應用安全、數(shù)據(jù)安全、物理安全、系統(tǒng)安全及網(wǎng)絡安全) 。五大模塊相輔相成, 共同致力于一個目標, 使信用信息數(shù)據(jù)安全、風險防范、技術和管理得到了良好的配合 (參見圖1) 。
圖1 公共信用信息服務平臺架構
(二) 平臺與數(shù)據(jù)庫的對接
目前, 蘇州市公共信用信息服務平臺已與包括市教育局、市人民法院、市工商局、水利局等39家成員單位的業(yè)務系統(tǒng)、4縣6區(qū)的前置平臺對接, 與包括“誠信南京”“信用無錫”“誠信姑蘇”等22家地方信用平臺相鏈接。企業(yè)信用基礎數(shù)據(jù)庫收錄了100多萬家企業(yè)數(shù)據(jù), 數(shù)據(jù)總量達5000萬條, 個人信用數(shù)據(jù)庫達2000多萬條, 形成了8個大類數(shù)據(jù), 總數(shù)據(jù)達7000多萬條。蘇州公共信用信息服務大廳的運轉日漸成熟。與此同時, 由企業(yè)提供強有力的技術支持來維護平臺的日常運行, 企業(yè)、政府各部門以及用戶三方共同圍繞服務平臺這個中心來進行相關的數(shù)據(jù)交接、運行, 從而最終生成信用產(chǎn)品, 方便了公民對個人信用信息的查閱。同時, 實現(xiàn)了靜態(tài)的信用主體基礎信息與動態(tài)的各類監(jiān)管執(zhí)法信息相互關聯(lián)和有機統(tǒng)一 (參見圖2) 。
圖2 公共信用信息平臺運行
(三) 信用產(chǎn)品的推出
目前, 該平臺主要以提供信用報告為主。據(jù)統(tǒng)計, 截至2017年6月已產(chǎn)生了大約3328份信用報告, 為各企事業(yè)單位的信用評估做出了極大貢獻。隨著平臺運行日漸成熟, 各種信用產(chǎn)品也將陸續(xù)推出。除信用報告之外, 還產(chǎn)生了基于信用報告的信用咨詢服務以及信用評價方法等28類專項服務。既方便了公民對信用信息的查閱, 又促使平臺不斷改進技術方法, 推陳出新。
誠然, 蘇州市公共信用信息服務平臺自運行以來, 取得的成效尤為可觀, 也給其他省市征信平臺建設以借鑒意義。然而, 其中依然存在一些亟待解決的問題, 尤其是在數(shù)據(jù)歸集方面值得深思。
三、公共信用信息數(shù)據(jù)歸集的現(xiàn)存問題
信用信息系統(tǒng)數(shù)據(jù)歸集的信息主要是獲得相應資質或受到相應處罰的市場主體的信息, 具體分為基本信息、行政許可資質信息和違法違規(guī)信息等三大類。通過對蘇州市公共信用信息基礎數(shù)據(jù)庫的調研發(fā)現(xiàn), 在公共信用信息的數(shù)據(jù)歸集和共享方面還存在信息孤島、信息安全、數(shù)據(jù)歸集標準等方面的問題。
(一) “信息孤島”依然存在
所謂的“信息孤島”, 是指相互之間在功能上不關聯(lián)互助、信息不能共享互換以及信息與業(yè)務流程和應用相互脫節(jié)的計算機應用系統(tǒng)。大體可分為數(shù)據(jù)孤島、業(yè)務孤島、管控孤島、系統(tǒng)孤島四種類型。其中, 在征信行業(yè)中數(shù)據(jù)孤島現(xiàn)象比較嚴重, 它存在于所有需要進行信用信息數(shù)據(jù)共享和交換的系統(tǒng)之間。不同部門間的數(shù)據(jù)信息不能共享, 采集、整理、交換的數(shù)據(jù)不能進行交流, 數(shù)據(jù)出現(xiàn)脫節(jié), 即產(chǎn)生信息孤島。
征信服務平臺中“信息孤島”的產(chǎn)生主要是技術層面的問題。例如, 許多垂直管理政府部門 (如工商、法院、稅務、銀行等) 的信用信息都采用數(shù)據(jù)集中交換模式集中統(tǒng)一存儲和共享, 這就導致有些數(shù)據(jù)不能及時歸集到信用服務平臺的信息系統(tǒng), 而出現(xiàn)嚴重的數(shù)據(jù)脫節(jié)現(xiàn)象。另外, 數(shù)據(jù)從分散到集中再到應用必須經(jīng)過采集、轉換、篩選、加工、交換等數(shù)據(jù)處理和交換過程。任何一個過程的數(shù)據(jù)處理質量得不到保證, 數(shù)據(jù)中心的數(shù)據(jù)質量就難以得到保證, 而信息的共享服務完全有賴于數(shù)據(jù)中心的數(shù)據(jù)。因此, 在數(shù)據(jù)歸集過程中, 其質量依賴于供需雙方分別保證。
另外, 由于信用信息中有些屬于敏感信息, 所以在歸集過程中也會出現(xiàn)數(shù)據(jù)孤島問題, 尤其是在涉及到隱私權的問題上。例如, 在歸集公安對個人的處罰、交通處罰等信用信息時, 為保護個人隱私, 許多相關信用信息都不會歸集到信用服務系統(tǒng)中。導致數(shù)據(jù)歸集情況不能滿足日益增長的查詢、應用需求。這也是導致“信息孤島”現(xiàn)象的一個重要因素。
(二) 信息的安全性仍待加強
信息安全是使數(shù)據(jù)處于安全不被威脅的狀態(tài), 避免數(shù)據(jù)被惡意訪問、泄露、丟失, 保證它的真實準確、可讀性。征信信息系統(tǒng)中的信息安全主要表現(xiàn)在信息的保密性、完整性、準確性以及可用性。
以蘇州市信用信息服務平臺為例, 其數(shù)據(jù)歸集主要包括兩種形式。一是數(shù)據(jù)庫直連, 工商等中央垂直管理的政府部門采取的就是這種形式。這種形式采用的是數(shù)據(jù)庫對數(shù)據(jù)庫的模式, 各個數(shù)據(jù)庫之間都有安全的物理隔離措施, 通過專線進行輸送。只要前期的數(shù)據(jù)采集沒有質量問題, 那么歸集之后的數(shù)據(jù)就可以是準確的且安全可靠的;另一種是通過“誠信蘇州”網(wǎng)站進行及時報送。而這種模式就可能出現(xiàn)人為的失誤, 因為所有的數(shù)據(jù)信息都是人工錄入網(wǎng)頁, 再由網(wǎng)站進行數(shù)據(jù)報送, 這就直接導致數(shù)據(jù)的安全性、準確性得不到保證, 存在泄密、錯報、漏報的可能性, 嚴重影響業(yè)務活動的質量和效率。
(三) 數(shù)據(jù)歸集的標準尚未統(tǒng)一
由于不同的政府部門采用不同的數(shù)據(jù)存儲格式, 在傳輸過程中采用不同的數(shù)據(jù)接口、不同的接口參數(shù), 導致歸集之后的數(shù)據(jù)格式各異。例如, 目前蘇州信用平臺收錄的行政許可大約有60.5萬余條, 但同樣是行政許可, 在“日期”的標注上, 有的許可文件有明確的發(fā)證日期和生效日期, 而有的只是有發(fā)證日期, 或者有的文件只是有使用日期。在日期格式上沒有做到很好的統(tǒng)一。再如, 在行政處罰上, 有罰款、責令改正和罰款、限期整改以及吊銷執(zhí)照等幾種方式, 然而處罰的力度和具體的實施范圍沒有做到統(tǒng)一標準。此外, 除了行政許可和行政處罰, 其他方面的數(shù)據(jù)歸集還沒有相應的數(shù)據(jù)標準和數(shù)據(jù)庫接口參數(shù), 歸集來的數(shù)據(jù)依然是雜亂無章的。數(shù)據(jù)歸集的標準不統(tǒng)一必然會影響信息的共享, 公共信用信息歸集的標準亟待統(tǒng)一。
四、大數(shù)據(jù)視角下公共信用信息數(shù)據(jù)歸集的策略
大數(shù)據(jù)的快速發(fā)展加速了技術變革, 使得數(shù)據(jù)歸集更加自動化、準確化和及時化。同時又對公共信用信息數(shù)據(jù)歸集提出了新的發(fā)展要求。為適應大數(shù)據(jù)的背景, 必須建立科學的信用信息歸集機制, 實現(xiàn)靜態(tài)的信用主體基礎信息與動態(tài)的各類監(jiān)管執(zhí)法信息相互關聯(lián)、有機統(tǒng)一, 以達到整合各類信息資源, 消除“信息孤島”, 確保歸集的數(shù)據(jù)完整、準確、及時以及動態(tài)更新。
(一) “頂層設計”深化公共信用信息服務
頂層設計就是要從制度、法律法規(guī)上進行完善, 建立相關的數(shù)據(jù)歸集方面的法律法規(guī)。國際上信用體系比較完善的國家, 都十分重視信用的立法。在信用體系最發(fā)達的美國, 頒布了《公平信用報告法》等16部信用管理法律。我們應借鑒美國的經(jīng)驗, 制定信用管理相關的法律法規(guī), 建立信用信息征集和使用的長效機制。2017年6月頒布的《網(wǎng)絡安全法》就為公共信用信息數(shù)據(jù)歸集提供了法律保障。除此之外, 還應盡快出臺《個人信息保護法》《征信法》等完善信息安全、數(shù)據(jù)管理等方面的法律法規(guī), 確保公共信用信息數(shù)據(jù)的規(guī)范性和準確性。同時, 通過整體規(guī)劃使橫縱打通。一方面推動全國信用信息平臺與地方信用信息平臺“縱向”互聯(lián)互通, 實現(xiàn)信用數(shù)據(jù)的跨區(qū)交換共享;另一方面推動信用信息共享平臺與部門或行業(yè)信息平臺“橫向”交換共享, 實現(xiàn)信用數(shù)據(jù)的跨行業(yè)交換共享, 打破數(shù)據(jù)孤島現(xiàn)象。
(二) 打通數(shù)據(jù)標準, 消除歧義性
打通數(shù)據(jù)標準, 即以統(tǒng)一的社會信用代碼為基礎, 建立全國統(tǒng)一的公共信用信息目錄標準、系統(tǒng)建設標準、信息安全技術標準和信用行業(yè)服務標準。最重要的是定義標準元數(shù)據(jù), 消除數(shù)據(jù)的歧義性。為了提高信息系統(tǒng)的數(shù)據(jù)質量, 首先需定義數(shù)據(jù)資源的標準元數(shù)據(jù)。以蘇州市信用信息服務平臺為例, 目前主要是統(tǒng)一社會代碼、統(tǒng)一格式, 以及定義標準元數(shù)據(jù)目錄, 以消除不同部門數(shù)據(jù)之間的歧義性。同時, 在定義具體數(shù)據(jù)項屬性時, 含義一定要描述清晰, 不能存在異義性, 這是提高系統(tǒng)數(shù)據(jù)質量的基礎。通過標準元數(shù)據(jù)的定義, 首先可以消除各數(shù)據(jù)項的歧義性, 規(guī)范信息存儲和展現(xiàn)格式;其次, 可以用標準元數(shù)據(jù)作為基準對歸集數(shù)據(jù)進行校驗、轉換和對比, 以形成初步“干凈”的數(shù)據(jù)集。
(三) 完善信息安全基礎設施
完善信息安全基礎設施, 首先就要完善物理隔離措施, 即加強網(wǎng)絡的建設, 優(yōu)化網(wǎng)絡架構, 加強CA (certificate authority, 認證機構) 和RA (registration authority, 注冊機構) 兩種管理實體建設。目前, 蘇州已建成“一網(wǎng)三庫一平臺”的網(wǎng)絡架構, 應該在此基礎上更加完善系統(tǒng), 實現(xiàn)數(shù)據(jù)歸集與系統(tǒng)升級同步進行, 推動數(shù)據(jù)庫更新與時俱進。同時, 還應注意與政務網(wǎng)等進行物理隔離, 實行專人負責制, 加強信息的安全基礎設施建設。
(四) 引進先進的數(shù)據(jù)處理技術
大數(shù)據(jù)根植于云計算技術, 利用云計算強大的數(shù)據(jù)處理能力, 可以為挖掘大數(shù)據(jù)豐富的信息提供強有力的工具。利用云計算技術、數(shù)據(jù)挖掘技術等先進的數(shù)據(jù)處理技術, 實現(xiàn)信用數(shù)據(jù)的自動化、批量化歸集, 對數(shù)據(jù)進行智能化、精準化的比對、清洗和更新, 確保信用數(shù)據(jù)準確、實時、全面。目前, 蘇州市信用平臺主要是采用基礎的數(shù)據(jù)處理技術, 利用系統(tǒng)技術自動完成對數(shù)據(jù)的去重、糾正邏輯錯誤、規(guī)范格式以及數(shù)據(jù)應用等的處理??梢栽诖嘶A上引入國外相關方面的數(shù)據(jù)處理工具, 例如Hadoop等, 用高傳輸率來訪問應用程序的數(shù)據(jù), 正適合那些有著超大數(shù)據(jù)集的應用程序, 不僅可以提高工作效率, 更能在數(shù)據(jù)源頭對數(shù)據(jù)質量進行精準的把握。
(五) 加強相關人員的技能培訓
數(shù)據(jù)歸集工作對專業(yè)人員有著嚴格的要求, 不僅涉及到專業(yè)技術, 還對信息的安全性、保密性等有一定的要求。如果數(shù)據(jù)歸集不及時, 歸集到的數(shù)據(jù)不完整、標準不統(tǒng)一等不僅會影響到相關信用產(chǎn)品的質量, 而且還會降低工作人員的效率, 徒增不必要的麻煩。加強對信用信息數(shù)據(jù)歸集方面的人員培訓, 是提高工作效率、完善工作質量的必然要求。尤其是要加強銀行等重點行業(yè), 以及政府、事業(yè)單位等的專業(yè)技術人員、金融從業(yè)人員等重點人群的各類專業(yè)技術培訓和職業(yè)道德培訓, 進而實現(xiàn)信用大數(shù)據(jù)的高效利用和充分共享。
五、結語
綜上所述, 解決公共信用信息數(shù)據(jù)歸集問題, 提高信用信息服務質量, 除了要加強數(shù)據(jù)質量保障的制度建設、人才建設, 更要立足于自身, 采用科學、先進的技術手段, 在最大程度上對數(shù)據(jù)進行篩選、去重、清洗、校驗, 從整體上把握數(shù)據(jù)質量, 在實踐中找到完善平臺數(shù)據(jù)質量的方法和原則。在統(tǒng)一代碼、統(tǒng)一標準的基礎上將歸集的數(shù)據(jù)制成電子地圖以做大數(shù)據(jù)分析處理, 從而挖掘有用的信用信息, 打造出更多的信用產(chǎn)品, 實現(xiàn)信用產(chǎn)品服務的常態(tài)化。
大數(shù)據(jù)的相關技術有著廣闊的發(fā)展前景, 借助于這些先進技術, 未來公共信用信息數(shù)據(jù)歸集會朝著更加自動化、智能化的方向發(fā)展。各國政府、自然人、法人及社會團體對信用信息產(chǎn)品的要求越來越高, 而在大數(shù)據(jù)背景下利用云計算、數(shù)據(jù)挖掘等先進技術對信用信息服務進行管理, 可提高公共服務保障水平, 增強政府與公民之間直接的雙向互動和交流, 從而實現(xiàn)公共信用信息的充分共享以及信用產(chǎn)品服務的常態(tài)化。