一、引言
責任編輯:admin
信息、計算以及通信技術的飛速進展持續(xù)滲透至人類社會生活的方方面面,逐漸成為越來越多日?;顒拥幕A,引發(fā)人類學習、溝通、協(xié)調、生產及消費方式的轉變,這樣的轉變被Rifkin稱為第三次工業(yè)革命。在物聯(lián)網技術突破數據采集瓶頸,寬帶泛在突破數據傳輸與交換瓶頸,云計算突破數據存儲與大規(guī)模運算瓶頸時,數據的爆炸式增長成為這個時代的重要特征,引發(fā)近年全球范圍的“大數據”(Big Data)熱潮。與大數據的關注熱度相比,它的概念界定一直未在學術界和實踐界形成共識,無論美國國家科學基金會(NSF)從數據規(guī)模、形態(tài)角度的定義,還是Gartner公司從數據處理方式角度的定義,亦或維基百科從數據處理復雜性角度的定義,在初步勾勒了大數據基本特征的同時,仍有管中窺豹之感。某種意義上說,對大數據的關注反映了當人類掌握的基礎數據管理技術(如采集、存儲與傳輸)發(fā)展快于高級數據管理技術(如分析、知識挖掘與決策支持)時,公眾面對大量可見而不可知數據的焦慮。大數據的“大”是相對于信息認知能力而言的,與海量數據相比,對人類真正有意義的是其背后蘊含的知識。因此“大數據”絕不僅是計算機科學中的極端數據處理問題,相關研究的突破和進展離不開數據分析方法與特定管理問題背景的深度融合。
幾乎所有展望大數據應用前景的研究都非常重視政府或公共部門相關數據的價值。這很大程度上是因為這些數據關乎國計民生,有可能得到那些可能解決重大問題的重要分析結果。但實際上,基于大數據解決大問題并不那么容易。無論在國外還是國內,真正意義上的系統(tǒng)性大數據分析探索均率先出現(xiàn)在電子商務領域。如果說商業(yè)領域的大數據分析大多附著在體現(xiàn)企業(yè)核心價值的交易數據上是因為這是客戶行為的記錄,公共領域的大數據分析也同樣關注“客戶反饋”,例如社交媒體上更易獲得的網絡公眾輿情。當然,面對通常被認為是多目標決策的公共管理復雜問題,單一的網絡輿情分析往往得到的知識是有限的,分析對象的邊界亟待拓展。
在此背景下,本文的討論圍繞公共衍生大數據(Public Generated Big Data)的概念,指圍繞公共話題和公共事務衍生的復雜、多樣、低價值密度的海量數據。公共衍生大數據通常主要包含以下三類:互聯(lián)網公共話題相關的用戶創(chuàng)造內容(User Generated Content, UGC);政府部門業(yè)務運作過程中產生的大量政策、法規(guī)及其相關的文件與文檔數據;政府信息化過程中建設的包括物聯(lián)網系統(tǒng)在內的各類信息系統(tǒng)在運行中生成的大量數據(如交通、環(huán)境監(jiān)測、網上辦事數據)。本文將基于過往研究及未來挑戰(zhàn),嘗試初步構建上述大量有價值但卻未得到充分利用的公共衍生大數據與政府科學決策間的可能聯(lián)系。
二、公共衍生大數據分析方法發(fā)展
之所以要將公共衍生大數據作為一個概念提出,并視為政府決策過程中一種可依賴資源,很大程度上基于近年來數據挖掘與社會計算方面取得的若干研究進展,這為我們更好的實現(xiàn)對公共衍生大數據的分析及后續(xù)的政府決策過程模擬與評估提供了可能。這些方法進展涉及的主要領域包括文本挖掘、社會網絡分析、社會計算與多智能體仿真等。
在文本挖掘方面,無法利用計算機理解海量文本中的語義信息是長期以來文本形式的非結構化數據無法像結構化數據一樣被政策分析者充分利用的根本原因。概率主題建模一類方法即試圖從大量文本信息中發(fā)現(xiàn)并提取主題信息,從而實現(xiàn)面對非結構化數據的輔助決策。該方法起初應用于信息檢索領域,隨后概率潛在語義分析方法(pLSA)被提出用以在概率框架下生成信息主題集合。通過間接對文檔中包含的主題信息的處理,TF-IDF模式以及向量空間模型提供了一種粗略的描述和建模文檔內容和主題相似度的解決方案。為了解決此類模型和方法無法區(qū)分字面意思不相同而主題意義相同或相似情形的弱點,研究者引入了奇異值分解(Singular Value Decomposition)并提出了潛在語義分析方法(LatentSemantic Analysis, LSA),將高維的文檔詞語空間轉化映射成了低維的主題向量空間。潛在狄利克雷分配(Latent Dirichlet Allocation, LDA)使用貝葉斯概率框架進一步改進了pLSA模型和方法,取得了更好的建模效果,并已在網絡輿情分析中得到了一些應用。相關應用能夠幫助管理者快速理解海量文本中涉及的討論主題,從而把握公眾關切重點,形成有效決策。在主題提取的基礎上,近年來相關研究者陸續(xù)將研究重點轉向對語義中情感表達的分析,也取得了一定進展。情感分析有助于管理者判斷不同主題下公眾態(tài)度的烈度和極性,有利于進一步科學量化公眾關切。
在社會網絡分析方面,盡管公共管理研究者和實踐者很早即認同社會的網群關系,但近年來社會網絡分析在大規(guī)模計算和工具化、可視化方面的進展才逐漸奠定了其在公共管理與公共政策分析領域的應用基礎。社會網絡分析相關方法主要針對社會科學里對社會結構和社會關系的研究需求,其源頭可追溯到數學家Euler的圖論工作,其基本思路是以結點和結點間聯(lián)系分別代表行動者與行動者關系,在此框架下測度與分析各行動主體間由于資源、信息的流動形成的動態(tài)關系,引入小世界(The Small World)、結構洞(Structural Holes)等理論后使社會網絡分析有能力描述和解釋更為復雜的社會現(xiàn)象和問題。目前,社會網絡分析由于其結論可視化強等方面的優(yōu)勢在文獻關系及網絡輿情分析中得到了廣泛的應用,社會網絡分析與文本挖掘的疊加有助于發(fā)現(xiàn)公眾關切的集聚與擴散規(guī)律,從而更準確地判斷政府決策與網絡輿情間的互動關系。
在社會計算與多智能體仿真方面,大數據同樣為傳統(tǒng)的建模、仿真領域帶來新的生機。王飛躍等人在融合多種建模、仿真方法進展后提出了社會計算(Social Computing)的概念,其中涉及的若干方法通常被認為有助于更好的研究社會選擇。近年來的社會選擇研究主要集中在兩個方面:引入人工智能領域的概念和方法解決社會選擇問題,而反之另一條思路則是將社會選擇理論引入人工智能領域,其中多智能協(xié)商的相關研究屬于兩種思路的融合。在公共管理與公共政策領域,互動的行為體、結構、過程出現(xiàn)不可控的混亂。通過社會選擇模擬輔助研究,界定范圍來限制模型中政策議題的復雜度顯得尤為重要。多智能體仿真可以模擬凸顯性、不確定性、多態(tài)均衡和非現(xiàn)象條件下的對多利益群體、多階層在復雜政策環(huán)境下的行為反應,從而實現(xiàn)對政策效果的評估,該方法已經在模擬和評估聯(lián)合國決策方面得到初步應用。與其他大數據分析方法的有機結合可望賦予多智能體仿真更廣闊的發(fā)展空間。
結合上述大數據分析方法的進展,面向公共衍生大數據的分析需求將進一步推動研究方法論的整合與創(chuàng)新。通過大數據分析方法的引入,公共政策分析相關學科有望突破原有邊界,應對更為復雜的科學問題。將數據挖掘、社會計算與傳統(tǒng)公共政策過程中經濟學、社會學方法融合,將極大地豐富相關領域研究方法論,從而更好地應對不斷發(fā)展和變化的復雜公共政策問題。這是大數據分析可能為公共政策分析領域帶來的貢獻。
三、信息時代政府決策過程的嬗變
隨著上述研究方法的日益發(fā)展,在大數據熱潮之初,甚至更早的時間,我們已經能夠見到圍繞某一公共話題的數據分析研究,如用數據表征公共衛(wèi)生、公共交通以及非傳統(tǒng)安全較量中的若干實例。上述工作開拓了研究視野,但更多體現(xiàn)的是特定數據分析方法在特殊場合的應用,尚未觸及公共管理與公共政策過程的本質,所得結論也多為現(xiàn)象描述,僅能視為公共衍生大數據分析的起步。在公共政策過程嬗變的過程中,信息技術演進的影響從未被研究者忽視,這既包括技術環(huán)境的直接影響,和技術環(huán)境通過對公眾觀念帶來轉變引發(fā)的間接影響。
從政府決策相關理論的視角來看,公共政策過程是政策問題從議程設置、實施到評估反饋和修正等一系列政策循環(huán)周期的總和。國內外學者對其進行了大量的研究,其視角包括強調權利結構下的利益博弈,強調公共目標的理性學習及強調社會理念作用等。其中應用最為廣泛的是多源流理論和觸發(fā)機制理論。中國的公共政策議程有其內在的特點,基于多種理論視角與觀點的融合。王紹光在分析了中國公共政策議程設置的六種模式后,也指出在當今的議程設置過程中,精英專家、傳媒、利益相關群體和人民大眾發(fā)揮的影響力越來越大。推廣到政府的決策模式,鄢一龍等人提出“十五”以來決策過程的集思廣益模式,體現(xiàn)在普通公眾參與日益增多,決策過程日益開放。而網絡的興起與普及應用無疑加劇了這一趨勢。國內外均有學者指出了信息時代的諸多特點將對公共政策過程和政府決策過程帶來影響。相關研究主要體現(xiàn)在初步定性分析了網絡輿情熱點及網民政策態(tài)度的形成過程; 在政策議程設置環(huán)節(jié),嘗試探索信息時代政府、媒介和公眾三者關系的變化;部分學者結合案例試圖描述網絡影響政府決策的過程。然而上述研究考慮網絡能技術環(huán)境影響時仍主要采取事件觸發(fā)的視角;由于方法論所限也尚未涉及對網絡公眾表達大數據進行真正分析和利用的問題。
一方面大數據帶來的沖擊會加劇信息時代對政府決策過程的影響,另一方面,政府能否完善決策過程以適應時代和利用大數據帶來的機遇也決定了影響的正負的極性?;诙嘣戳骼碚摰冉浀淇蚣軄矸治龊徒鈽嫶髷祿淼挠绊懹兄谖覀冊谙嚓P理論基礎上探索政府決策過程的重構策略和數據驅動機制。這也是公共政策研究可能反作用于大數據發(fā)展的貢獻。
四、政策信息學:融合與演進
在大數據與政策科學兩方面理論、方法的進展的基礎上,不難發(fā)現(xiàn)在二者交匯的研究領域仍存在真空地帶,許多關鍵科學問題亟待解決,包括:如何整合現(xiàn)有數據挖掘方法,實現(xiàn)更好的分析公共衍生大數據的目的?從公共衍生大數據中獲取的知識如何影響政府決策,需要何種模式與過程的改進?如何基于公共衍生大數據評估政府決策過程與決策本身的效果,尤其是前瞻性預測關鍵決策的中長期效果?回答這些問題,可能需要有面向公共衍生大數據分析與政府決策過程重構的新學科出現(xiàn)。
國際學者已開展探索中引人注意的是美國亞利桑那州立大學提出了政策信息學研究方向。政策信息學可以看作一個以面向如何利用公共政策相關海量信息,更好地理解和解決復雜的公共政策和管理問題,從而實現(xiàn)治理流程和制度創(chuàng)新為目標的若干跨學科研究組成的嶄新領域。因為有可能為政策制定者與利益相關者提供前所未有的知識和決策依據,政策信息學有可能成為未來公共政策過程分析的一個重要學科基礎。目前,相關學者以開展了若干政策信息學研究工作,例如Kim等學者利用空間分析方法來監(jiān)測公共產品欺詐,并用類似的方法研究了俄亥俄州的醫(yī)療補助支出變化的案例。貝葉斯模型也被用于分析公共環(huán)境政策問題。2015年,國際公共政策分析領域的頂級期刊Journal of Policy Analysis and Management(JPAM)集中發(fā)表了三篇在政策信息學方向上的最新探索,即包括利用大數據分析和仿真建模方法對教育、醫(yī)療領域政策的研究,也包括如何利用社交網絡優(yōu)化政策過程的探索。
當然,政策信息學僅是一個剛剛勾勒出框架的新方向,針對其重方法輕理論、重描述輕分析、重制定過程輕評估過程等現(xiàn)狀和不足,筆者認為其未來亟待研究的科學問題主要分為以下四類:
公共衍生大數據的基礎分析方法研究。公共衍生大數據的復雜特性要求相關分析必須在現(xiàn)有分析方法基礎上進行創(chuàng)新與整合。此類研究目標即以政府處理公共事務時面對的多來源、不同結構化程度的網絡輿情、政策文本及系統(tǒng)生成數據為主要對象,探索對其具有較好分析與解釋效果的文本挖掘方法與多方法、工具組合,為后續(xù)研究中特定政策議題的分析挖掘、決策效果模擬與評估中的關鍵指標計算奠定方法基礎。其中主要研究問題可能包括探索以關鍵主題提取與多維度情感分析為重點的海量文本數據挖掘方法、探索與相關開源分析算法或工具的對接與整合技術、探索與傳統(tǒng)定性研究方法的整合技術等。
圍繞特定政策場景的知識發(fā)現(xiàn)研究。從公共衍生大數據中發(fā)現(xiàn)對政府決策真正有價值的關鍵知識是政策信息學試圖探索的核心。此類研究目標即通過對多來源數據的綜合分析,圍繞特定的公共管理與公共政策問題,尋找那些對公共管理者至關重要的知識,從而揭示由大數據分析驅動政府決策優(yōu)化的可行路徑。其中主要研究問題可能包括針對公共政策過程分析各環(huán)節(jié)相關的公眾態(tài)度與趨勢變化、針對政府日常管理決策與突發(fā)事件應急處置等場景分析公眾輿論熱點與決策反饋等。
面向大數據的政府決策模式與決策過程重構策略研究。大數據時代賦予公共管理者的機遇與挑戰(zhàn)不僅來自特定案例中的挖掘出的管理知識,而更將催生管理模式和決策過程的深刻變革。此類研究目標即基于前述模塊圍繞公共衍生大數據的研究發(fā)現(xiàn),結合公共政策過程與公共管理行為的研究積累,探索并重構政府決策過程,提出有效的重構策略并重點探討若干重要問題。其中主要研究問題可能包括探索公共衍生大數據分析對公共政策過程各環(huán)節(jié)的影響以及相應的重構策略、探索公共衍生大數據分析中發(fā)現(xiàn)的輿情熱點進入政府決策流程的模式及處置機制等。
公共選擇模擬與決策效果評估研究。政府決策與公共衍生大數據分析的深度融合需要經歷復雜的互動過程,此類研究的目標在于探索這樣的互動模式,即通過基于多智能體仿真等社會計算基礎方法嘗試進行公共重大議題共選擇模擬及中決策效果的中長期評估,據此將數據分析驅動決策的過程模塊化和工具化,切實提升政府決策過程的科學性。其中主要研究問題可能將圍繞探索大數據驅動的多智能體群決策仿真與公共選擇模擬,并形成若干基于公共衍生大數據計算的決策評估指標并探索期應用機制展開。
在政策信息學框架下四類研究問題密切相關,彼此分割,中間包含著三個有機結合的研究循環(huán):
圍繞技術方法與應用場景的第一研究循環(huán)。在正向維度,方法研究服務于特定場景下的知識發(fā)現(xiàn);在逆向維度,根據公共政策與政府決策特定應用場景下產生的更為聚焦的分析需求又能推動分析方法的改進。在循環(huán)互動中才可能逐漸凝練具有普遍適用性的大數據分析方法集。
圍繞知識發(fā)現(xiàn)與重構策略的第二研究循環(huán)。在正向維度,基于第一循環(huán)的分析結果將被總結提煉為與政策相關的輿情規(guī)律;在逆向維度,根據政府部門多渠道獲取的公眾反饋將校正決策過程策略。在循環(huán)互動中才可能逐漸探索出大數據知識作用與政府決策過程的長效機制。
圍繞機制設計與效果評估的第三研究循環(huán)。在前兩重循環(huán)的基礎上,引入行動研究(ActionResearch)的思維范式,在正向維度,設置觀測大數據知識為特定政府部門采納后的決策效果指標;在逆向維度,根據一些政策可能面臨的階段性反彈,以實際政策效果數據為基點模擬公眾選擇變化,從而修正政府決策,進而構建分析→決策→評估→再決策的迭代機制。
五、結語
大數據浪潮給公共管理與公共政策分析研究領域帶來全新的機遇和挑戰(zhàn)。通過對大數據分析方法的探索、修正及擴展;圍繞特定公共議題相關的公共衍生大數據展開分析,從分析結果中提煉關鍵知識規(guī)律;重構政府決策范式與過程;并探索與之相配套的政策過程評估方法與社會選擇模擬方法。這一系列研究挑戰(zhàn)構成了面向公共衍生大數據分析和政府決策過程重構的嶄新領域——政策信息學。在在方法論層面,方法融合與學科交叉是未來科學研究的總體趨勢,相關研究進行的方法論探索對基于大數據豐富公共管理與公共政策研究的范式具有前瞻意義;在實踐層面:面對政府與社會共同關注的諸多實際公共問題,嘗試各種分析方法、設計的過程機制、構建的評估體系均為實際影響和應用效果導向,可望對切實提升當前政府決策過程的科學性和有效性有所裨益。
本文從對公共衍生大數據概念界定入手,通過梳理公共衍生大數據分析方法發(fā)展和信息時代政府決策過程嬗變兩方面研究視域下的理論演進,初步探討了公共衍生大數據分析與政府決策過程重構所面臨的主要科學問題及宏觀研究思路。以期拋磚引玉,對致力和關注相關問題的研究者與實踐者有所借鑒。
作者:張楠,清華大學公共管理學院副教授、電子政務實驗室副主任