2015年12月18日,國際科學理事會(ICSU)、國際科學院聯(lián)合會(IAP)、世界科學院(TWAS)和國際社會科學理事會(ISSC)聯(lián)合發(fā)布了《大數(shù)據(jù)環(huán)境下開放數(shù)據(jù)的協(xié)議》,指出數(shù)據(jù)革命為全球科技帶來了機遇和挑戰(zhàn),并提出了開放數(shù)據(jù)需遵循的基本原則。

 
  一、數(shù)據(jù)革命帶來的機遇
 
  豐富的數(shù)據(jù)為科學研究帶來的機遇包括:新模式的發(fā)現(xiàn);關聯(lián)系統(tǒng)的不同方面從而更好地理解它們的行為;描述復雜性的特征;深刻理解復雜系統(tǒng)的不同狀態(tài),模擬并預測其動態(tài)行為。許多研究領域都需要這方面的能力,如天氣和氣候預測、大腦工作機理探索、全球經(jīng)濟行為研究、農(nóng)業(yè)生產(chǎn)力評估、人口預測、歷史問題研究以及環(huán)境變化、傳染病、大規(guī)模遷移等全球性問題的研究。
 
  二、數(shù)據(jù)革命帶來的挑戰(zhàn)
 
  1、開放數(shù)據(jù)勢在必行。在數(shù)字化革命背景下,數(shù)據(jù)和思想快速傳播促進了科學創(chuàng)造力的提升。公共資助的研究項目數(shù)據(jù)應能夠公開獲取和再利用,以推動科學領域的數(shù)據(jù)革命和科學技術的快速發(fā)展。
 
  2、數(shù)據(jù)開放支持可重復驗證。近期,許多學科領域學術論文研究結論有很大比例不可驗證的問題說明開放數(shù)據(jù)的重要性??茖W論文出版的同時,相關的數(shù)據(jù)、元數(shù)據(jù)以及計算機代碼的公開有助于其他人員對研究結論進行及時審查和驗證。同時,數(shù)據(jù)應智能開放,即可發(fā)現(xiàn)、可獲取、可理解、可評價和可再利用。
 
  3、大規(guī)模支持數(shù)據(jù)發(fā)現(xiàn)。傳統(tǒng)的統(tǒng)計方法無法從大規(guī)模、大范圍和關聯(lián)的數(shù)據(jù)中挖掘出復雜的關系,因而需要更深入的數(shù)學方法(如拓撲方法等)從大數(shù)據(jù)得到有效的推論。數(shù)據(jù)密集的機器分析和機器學習對科學發(fā)現(xiàn)具有重要的意義,但人類通常難以理解機器識別的復雜模式,因此人機交互是需要重點關注的問題。
 
  4、需要加強道德約束。開放數(shù)據(jù)有可能侵犯數(shù)據(jù)提供者的個人隱私,在計算機環(huán)境下也存在個人數(shù)據(jù)的安全性問題,所以需要制定相應的管理措施。開放數(shù)據(jù)可能會侵犯生成數(shù)據(jù)的研究人員的個人利益,有必要使用新的方法來評價和獎勵研究人員在這方面的貢獻。
 
  5、促進全球參與。最不發(fā)達的國家在收集、存儲和共享數(shù)據(jù)方面的能力較弱,無法全面參與到氣候變化、衛(wèi)生保健、資源保護等全球性的研究活動中,也不能從這些研究活動中受益,新興國家和發(fā)達國家應幫助不發(fā)達國家發(fā)揮其科學研究的潛能。
 
  6、需要各層面的聯(lián)合行動。數(shù)據(jù)開放的實現(xiàn)需要個人、學科、國家和國際層面的系統(tǒng)化行動。研究資助機構和研究執(zhí)行機構應提供資金支持研究人員更智能地開放數(shù)據(jù)。學科領域應通過推動數(shù)據(jù)開放促進本學科的發(fā)展。一些國際組織應促進開放數(shù)據(jù)系統(tǒng)和過程的發(fā)展,保證國際數(shù)據(jù)的獲取、互操作性和可持續(xù)性。
 
  三、開放數(shù)據(jù)的原則
 
  1、科學家有責任在論文發(fā)表后公開相關數(shù)據(jù)。便于其他人驗證數(shù)據(jù)的有效性和研究結論的正確性,也便于其他人重新利用這些數(shù)據(jù)。
 
  2、研究機構和高校有責任為開放數(shù)據(jù)提供良好的支撐環(huán)境。如提供數(shù)據(jù)管理、保存和分析方面的培訓以及圖書館和數(shù)據(jù)管理服務等;為參與數(shù)據(jù)開放的科研人員的職業(yè)發(fā)展制定激勵措施以及國家性或國際性標準;發(fā)達國家的大學和其他科研機構應與發(fā)展中國家的相應機構在開放數(shù)據(jù)方面進行合作,共同提高數(shù)據(jù)密集型科研能力。
 
  3、出版商有責任向評審專家開放論文的相關數(shù)據(jù)。敦促研究人員對引用的數(shù)據(jù)進行準確標注;開放元數(shù)據(jù)以支持文本和數(shù)據(jù)挖掘,便于后續(xù)的分析。
 
  4、資助機構需在資助項目中考慮開放數(shù)據(jù)的成本。為基礎設施和數(shù)據(jù)倉庫的長期可持續(xù)性提供資源和相關政策;在評價研究的影響時(尤其是引文指標)應考慮數(shù)據(jù)創(chuàng)建者的貢獻。
 
  5、各國的專業(yè)協(xié)會、學術團體和科學院應為開放數(shù)據(jù)工作制定指導方針和政策。
 
  6、圖書館、檔案館和資料庫有責任提供數(shù)據(jù)服務和技術標準。保證數(shù)據(jù)獲取的便捷性和長期性。
 
  7、在應用實踐方面。應考慮個人隱私、國家安全和商業(yè)利益等問題,數(shù)據(jù)開放是有邊界、有限制的;研究數(shù)據(jù)和元數(shù)據(jù)應具備最大程度的可互操作性;開放數(shù)據(jù)應盡可能地根據(jù)其內(nèi)容和背景與其他數(shù)據(jù)進行關聯(lián),從而使其價值最大化。
責任編輯:admin