以解決既有問題、提升信息化應用效益爲出發點,立足于國家、省市(縣)各種生(shēng)态環境數據,提升數據資(zī)源的獲取能力和整合能力,建立覆蓋環境全業務的大(dà)數據資(zī)源體(tǐ)系,充分(fēn)推動信息資(zī)源的管理、利用,促進環境數據整合和部門間業務協同,通過數據挖掘和機器學習深挖數據潛在價值,實現“數據->資(zī)源->資(zī)産”的蛻變,輔助政府精細化決策,爲改善環境質量提供有效支撐。
生(shēng)态大(dà)數據建設首先需要确立生(shēng)态環境數據資(zī)源标準規範體(tǐ)系,制定數據庫設計、數據傳輸交換、數據共享服務、數據質量控制、運維管理等技術規範,有效促進了大(dà)數據建設的規範性、數據資(zī)源整合的有效性、數據質量的可靠性和數據更新維護的可持續性。
建立了資(zī)源目錄體(tǐ)系,制定了環境信息資(zī)源分(fēn)類方法、标識符編碼、核心元數據管理等規則,對各類型數據分(fēn)别進行編目;建立了資(zī)源目錄管理系統,實現了環境資(zī)源目錄收集整理、編制注冊、審核、查詢、浏覽、共享應用的信息化、規範化管理。
按照數據庫設計規範,建立污染源、環境質量、環境政務3大(dà)主題核心庫,存儲按主題整合處理後的各類數據,具有列式存儲、鍵值存儲、文件存儲、圖存儲、XML等多種存儲方式,其中(zhōng),污染源主題核心庫存儲的是通過污染源統一(yī)編碼,關聯整合污染源監測、監察、監管數據後形成的污染源核心數...
基于ESB總線,以前置庫方式爲主、WebService/Restful接口爲輔構建數據交換共享系統。數據交換系統實時将業務系統産生(shēng)的異地、異構數據及文件等信息,采用ETL工(gōng)具進行抽取、清洗、結構轉換等規範化處理後,集中(zhōng)存儲于數據中(zhōng)心各主題核心庫;數據共享系統則将數據資(zī)源中(zhōng)心的數據...
生(shēng)态環境大(dà)數據治理爲數據資(zī)源提供集中(zhōng)、統一(yī)的管理,主要包括基礎信息管理、元數據管理、數據質量管理、資(zī)源目錄管理、數據标準管理等。
建立了數據資(zī)源監控系統,對基礎設施、數據資(zī)源、數據交換和服務任務、虛拟化環境安全等方面進行全面監控,發現問題及時通過微信、短信、郵件、系統告警頁等多種形式進行告警。
對各種數據進行有機整合,構建數據資(zī)源目錄和數據标準體(tǐ)系,實現數據的統一(yī)存儲、集中(zhōng)管理,解決數據不統一(yī)、不規範、不完整的問題。
構建環境數據共享交換标準,實現環境數據跨部門、跨區域的共享與交換,爲多部門提供多層次的數據服務,滿足其對環境數據的需求,提高數據資(zī)源利用率。
提供OLAP多維分(fēn)析及數據挖掘工(gōng)具,對環境狀況進行全面的分(fēn)析、評價和預測,分(fēn)析環境因素之間的相互作用及其變化規律,爲環境管理提供決策依據。
構建體(tǐ)系完整、覆蓋全面、科學系統的環境信息資(zī)源體(tǐ)系,爲環境監管、治理、規劃、決策等提供最強大(dà)的數據服務和信息共享支撐。