天云大數據榮選中國數據智能創新企業50強

 


 

2011年5月,麥肯錫發表研究報告:《大數據:下一個創新、競爭和生產率的前沿》,如今八年過去,我們見證了大數據從概念誕生到行業落地,整個數據行業由最初漫無目的的基礎設施興建,逐漸發展到基于中臺而驅動決策的數據智能時代。數據中臺被譽為大數據的下一站,成為下一風口。據不完全統計,2019年,國內約有500余家大型頭部企業正在嘗試建設數據中臺,據知名調研機構Canalys2019年2月的相關數據報告,2018年全球云計算市場規模突破800億美元,未來10-15年,數據中臺或超越今天的云計算市場,形成萬億級別的市場。

數據中臺具有堅實的基礎平臺能力,距離業務更近,能更快速的響應業務和應用開發的需求,可追溯,更精準,重在以數據驅動為中心。舉例而言,在數據量爆發式增長、涌現大量新業務場景的大型金融機構之中,數據中臺可以加強數據融合和流動,支撐混合交易處理,大幅提升業務響應能力,這部分價值已在大型金融機構得到印證實踐,數據中臺的核心技術價值與行業地位日益凸顯。

在4月23日舉辦的2019·愛分析中國數據智能高峰論壇上,數據智能創新企業50強榜單正式揭曉。最終入榜的50家企業,覆蓋了數據中臺、技術中臺、業務中臺以及金融、政務、工業、零售等領域。其中,中臺領域共有30家公司上榜,是大量優秀數據智能公司的聚集賽道。天云大數據榮登本次50強企業榜單。

天云大數據經過數年積累,將大數據平臺、復雜網絡、HTAP數據庫融合而成了數據中臺。能夠實現對海量工業互聯網數據的高效、統一管理。實現數據標識融合、多源數據融合和多業務流程融合,向下兼容多種大數據開源技術框架工具,向上提供豐富的數據共享服務,支撐大規模數據處理能力,處理PB量級數據,提供實時并發事務級服務應用,同時向上提供豐富的數據服務,如面向金融、石油、醫藥、工業生產等領域輸出各種微服務。

數據中臺三階段路線圖

第一階段

數據識別和組織,數據資產評估

ADG

每個中大型企業在經過多年的IT系統建設后都會有很多的業務系統,而每個業務系統后面又會有一個數據庫、甚至會有多個數據庫,這些數據都是企業多年業務的積累。為了充分利用這些數據,各企業一般會通過實施數據倉庫的方式來生成這些數據的視圖。但數據倉庫不如業務靈活性強,當需要看不同的數據視圖時,需要對數據倉庫做大的調整。此外,很多銀行的業務太多,為了實現數據的統?,又要實施主數據和數據治理方案。無論是主數據還是數據倉庫,實施和維護成本都非常?。

為此,天云推出了一種輕型的BI和自動化數據管理系統,可以在天云的復雜網絡大數據平臺上?利用人工智能技術自動地發現銀行各業務系統數據的架構和數據主體,并直接發現跨數據庫的表和人財物各類數據間的關系,當用戶需要做跨數據庫的復雜查詢時,天云產品可以根據關系圖快速生成SQL語句,從而使得各銀行的技術人員快速從不同的數據庫中提取出所需要的數據。

ADG圖計算應用可以服務于多種場景,在銀行方面包括向人民銀行上報審查數據、靈活的BI、?為AI或SAS模型提取數據、為各種跨業務應用提供數據服務。

天云在某能源公司的分局已經成功實施了該應用,共將十幾個業務系統(數據采集、核心應用、信息中心、開發月報、開發應用、協同平臺等)的數據庫、7000多張個表、?十幾萬個字段的元數據和主數據提取出來,并建立了統?一的關系視圖,而整個工程從天云的復雜網絡Hilbert安裝部署開始只需要2周就可以完成;與數據倉庫和主數據系統的建設相比明顯快了很多,而且可以根據業務和數據的變化,天云所產生的Schema可以跟著一起變化,非常靈活。

第二階段

數據融合和流動,重構基礎設施

混布HTAP

伴隨著數倉消費化,數據的鮮活性與復雜性出現日益交錯的矛盾,因此在技術上一款能夠同時支持OLTP(在線事務處理)與OLAP(在線分析處理)的數據庫應運而生,這即是Gartner提出的HTAP數據庫,涵蓋大部分行業應用的需求,一站解決數據鮮活性與復雜性的交錯矛盾。

以某銀行的客戶積分為例,移動代碼需要將客戶的積分分析進行統計計算,等待數倉計算一個半小時之后,再將結構返回應用系統提供聯機事務處理。這種時效性難以滿足要求即時反饋的客戶需求。而天云的HTAP分布式系統融合了TP聯機事務和AP的分析引擎,使得效率更優,架構更優;融合之后完成和聯機、分析、建模一體功能。保持了數據鮮活性需求。

再以某商業銀行實時流水交易業務可視化展示項目為例,在該項目中使用了Kafka 和SPARK Streaming流式處理框架,在該框架中成功地引入了天云大數據HTAP HUBBLE 數據庫, 在大數據環境下通過和Kafka,SPARK Streaming 等組件的深度融合,成功地實現了對互聯網用戶交易報文數據的實時采集,經過一系列的處理之后,最終有HTAP 數據庫提供數據可視化展示, 達到了預期功能目標。

第三階段

數據價值化,數據模型服務應用

AI PaaS

天云從2014年開始投入人力研發AI產品工具,打造了特征工程,模型孵化平臺和模型運行平臺三款產品,實現模型自動化流程線。即Kaleido——Maxim AI——Gare。

kaleido是基于Spark的分布式特征工程平臺,包括非常豐富的基礎組件和面向不同行業應用的轉用組件,用于將臟數據清洗、加工為可用于AI建模的“特征”,Kaleido的輸出可用于AI建模,例如供給到天云Maxim AI分布式數據科學平臺。Maxim AI是集成了多種機器學習算法,并且支持自動化機器學習建模的數據科學平臺,適用于分類、聚類和回歸等多種機器學習任務,能夠將“特征”訓練為預測性模型,Maxim AI 輸出的模型部署到生產環境后可接收業務數據并給出預測值,以便支持業務人員進行業務決策。Maxim AI輸出的模型可部署到天云Gaea決策引擎中,在決策引擎中運行,接收業務數據給出預測值。此外,gaea還支持通過界面編輯規則,創建純規則模型或規則+AI模型的混合模型,能夠快速將業務知識或AI模型變成業務人員易于理解的業務語言。Kaleido、Maxim AI和Gaea可構成一個完成的系統實現從數據到業務決策的全流程數據挖掘,也可配合其他系統單獨使用。

竞彩微信投注 发文章赚钱是假的吗 卖特假童装赚钱吗 山东麻将各种胡法 电商拍单赚钱吗 eve 新人赚钱 老有内蒙古麻将下载挂 王者捕鱼现金版 手表赚钱运动 炒股可以赚钱吗知乎 网络捕鱼游戏排行 优步司机怎么赚钱多 开饮品加盟店赚钱吗 壹加壹线上娱乐网址 明星靠收视率怎么赚钱 达达随手赚钱怎么用的 哈尔滨麻将安卓手机版