AE數(shù)據(jù)集成主要涵蓋傳統(tǒng)ETL、ELT的能力,提供了豐富的數(shù)據(jù)處理、轉換功能組件,同時可集成實時數(shù)據(jù)復制、主數(shù)據(jù)管理產品(MDM),為企業(yè)提供一個全面的數(shù)據(jù)集成處理解決方案;實時數(shù)據(jù)集成除了可集成到數(shù)據(jù)集成產品中提供實時能力之外,也可單獨部署,滿足企業(yè)實時數(shù)據(jù)同步、災備等需要。
用友AE數(shù)據(jù)集成
分析處理引擎是AE的核心部分。它是上層BQ分析展現(xiàn)產品和底層數(shù)據(jù)存儲層的橋梁,主要包括查詢引擎、報表引擎、多維分析(OLAP)引擎。多維分析引擎基于ROLAP技術,實現(xiàn)上層多維立分析方體模型對底層數(shù)據(jù)倉庫數(shù)據(jù)的動態(tài)實時多維分析展現(xiàn)操作,支持MDX、XMLA,應用內存分析技術,可以快速進行大規(guī)模數(shù)據(jù)的即時分析?;诹写媸綌?shù)據(jù)庫,可實現(xiàn)數(shù)百GB數(shù)據(jù)的即時多維分析操作的秒級響應。
數(shù)據(jù)挖掘提供向導化的模型訓練,預測,及其對應的可視化展現(xiàn)。實現(xiàn)數(shù)據(jù)挖掘模型訓練,分析執(zhí)行結果的管理等功能。預置時間序列挖掘算法,如季節(jié)分析模型,差分自回歸模型等。數(shù)據(jù)挖掘基于開源R平臺,有非常豐富的算法支持,算法的更新推出速度快。另外具有高性價比,與R語言整合后可以大幅降低數(shù)據(jù)挖掘項目的實施成本。
用友AE數(shù)據(jù)處理引擎
大數(shù)據(jù)時代,企業(yè)需要對大規(guī)模多種類型(結構化、半結構化、非結構化)的數(shù)據(jù)進行集中、統(tǒng)一、快速的處理和分析來支持業(yè)務增長。傳統(tǒng)的基于關系數(shù)據(jù)存儲系統(tǒng)的技術和產品無法進行大規(guī)模、非結構化數(shù)據(jù)的處理,而新興的各種開源大數(shù)據(jù)處理產品尚未形成成熟的標準化的應用產品和框架,使用難度大,技術集成度復雜,不能滿足業(yè)務發(fā)展需求。為解決企業(yè)快速、低成本的運用Hadoop,需要軟件服務廠商提供一個整合性的產品技術解決方案,于是,便有了用友UDH。
用友UDH,基于開源hadoop,hive,storm、Spark等進行了優(yōu)化,按照企業(yè)數(shù)據(jù)處理與分析的應用模式,開發(fā)了一系列管理工具,涵蓋大規(guī)模非結構化數(shù)據(jù)集成、存儲和分析計算。單集群可達100臺以上,可管理PB級數(shù)據(jù)。
企業(yè)想要想要建成一個Hadoop系統(tǒng),即使有較大技術團隊和較強技術力量儲備的企業(yè)和組織,至少也要一年的時間,才有辦法一個Hadoop的集群,做到可以商業(yè)運行的階段。使用UDH,會把整個系統(tǒng)的人力投入降到1到2個工程師就可以去運維一個相當大規(guī)模的一個集群,而且把時間縮短到大概在一個月左右,這對企業(yè)來講是非常重要,因為它意味著更小的成本、更快的投資回報。
另外,企業(yè)用戶如果對Hadoop整個產品體系的發(fā)展、演變和技術架構不是很熟悉的情況下,要部署HA,十分困難。尤其安全的部分,如何實現(xiàn)對數(shù)據(jù)的強認,也相當復雜。通過使用UDH,這些東西可以統(tǒng)統(tǒng)做成自動化,用戶基本上不會感覺到什么問題。
用友AE屬于用友UAP平臺的一部分,結合UAP平臺的其他產品,還可以為客戶提供在全企業(yè)級更廣泛的綜合數(shù)據(jù)治理平臺化解決方案,實現(xiàn)向數(shù)據(jù)驅動的企業(yè)跨越。