數(shù)據(jù)處理
阿里云計(jì)算開(kāi)放數(shù)據(jù)處理服務(wù)(Open Data Processing Service,ODPS)是飛天平臺(tái)上的大規(guī)模分布式數(shù)據(jù)處理服務(wù),它以RESTfulAPI 的形式支持基于描述性查詢語(yǔ)言SQL 的數(shù)據(jù)處理,并提供MapReduce的并行計(jì)算框架。ODPS 重點(diǎn)面向數(shù)據(jù)量大(PB 級(jí)別)且實(shí)時(shí)性要求不高的OLAP(On-Line AnalyticalProcessing)應(yīng)用,適用于海量數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)建模、數(shù)據(jù)挖掘、數(shù)據(jù)商業(yè)智能等互聯(lián)網(wǎng)應(yīng)用。
計(jì)算性能
基于數(shù)據(jù)驅(qū)動(dòng)的多級(jí)流水線并行計(jì)算框架,支持Map、Reduce、Join、Union 等多種數(shù)據(jù)節(jié)點(diǎn)處理模式,支持直接使用SQL 語(yǔ)句對(duì)海量數(shù)據(jù)進(jìn)行離線分析。通過(guò)數(shù)據(jù)分裂將海量數(shù)據(jù)散布在整個(gè)集群內(nèi)部,數(shù)據(jù)容量瓶頸問(wèn)題得以解決。同時(shí),計(jì)算壓力也被平均分布在集群內(nèi)部,很好地解決了計(jì)算性能問(wèn)題。
高可用性
系統(tǒng)提供錯(cuò)誤監(jiān)控機(jī)制,對(duì)于故障采取自動(dòng)遷移,采用多份備份來(lái)確保數(shù)據(jù)的安全性,系統(tǒng)達(dá)到高可用性。
語(yǔ)法兼容
提供與ANSI SQL 高度兼容的語(yǔ)法支持,支持用戶復(fù)雜的數(shù)據(jù)分析需求。提供Client 工具、RESTful 開(kāi)放接口以及Java SDK 來(lái)為用戶服務(wù),用戶可以根據(jù)自己的需求選擇合適的方式來(lái)使用該服務(wù)