《《阿里大數(shù)據(jù)架構》PPT課件.pptx》由會員分享,可在線閱讀,更多相關《《阿里大數(shù)據(jù)架構》PPT課件.pptx(37頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、系統(tǒng)架構概述Yes, We KAO更強,更高,更持久 了解什么是架構了解Alibaba網(wǎng)站架構的歷史掌握Alibaba網(wǎng)站架構的現(xiàn)狀掌握網(wǎng)站架構設計的理念課程目標和內容 架構規(guī)定了軟件的高層劃分及各部分間的交互架構不是軟件,但架構決策體現(xiàn)于軟件平臺和框架之中架構的優(yōu)劣決定了業(yè)務應用系統(tǒng)的實施能力和發(fā)展空間技術搭臺,業(yè)務唱戲 架構搭臺,應用唱戲架構永遠在隨著業(yè)務的發(fā)展而變遷 擁抱變化!什么是架構?架構變遷更多用戶更多數(shù)據(jù)更多功能硬件成本人力成本質量成本提高 收益節(jié)約成本業(yè)務發(fā)展 B2 B架構演化過程 1999史前2001石器時代2002中世紀2005工業(yè)革命未來星際時代?Perl WebMacr
2、opojojdbc VelocityEjb WebXSpring SOAOPEN API云計算 Perl,CGI Mysql Apache服務器在美國,5 6 KModem,遠程開發(fā)、測試、部署1 9 9 9 -史前時代 Java服務器使用線程性能比cgi技術使用進程好 Java相比Perl,可維護性好,開發(fā)效率高 Java開始在國內流行史前-石器時代原因 開始使用Java模板技術采用WebMacro中間層采用Servlet技術,使用POJO封裝業(yè)務邏輯和數(shù)據(jù)訪問使用BizObj對象封裝基本業(yè)務邏輯和數(shù)據(jù)訪問方法其它業(yè)務對象繼承BizObj方法,實現(xiàn)自己的業(yè)務邏輯和數(shù)據(jù)訪問方法使用JDBC訪問
3、數(shù)據(jù)庫 Servlet容器使用resin,Web服務器使用Apache2 0 0 1底-石器時代-www系統(tǒng) 2 0 0 1底-石器時代(續(xù))基于POJO的biz層基于WebMacro的模板技術表現(xiàn)層業(yè)務層BizObj 業(yè)務邏輯方法數(shù)據(jù)訪問方法OfferObj業(yè)務邏輯方法數(shù)據(jù)訪問方法MemberObj業(yè)務邏輯方法數(shù)據(jù)訪問方法CompanyObj業(yè)務邏輯方法數(shù)據(jù)訪問方法基于pojo的Biz層Oracle數(shù)據(jù)庫LDAP數(shù)據(jù)存儲 表現(xiàn)層僅僅使用模板技術,缺乏MVC框架,導致大量的servlet配置業(yè)務邏輯層和數(shù)據(jù)訪問層耦合,可維護性和可擴展性差受到EJB風潮的影響石器時代-中世紀原因 表現(xiàn)層采用We
4、bX模板技術Velocity在Turbine基礎上開發(fā)了自己的服務框架和一系列公共服務通過一個delegate對象訪問業(yè)務邏輯層業(yè)務邏輯層使用EJB(SLSB,CMP,DAO等)通過一個faade對象供表現(xiàn)層delegate訪問 Faade對象訪問多個SLSB實現(xiàn)的controller對象實現(xiàn)業(yè)務邏輯使用CMP實現(xiàn)單條記錄的增加和刪除考慮性能,在CMP之外封裝DAO對象通過JDBC訪問數(shù)據(jù)庫 EJB服務器使用Weblogic Web服務器使用Apache2 0 0 2底-中世紀 2 0 0 2底-中世紀(續(xù)) 搜索引擎Oracle數(shù)據(jù)庫LDAP使用SLSB實現(xiàn)的業(yè)務邏輯對象Controlers
5、 基于Webx以及Service框架的Web層框架CMP進行單條記錄的增加刪除,DAO對象查找表現(xiàn)層商業(yè)邏輯層數(shù)據(jù)訪問層 數(shù)據(jù)存儲delegateFaade Turbine的發(fā)展緩慢 EJB配置復雜,可維護性差重量級框架,業(yè)務侵入高高度容器依賴,可測試性差 CMP性能差,導致DAO和CMP并存中世紀-工業(yè)革命原因 表現(xiàn)層使用WebX和Service 框架 Velocity模板技術自有服務框架及多種公共服務:Form Service,Template Service,Mail Service,Rundata Service,Upload Service等通過command模式和biz層交互無狀態(tài)
6、Web應用,基于cookie實現(xiàn)session,獲取線性擴展性業(yè)務邏輯層使用Alibaba Service框架,并且引入spring 框架 Spring容器和Alibaba Service框架無縫集成 AO,BO使用分布式cache緩存對象數(shù)據(jù)訪問層 透明的事務處理引入Hibernate和iBatis,以iBatis為主 2 0 0 5 -工業(yè)革命 2 0 0 5 -工業(yè)革命(續(xù)) 搜索引擎Oracle數(shù)據(jù)庫LDAP基于Spring以及Service框架的biz層框架 基于Webx以及Service框架的Web層框架分布式Cache分布式Session基于Spring以及DAO設計模式的數(shù)據(jù)訪
7、問框架表現(xiàn)層商業(yè)邏輯層數(shù)據(jù)訪問層 數(shù)據(jù)存儲 數(shù)據(jù)庫成為瓶頸 - 分布式數(shù)據(jù)庫應用耦合嚴重 - SOA Pampas平臺演化還在繼續(xù) 中文站會員數(shù)超過2 0 0 0萬中文站Offer已經超過1 .5億中文站每天的用戶PV已經超過1 .6億中文站每天新發(fā)Offer超過1 0 0萬中文站每天重發(fā)Offer超過1 5 0 0萬國際站略少,但是增長迅猛網(wǎng)站的現(xiàn)在 中文站/國際站應用部署圖 網(wǎng)站鏡像部署圖(國際站)中供用戶網(wǎng)站運營海外賣家 Load Balance(F5, Alteon) Apache Jboss DatabaseSearch EngineApache JbossApache JbossA
8、pache Static Resource CacheStorage用戶請求處理 流量隨著用戶量而增加業(yè)務的變更頻繁用戶行為的收集產品角色的細分及調整 7 X 2 4的高可用性互聯(lián)網(wǎng)的挑戰(zhàn) 單擊此處編輯版標題樣式流量激增處理用戶請求Request Process ResponseRequest Process ResponseRequest Process Response應對的挑戰(zhàn)并發(fā)(垂直)用戶數(shù)量的增加使用資源的增加響應(水平)處理性能的維持 單擊此處編輯版標題樣式業(yè)務變更專業(yè)化細分之前 offer list detailmember company personaltransactio
9、n no support專業(yè)化細分之后offer Clothing Retail Loanmember Trust Pass Special Markettransaction alipay paypal 數(shù)據(jù)挖掘offer repostnew offerbid 行為數(shù)據(jù)的采集追蹤埋點異步收集采集數(shù)據(jù)的分析數(shù)據(jù)倉庫分析引擎運營團隊決策風險行為的控制CTU系統(tǒng)安全團隊 單擊此處編輯版標題樣式網(wǎng)站產品的生命周期產品需求整理架構團隊設計 開發(fā)團隊實施質量團隊質檢運營團隊運作用戶需求分析團隊再細分用戶需求分析商業(yè)策劃市場策劃 產品需求分析產品設計網(wǎng)站運營架構團隊架構師開發(fā)團隊程序員項目經理用戶體驗質量
10、團隊測試流程控制運營團隊產品運營客戶服務 角色專業(yè)化細分 業(yè)務1業(yè)務2業(yè)務3避免宕機集群化服務化備份切換維護時間有限新產品發(fā)布在線發(fā)布疊加式發(fā)布用戶透明過渡高可用性 架構是平衡的藝術不要把簡單問題復雜化,也不要把復雜問題簡單化系統(tǒng)架構需要考慮哪些業(yè)務要求和質量指標?怎樣取得平衡?分解復雜度 自上而下,分離關注點(總體系統(tǒng)局部) 分配復雜度 用合適的技術、合適的組織來解決問題 架構設計理念更多用戶更多數(shù)據(jù)更多功能更少硬件更少人力更少故障質量指標可用性安全性性能穩(wěn)定性可維護性 分解業(yè)務應用數(shù)據(jù)合并聯(lián)動的業(yè)務高藕合的數(shù)據(jù)持續(xù)發(fā)展插件式擴展能力弱藕合,易于剝離局部可優(yōu)化調整可測試穩(wěn)定性高可用性負載均衡
11、線性擴展可被監(jiān)控架構的考慮要點 業(yè)務劃分系統(tǒng)細分應用優(yōu)化架構考慮的方向 銷售后臺會員管理跟單管理財務管理運營后臺Offer審批會員審批類目運營數(shù)據(jù)采集分析網(wǎng)站前臺用戶登錄用戶前臺用戶后臺旺鋪、廣告社區(qū)、論壇合作部門搜索引擎阿里旺旺支付寶總體架構分解:按不同的業(yè)務領域、用戶群來分解分配:將業(yè)務需求分配到各個系統(tǒng)/服務可獨立部署和維護,它們之間多采用分布式交互業(yè)務劃分(總體架構) 會員體系運營體系業(yè)務體系業(yè)務劃分(總體架構) 系統(tǒng)架構表現(xiàn)層WebX VelocitySpring MVC業(yè)務邏輯層IOC (Spring)SOA (Pampus)EJB數(shù)據(jù)訪問層iBatisCMPJMS工具安全容錯管理
12、監(jiān)控日志Build 系統(tǒng)架構分解:按不同的技術層次來分解分配:將技術需求分配到各個容器/框架通過特定的技術模式來透明或半透明地解決技術問題 網(wǎng)站應用系統(tǒng)BOPS系統(tǒng)資源系統(tǒng)系統(tǒng)細分 應用優(yōu)化存儲系統(tǒng)DAC SANNAS搜索引擎全文索引目錄索引數(shù)據(jù)庫索引數(shù)據(jù)復制水平分割垂直分割Cache內容靜態(tài)化數(shù)據(jù)庫緩存對象緩存客戶端緩存 局部調優(yōu)(數(shù)據(jù)存?。┓纸猓喊磾?shù)據(jù)的位置、讀寫、計算特性等分解分配:將數(shù)據(jù)分配到各個不同的存儲技術適合于不同的數(shù)據(jù)存取需求 讀寫應用優(yōu)化 總體架構考慮面向服務體系系統(tǒng)架構更加專業(yè)化、服務化的信息收集系統(tǒng)更加全面化、自動化的配置管理更加有效率的鏡像同步、切換局部應用優(yōu)化分布式文件系統(tǒng)優(yōu)化數(shù)據(jù)同步系統(tǒng)讀寫分離展望未來 架構隨著業(yè)務發(fā)展不斷演進架構發(fā)展要有方向有節(jié)奏總結 Q & A