《ITSM-AV-01可用性計劃》由會員分享,可在線閱讀,更多相關(guān)《ITSM-AV-01可用性計劃(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、編號:ITSM-4-AV-01版本號:V1.0受控狀態(tài):受控密級:內(nèi)部公開XXXXXXt限公司XXXXX給滿數(shù)字化分析模型項目2019年度可用性計劃版權(quán)聲明和保密須知本文件中出現(xiàn)的任何文字敘述、文檔格式、插圖、照片、方法、過程等內(nèi)容,除另有特別注明,版權(quán)均屬XXXXXX有限公司所有,受到有關(guān)產(chǎn)權(quán)及版權(quán)法保護。任何單位和個人未經(jīng)XXXXXX有限公司的書面授權(quán)許可,不得復制或引用本文件的任何片斷,無論通過電子形式或非電子形式。Copyright?2019XXXXXX有限公司版權(quán)所有文檔信息文檔編號:ITSM-4-AV-01文檔分類:內(nèi)部公開編寫人:技術(shù)部門審批人:版本記錄版本號版本日期修改審批人修
2、改履歷V1.02019.9.12技術(shù)部門創(chuàng)建文檔目錄1概述41.1 文檔目標42可用性的測量43 IT服務可用性需求分析43.1 業(yè)務需求53.2 維護指標63.3 運行指標64 IT服務可用性目標74.1 計劃不可用時間74.2 可用性監(jiān)控指標84.3 可用性監(jiān)控指標度量標準84.4 監(jiān)控方式及報告周期84.5 2019年度可用性監(jiān)測計劃表91概述1.1文檔目標為了在2019年更好的確保智能倉儲物流平臺滿足客戶要求,特制定本計劃,旨在明確IT服務可用性的目標,管理并改進IT服務可用性,在預算范圍內(nèi)使運維團隊提供的服務能夠最大化地滿足組織的需求。2可用性的測量1)IT基礎架構(gòu)的復雜程度:該服務
3、包括了應用系統(tǒng)、網(wǎng)絡、弱電和數(shù)據(jù)庫及服務器等硬件設施,復雜度為中等。2)IT服務組件的可靠性:在項目中運行的設備由廠家負責維保,我公司提供備份已備替換。軟件系統(tǒng)及數(shù)據(jù)庫經(jīng)過公司內(nèi)部測試,目前穩(wěn)定性可在96%以上。3)對故障作出快速有效反應的能力:長期安排一位工程師現(xiàn)場駐點,提供遠程網(wǎng)絡、電話等方式在線服務,如現(xiàn)場故障不能及時解決,2個小時內(nèi)派工程師達到現(xiàn)場,7X24小時支持服務。4)IT部門或供應商提供的維護的質(zhì)量:交由公司的商務部對對供應商的資質(zhì)能力進行檢查,定期巡檢和登記備案。設備安裝上線之前已進行了交付驗收測試。3 IT服務可用性需求分析建立和維護與組織業(yè)務需求相一致的IT服務可用性計劃
4、,必須明確組織業(yè)務和客戶的需求,在此基礎上制定的IT服務可用性計劃才能最大化地支持組織業(yè)務的發(fā)展運作和用戶的工作,符合組織的利益。3.1 業(yè)務需求智能倉儲物流平臺管理系統(tǒng)中硬件網(wǎng)絡設備和服務器、網(wǎng)絡線路是用戶單位的關(guān)鍵IT系統(tǒng),定義為關(guān)鍵業(yè)務,其業(yè)務需求如下:指標定義承諾標準非重大故障系統(tǒng)恢復時間除操作系統(tǒng)不能啟動、硬件損壞機器不能啟動、重要系統(tǒng)數(shù)據(jù)丟失外的其他故障1個工作日重大故障系統(tǒng)恢復時間操作系統(tǒng)不能啟動、硬件損壞機器不能啟動、重要系統(tǒng)數(shù)據(jù)丟失可用性93-97.5%87.6-43.8小時在本年度的IT服務組件可用性識別考慮的因素包括:(1) 應用系統(tǒng)、中間件和操作系統(tǒng)方面,包括單點故障、
5、不當配置選項、設計缺陷、低效的開發(fā)方法、代碼編寫錯誤等(2) 硬件和網(wǎng)絡方面,包括單點故障、過時的固件、不當?shù)奈臋n維護、廠商支持水平不夠、缺乏抗靜電防范措施、缺乏后備資源、線纜連接標識混亂等(3) 配套設施方面,包括空調(diào)能力不足、電源中斷、電源不穩(wěn)定、火災與洪水、物理安全疏漏等(4) 出口設施方面,包括單一供電線路和單一電信線路(5) 人員方面,包括低劣的質(zhì)量控制規(guī)程、缺乏紀律約束、缺乏專業(yè)技能等3.2 維護指標表3-1系統(tǒng)維護指標表指標名稱指標定義及計算方法指標值系統(tǒng)可用率指某個增值業(yè)務平臺業(yè)務中斷時長與統(tǒng)計總時長之比系業(yè)務中斯時間(分鐘)統(tǒng)可用率=統(tǒng)計息時長(例中)X100%99%服務滿意
6、度a二一14(4為各季度滿意度得分值)90故障處理及時率口M00%95工單處理及時率按時完成的工單數(shù)L工電蟋Xi。953.3 運行指標表3-2系統(tǒng)運行指標表設備名稱指標名稱峰值告警閾值平均告警閾值服務器CPUIJ用率90%50%磁盤利用率90%65%內(nèi)存利用率90%65%數(shù)據(jù)庫表空間利用率85%70%網(wǎng)絡設備運行流量90%50%引擎板(主控)運行流量90%50%CPU處理器荷載90%50%4 IT服務可用性目標服務內(nèi)容描述可用性目標備注無線控制器AP信號98%引擎板主控板99%16口萬兆交換板網(wǎng)絡交換95%48口千兆交換板網(wǎng)絡交換95%WA2620-FIT無線局域網(wǎng)室內(nèi)型雙頻接入點99%SFP
7、-GE-SX-MM850D光模塊-SFP-GE-多模模塊99%LSWM1AC300300W交流系統(tǒng)電源模塊99%SWP-IMC7-IMPH3CiMC-智能管理平臺標準版99%4.1 計劃不可用時間2019年IT服務提供的可用時間段為:5X8小時,7X24小時技術(shù)支持。服務提供次要時段,如較容易承受停機故障的時間:工作日的24:004:00之間。服務提供的關(guān)鍵時段:計劃內(nèi)的系統(tǒng)的升級需要停止服務,再進行程序更新,更新完成后再把服務啟動;因此每次升級導致物聯(lián)網(wǎng)平臺系統(tǒng)有半小時左右不可用。出于對業(yè)務影響最小化的考慮,此操作會提前三天左右通知并安排在下班后或者周末進行。每年計劃有4小時左右要對設備進行
8、一次表結(jié)構(gòu)維護操作,屆時系統(tǒng)將不可用。4.2 可用性監(jiān)控指標系統(tǒng)/服務組件指標描述存儲系統(tǒng)平均響應時間某一階段內(nèi)的平均響應時間是否可以登錄網(wǎng)絡端口的可連通性互聯(lián)網(wǎng)連通性測試到指定網(wǎng)站的連通性4.3 可用性監(jiān)控指標度量標準指標度量標準注釋連續(xù)工作時間設備功能正常,不出功能性故障人為操作失誤造成的故障同樣視為設備故障;不影響實質(zhì)性服務功能的故障不考慮在本指標的度量范圍內(nèi)故障頻率在一段時間內(nèi)發(fā)生故障的頻率恢復時間從發(fā)生故障到恢復服務提供所經(jīng)歷的時間響應時間發(fā)出指令到相關(guān)設備做出回應的時間對一條數(shù)據(jù)通路中的所有設備,應分別計算各自的響應時間和總響應時間網(wǎng)絡可連通性通過IP是否能夠連通到設備是否可登陸通
9、過正常步驟是否能夠成功登陸4.4 監(jiān)控方式及報告周期系統(tǒng)/服務組件報告周期監(jiān)控方式負責人無線控制器每月軟件及人工監(jiān)控實施工程師引擎板每月軟件及人工監(jiān)控實施工程師16口萬兆交換板每月軟件及人工監(jiān)控實施工程師48口千兆交換板每月軟件及人工監(jiān)控實施工程師WA2620-FIT每月軟件及人工監(jiān)控實施工程師SFP-GE-SX-MM850D每月軟件及人工監(jiān)控實施工程師LSWM1AC300每月軟件及人工監(jiān)控實施工程師SWP-IMC7-IMP每月軟件及人工監(jiān)控實施工程師按照月度進行可用性監(jiān)控數(shù)據(jù)匯總,包括網(wǎng)絡,IT基礎架構(gòu)系統(tǒng),應用系統(tǒng)的可用性情況。根據(jù)上述分析和總結(jié),2019年度可用性計劃時間表如下:4.5
10、2019年度可用性監(jiān)測計劃表分類子類項目子項2019年行動計劃責任人監(jiān)測內(nèi)容及時間頻率第一季度第二季度第三季度第四季度業(yè)務軟件平臺管理軟件降低軟件出錯率程序bug每月,由系統(tǒng)集成部進行遠程監(jiān)測,內(nèi)部系統(tǒng)升級之后進行推送全年實施工程師響應、解決問題速度每周,系統(tǒng)登錄、頁面訪問、數(shù)據(jù)查詢等全年實施工程師網(wǎng)絡環(huán)境監(jiān)控客戶網(wǎng)絡排查每天早上9點遠程監(jiān)測全年實施工程師網(wǎng)絡流量監(jiān)控各時段網(wǎng)絡流量查看每天早上9點遠程監(jiān)測全年實施工程師數(shù)據(jù)分析每天下午5點遠程監(jiān)測全年實施工程師操作系統(tǒng)Windows監(jiān)控API網(wǎng)關(guān)保養(yǎng)每月初遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師cpu、內(nèi)存等硬件巡檢每天早上9點遠程監(jiān)測,現(xiàn)場
11、駐場工程師配合全年實施工程師安全性每周五遠程監(jiān)測全年實施工程師性能分析每月初遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師DBSQLSERVER監(jiān)控歸檔日志每周五遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師數(shù)據(jù)文件、表空間巡檢每周五遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師數(shù)據(jù)庫性能分析每周五遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師集群狀態(tài)巡檢每周五遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師集群健康巡檢每周五遠程監(jiān)測,現(xiàn)場駐場工程師配合全年實施工程師存儲設備磁盤陣列監(jiān)控存儲控制器巡檢每周,現(xiàn)場駐場工程師配合全年實施工程師存儲磁盤巡檢每周,現(xiàn)場駐場工程師配合全年實施工程師硬件設備網(wǎng)絡交換機監(jiān)控設備狀態(tài)巡檢每周1,現(xiàn)場駐場工程師配合全年實施工程師配置備份每周1,現(xiàn)場駐場工程師配合全年實施工程師服務器設備指示燈現(xiàn)場巡檢每周1,現(xiàn)場駐場工程師配合全年實施工程師CP應行率系統(tǒng)優(yōu)化和維護每周1,現(xiàn)場駐場工程師配合全年實施工程師磁盤冗余系統(tǒng)維護每周1,現(xiàn)場駐場工程師配合全年實施工程師內(nèi)存占用率系統(tǒng)維護每周1,現(xiàn)場駐場工程師配合全年實施工程師