了解最新公司動態(tài)及行業(yè)資訊
不小心在電腦上翻了一下,發(fā)現這個系統(tǒng)寫的不錯,一般公司都夠用了。
我不知道是誰寫的。我搜索了百度圖書館。有興趣的可以點擊閱讀原文,到百度文庫下載。
運維管理系統(tǒng)
1、一般
第一條 為保證公司信息系統(tǒng)軟硬件設備的正常運行,使員工的運維工作制度化、流程化、規(guī)范化,特制定本制度。
運維工作第二個總體目標:立足根本促發(fā)展,開創(chuàng)運維新局面。在企業(yè)發(fā)展壯大時期,通過網絡、桌面、系統(tǒng)等的運維,促進企業(yè)的穩(wěn)定可持續(xù)發(fā)展。
第三條 運維管理系統(tǒng)適用范圍:運維部門全體人員。
2、組織方式
這些實施條例包括運維服務全生命周期的管理方法、管理標準/規(guī)范、管理模式、管理支持工具、管理對象和基于流程的管理技能。
實施細則以ITIL/為基礎,以信息化項目的運維為目標,以管理支持工具為手段,以流程化、標準化、規(guī)范化管理為方法,以PDCA循環(huán)為以全生命周期為改進方法,突出運維服務全過程的系統(tǒng)化管理。
3、運維部職責
一、負責網站運維和技術支持
(一)根據網站運營戰(zhàn)略和目標,負責制定和組織開發(fā)網站整體架構、欄目、應用系統(tǒng)等技術發(fā)展規(guī)劃,確保網站技術的穩(wěn)定性和先進性。
(二)負責網站欄目和應用系統(tǒng)的使用和培訓以及操作手冊的編寫、溝通和用戶使用過程中問題的解決;
(三)網站設備和軟件訂購計劃的制定,包括采購數量、品牌規(guī)模、技術參數等。會同行政部采購。
(四)制定網站設備和軟件的操作規(guī)程和應用管理制度,并負責監(jiān)督實施。
(五)網站設備和軟件的安裝、調試和初檢,使用培訓和維修保養(yǎng)。
(六)協(xié)調解決網站日常運營過程中的信息安全和技術問題,確保網站24小時安全穩(wěn)定運行。
(七)網站技術服務外包管理,主要包括技術外包開發(fā)、運營服務托管和空間域名管理。
(八)負責網站管理系統(tǒng)和設備保密密碼的設置和保存。保密密碼設置好后報中心主任備案。保密密碼設置好后,任何人不得隨意修改,保密密碼每季度更新一次。
(九)負責新網站程序、新系統(tǒng)及網站改版升級方案的設計開發(fā)。
二、負責網站信息和技術安全
(一)貫徹落實國家和省有關網絡信息技術安全的法律法規(guī),聯絡通信管理和網絡安全監(jiān)管部門,及時處理網站信息技術安全問題,確保網站安全、穩(wěn)定、可靠運行。
(二)制定網站信息技術安全保密制度和工作流程,落實信息技術安全保密責任制,落實“誰負責,誰負責,誰承擔,誰負責”,責任在人。
(三)在服務器和電腦之間設置硬件防火墻,在服務器和工作站上都??安裝殺毒軟件,同時進行硬件和技術防護,確保網站不被病毒和黑客攻擊.
(四)負責網站信息技術安全應急預案的制定和實施。
(五)安排專人對網站各頻道、頁面、版塊、欄目信息內容進行監(jiān)控,搭建網站信息技術安全監(jiān)控值班登記制度,及時處理問題,登記問題和處理結果;
(六)構建多機備份網站信息服務體系機制,一旦主系統(tǒng)發(fā)生故障或受到電源攻擊無法正常運行,可在最短時間內更換主系統(tǒng)提供服務.
(七)搭建網站系統(tǒng)的集中權限管理,根據崗位職責設置工作人員的操作權限,為不同的應用系統(tǒng)、終端、運營商設置共享數據庫信息的訪問權限,設置密碼 不同的運營商 設置不同的用戶名并定期更改,防止運營商泄露密碼。
4、運維服務管理系統(tǒng)
運維服務管理體系明確了運維活動所涉及的各個實體以及這些實體之間的相互關系。相關單位按照運維服務管理制度進行有機組織,協(xié)調工作,按照服務合同要求提供不同層次的IT運維服務。
4.1運維服務管理對象
運維服務管理對象包括基礎設施、應用系統(tǒng)、用戶、供應商、IT運維部門和人員。詳細情況如下:
(1)基礎設施包括網絡、主機系統(tǒng)、存儲/備份系統(tǒng)、終端系統(tǒng)、安全系統(tǒng)、機房電源環(huán)境等。
(2)應用系統(tǒng)包括內部辦公系統(tǒng)、門戶網站、面向公眾的應用系統(tǒng)等。
(3)用戶包括使用上述應用系統(tǒng)的用戶。
(4)供應商包括基礎設施和應用系統(tǒng)的供應商,以及IT運維服務的供應商。
(5)運維部門和人員包括內部涉及運維活動的相關部門和人員,以及提供運維服務的企業(yè)和相關人員。
4.2運維系統(tǒng)的功能框架
運維項目組根據建設單位的體系結構和業(yè)務需求,將項目的維護框架劃分為9個具體組成部分,即:服務臺和時間管理。下設工單管理、問題管理、變更管理、配置管理、工程師評價、知識庫管理、統(tǒng)計、系統(tǒng)管理9個子項。具體的運維流程將以此為基礎。
4.3運維管理組織架構
本運維項目的運維管理架構為三層模式,如右圖所示。項目負責人應與乙方討論業(yè)務范圍,并將溝通結果向上傳遞。項目總監(jiān)負責項目的整體運維,包括各項制度的制定和實施。運維工程師在項目總監(jiān)的指導下進行維護工作。
4.3.1項目負責人
職責:負責項目業(yè)務及統(tǒng)籌協(xié)調。
職位描述:
1),全面負責制定建設單位運維項目服務計劃,帶領項目負責人安排項目工作,指導項目負責人完成具體維護工作,聽取項目負責人工作匯報每周,并負責評估項目負責人的工作完成情況。
2),協(xié)助建設單位完成新項目的監(jiān)理設計,指導項目負責人進行具體實施。
4.3.2 項目總監(jiān)
職責:規(guī)劃、執(zhí)行、改進信息化項目的運維工作,指導網絡和數據庫維護工程師組織工作。
職位描述:
1、根據公司戰(zhàn)略目標,指導下屬工程師組織客服工作,確保運維工作滿足客戶實際需求;
2、建立并持續(xù)建立運維管理體系,優(yōu)化運維流程,解決運維服務中的特殊問題;
3、規(guī)劃和提升運維工程師的專業(yè)服務能力,整體提升客戶滿意度;
4、制定并持續(xù)建立績效考核體系;
5、 制定并組織運維項目應急預案體系,指導運維工程師實施;
6、提高我的專業(yè)技能,指導業(yè)務中的網絡管理員和數據庫管理員。
4.3.3技術主管
職責:應用程序、數據庫管理、性能調優(yōu)和應用程序負載平衡。
職位描述:
1、技術主管不是項目的常駐人員,根據項目需要提供專業(yè)指導;
2、負責數據庫性能分析和調優(yōu),數據庫運行狀態(tài)監(jiān)控,及時發(fā)現異常并快速處理。
3、精通RAC技術,可以實現部署和調優(yōu)。
4、掌握WAS、...等中間件的工作原理,可以實現部署優(yōu)化和故障排查。
5、精通red-flag等linux操作系統(tǒng),部署,mysql數據庫。精通確保數據庫冗余、數據保護和故障恢復的技術。
6、負責應用負載均衡的部署和調試。
7、負責指導數據庫工程師管理員組織工作。
4.3.4服務臺
職責:電話接收故障,文件管理。
職位描述
1、負責業(yè)務緊急呼叫的受理;
2、故障處理的發(fā)起者,同時指派維護工程師跟蹤風暴的處理狀態(tài);
3、進行維修故障統(tǒng)計、用戶滿意度統(tǒng)計、工作報告輸出等;
4、協(xié)助項目總監(jiān)整理、分類、保存文件。
4.3.5 應用程序,數據庫管理員
崗位職責:維護建設單位業(yè)務系統(tǒng)的正常運行,解決應用和數據庫故障。
職位描述:
1、監(jiān)控業(yè)務系統(tǒng)運行狀態(tài),監(jiān)控和優(yōu)化應用和數據庫性能,并進行必要的調整;
2、規(guī)劃不同數據的生命周期,制定備份、恢復、遷移和容災策略,根據業(yè)務需求進行數據轉換和遷移操作;
3、確保應用程序和數據庫系統(tǒng)的安全性、完整性和運行效率。
4、負責數據庫平臺整體框架及解決方案的制定與實施;
5、工作認真、細致、主動、理性,具有良好的溝通能力和團隊合作精神。
4.3.6終端管理員
崗位職責:維護建設單位桌面系統(tǒng)的正常運行pc運維外包,解決終端及周邊故障。
職位描述:
1、各部門筆記本、打印機、傳真機的維修保養(yǎng);
2、為各部門員工提供筆記本相關的技術支持和培訓;
3、熟練使用XP及以上版本,才能熟練使用及以上版本,以便制作相應教程培訓其他部門員工
4.4運維服務流程
IT運維服務管理流程涉及服務臺、事件管理、問題管理、配置管理、變更管理、發(fā)布管理、服務水平管理、財務管理、能力管理、可用性管理、服務連續(xù)性管理、知識管理和供應商管理,等等,隨著運維活動的不斷深入和不斷完善,其他流程可能會逐漸獨立和規(guī)范。
4.4.1 項目運維服務工作流程
4.4.2服務臺
服務臺是支撐運維服務的核心功能,與各個流程密切相關。所有管理流程都必須通過服務臺為用戶提供單點聯系,以回答與用戶相關的問題和需求,或為用戶找到合適的支持人員。
在這個系統(tǒng)中,服務臺是接收各種來源的服務請求和相關信息反饋的唯一入口和出口。同時,服務臺還負責處理通常被請求且只能通過知識庫解決的請求(歷史動蕩)。橋。
4.4.3風暴管理
風暴管理流程的主要目標是盡早恢復服務供應并減少其對業(yè)務的不利影響,從而確保服務質量和可用性達到最佳水平。風暴管理過程通常包括風暴的檢測和記錄、事件的分類和支持、事件的調查和診斷、事件的解決和恢復以及風暴的關閉。
系統(tǒng)將所有服務請求和報告歸咎于動蕩。風暴管理是為服務臺和風暴管理者提供風暴的記錄、處理、查詢、審計、分發(fā)等功能。它還包括通過連接第三方監(jiān)控系統(tǒng)并向其發(fā)送報告來創(chuàng)建風暴的功能。
4.4.4 工單管理
工單管理:工單是現場運維和二線支持的任務載體。運維項目根據收到的工單執(zhí)行運維工作。工單管理是實現工單創(chuàng)建、更改、查詢、瀏覽、調度、監(jiān)督等功能的模塊。
4.4.5問題管理
問題管理過程的主要目標是防止問題和崩潰的再次發(fā)生,并將未解決事件的影響降至最低。問題管理過程包括診斷事件根本原因和確定問題解決方案所必需的活動,并負責通過適當的控制過程,特別是變更管理和發(fā)布管理,確保解決方案的實施。問題管理還將維護有關問題、變通方法和解決方案的信息。
問題管理是針對已經處理的遺留問題或應對動蕩的解決方案考慮的模塊,它只是治標不治本,不能徹底解決問題。根據風暴和解決方案,問題處理人員將調查、診斷并提出最終解決方案。
4.4.6變更管理
變更管理對所有基礎設施和應用系統(tǒng)實施變更。變更管理應記錄和分類所有需要的變更。應評估變更請求的風險、影響和業(yè)務收益。它的主要目標是在對服務的干擾最小的情況下實現有益的改變。
變更管理是對主要資源的增加、變更、升級等運維活動進行初步審查的功能,以防止這些活動對現有資源的可用性造成不必要的影響和損害;同時,也必須在工單中落實。產生的更改受后審計功能的約束。
4.4.7配置管理
配置管理過程負責驗證在基礎設施和應用系統(tǒng)中實施的更改以及配置項之間的關系是否已正確記錄;確保配置管理數據庫準確反映現有配置項的實際版本狀態(tài)。
配置管理實際上是對所有資源進行統(tǒng)一管理的功能,包括對整個資源生命周期的參數或配置變更記錄的管理。管理信息主要涉及分類、型號、版本、位置、狀態(tài)等基礎信息及相關信息,以及核心參數等。
4.4.8 知識庫管理
知識庫管理:知識庫是提供給運維人員的重要技術數據內容。他收集工作中遇到的典型案例總結的知識點和綜合實用數據指南。在該系統(tǒng)中,知識庫管理提供了易用的人機接口、快速查詢的技術手段和維護手段。
4.4.9統(tǒng)計及工作報告
運維管理系統(tǒng)提供一線解決率統(tǒng)計、客戶滿意度統(tǒng)計、分類風暴匯總統(tǒng)計、工作報告生成等功能。按照一定的格式,風暴數據、工單數據、問題數據、配置數據、變更數據可以幫助操作。維護經理可以清楚地列出運維所做的工作內容。
5、運維服務內容
5.1服務目標
運維項目組提供的運維服務包括與信息系統(tǒng)相關的主機設備、操作系統(tǒng)、數據庫和存儲設備的運維服務,以保證用戶現有信息系統(tǒng)的正常運行,增加綜合管理成本,提高網絡信息系統(tǒng)的整體服務水平。同時,根據日常維護的數據和記錄,提供用戶信息系統(tǒng)的整體建設規(guī)劃和建議,更好地為用戶信息化發(fā)展提供有力保障。
用戶信息系統(tǒng)的組成主要分為硬件設備和軟件系統(tǒng)兩大類。硬件設備包括網絡設備、安全設備、主機設備、存儲設備等;軟件設備可分為操作系統(tǒng)軟件、典型應用軟件(如數據庫軟件、中間件軟件等)、業(yè)務應用軟件等。
服務項目范圍所涵蓋的信息系統(tǒng)資源的以下幾個方面的關鍵狀態(tài)和參數指標:
?運行狀態(tài)和故障條件
?配置信息
? 可用性和健康績效指標
5.2IT 資產統(tǒng)計服務
服務包括:
?硬件設備型號、數量、版本等信息的統(tǒng)計記錄
?軟件產品型號、版本和補丁的統(tǒng)計記錄
?網絡結構、網絡路由、網絡IP地址統(tǒng)計記錄
? 綜合布線系統(tǒng)配光示意圖
?其他輔助設備的統(tǒng)計記錄
5.3網絡與安防系統(tǒng)運維服務
網絡系統(tǒng)的運維管理從網絡連通性、網絡性能、網絡監(jiān)控管理三個方面來實現。
?設備基本性能測量:cpu、內存使用檢測;
? 設備日志查看;
?設備snmp狀態(tài);
?測試Ping等工具的連通性;
?網絡安全策略的應用是否正常;
? 實時檢測帶寬流量;
?網絡拓撲鏈路狀態(tài)檢測;
? 網絡數據包流量異常;
?Dos、ddos等網絡斷電攻擊檢測;
?線路錯誤解決和丟包率檢測;
5.4主機和存儲系統(tǒng)運維服務
提供的主機和存儲系統(tǒng)運維服務包括:主機和存儲設備的日常監(jiān)控、設備運行狀態(tài)監(jiān)控、故障排除、操作系統(tǒng)維護、補丁升級等。
監(jiān)控管理的內容包括:
?CPU性能管理;
? 顯存使用管理;
? 硬盤利用率管理;
? 系統(tǒng)進程管理;
?主機性能管理;
?實時監(jiān)控主機電源、風扇使用情況、主機機箱內部溫度;
?監(jiān)控主機硬盤的運行狀態(tài);
?監(jiān)控主機網卡、陣列卡等硬件狀態(tài);
?監(jiān)控主機HA的運行狀態(tài);
?主機系統(tǒng)文件系統(tǒng)管理;
?監(jiān)控存儲交換機的設備狀態(tài)、端口狀態(tài)和傳輸速率;
?監(jiān)控備份服務進程和備份狀態(tài)(起止時間、成功、錯誤告警);
?監(jiān)控和記錄C盤陣列、磁帶庫等存儲硬件故障提示和告警,及時解決故障問題;
? 監(jiān)控存儲(如緩存、光纖通道等)的性能。
5.5 數據庫系統(tǒng)運維服務
提供的數據庫運維服務包括主動數據庫性能管理,這對系統(tǒng)運維非常重要。通過主動的性能管理,可以了解數據庫日常運行狀態(tài),識別數據庫性能問題出現在哪里,有針對性地進行性能優(yōu)化。同時,密切關注數據庫系統(tǒng)的變化,主動預防可能出現的問題。
監(jiān)控管理的內容包括:
?基本數據庫信息:文件系統(tǒng)、碎片、死鎖、高CPU使用率或長時間SQL語句。
?表空間使用信息檢測;
?數據庫文件I/0讀寫;
? 監(jiān)控連接數;
?數據庫竊聽運行狀態(tài)檢測;
?檢查日常數據備份和數據同步是否正常;
? 病例報告日志檢測;
? 檢測表和索引的表空間碎片;
? 檢查數據庫后臺進程;
? 檢測數據庫對象的空間擴展;
5.6 中間件運維服務
中間件管理是指對BEA、MQ等中間件進行日常維護管理和監(jiān)控,提高對中間件平臺風暴的分析和解決能力,保障中間件平臺持續(xù)穩(wěn)定運行。中間件監(jiān)控指標包括配置信息管理、故障監(jiān)控、性能監(jiān)控。
?執(zhí)行線程:監(jiān)控中間件配置執(zhí)行線程的空閑數量。
?JVM顯存:JVM顯存曲線正常,可以及時回收顯存空間。
? JDBC連接池:連接池的初始容量和最大容量應該設置相等,并且至少等于執(zhí)行線程數,以防止在運行過程中創(chuàng)建數據庫連接造成性能消耗。
?檢測中間件日志文件是否有異常錯誤
?如果有中間件集群配置,需要檢查集群配置是否正常。
5.7 終端及周邊運維服務
負責維護終端PC、筆記本、工作站的操作系統(tǒng)、應用軟硬件,解決用戶在應用過程中遇到的問題,進行簡單培訓,完成復印機等其他周邊設備的故障排除。
6、緊急服務響應倡議
運維項目組制定了詳細的應急預案,整個過程嚴謹有序。但是,在服務維護過程中,并不能完全杜絕意外情況。我們將詳細分析項目實施的突發(fā)風險,但我們針對各種突發(fā)風暴設計了相應的預防和解決措施,并提供了完整的應急處理流程。
6.1應急預案實施的基本流程
6.2 突發(fā)風暴的應急響應策略
(1)值班人員平時要做好應急風暴的監(jiān)測工作。對于突發(fā)性的風暴pc運維外包,要認真分析準確判斷出故障所在的數據字段,并負責跟蹤風暴直到對于不在運維中心的故障,要第一時間通知負責人到現場處理,密切關注暴風雨過程和進展,做好工作在登記工作中向領導匯報。
(2)一般情況下,要求值班人員在10分鐘內確認暴風雨。如果是正常暴風雨,將按暴風雨流程調度。按規(guī)定迅速實施應急響應步驟,及時向上級匯報,實時掌握處理情況。
(3)加工過程中,其他部門如需到現場支持加工,應及時向上級領導部門匯報,協(xié)調溝通,聯系技術工程師或廠家技術支持盡快前往現場尋求幫助。
7、服務管理系統(tǒng)規(guī)范
7.1服務時間
(1)在5*8工作時間設立專線,回答內部服務請求,記錄服務臺風處理結果。
(2)聯通電話熱線設置專人在非工作時間7*24小時接聽,解決內部技術問題,7*24小時機房監(jiān)控人員對緊急情況的匯報的電腦房。
(3)服務響應時間:
故障等級
響應時間
故障排除時間
一級:是一個緊迫的問題;其具體現象是:系統(tǒng)崩潰,導致業(yè)務停止,數據丟失。
10分鐘,30分鐘內提交故障排除計劃
3小時內
二級:問題嚴重;其具體癥狀是:部分組件出現故障,系統(tǒng)性能提升但正常運行不影響正常業(yè)務運行。
10分鐘,30分鐘內提交故障排除計劃
6小時內
三級:問題嚴重;具體現象是:出現系統(tǒng)錯誤或警告,但業(yè)務系統(tǒng)可以繼續(xù)運行,性能不受影響。
10分鐘,30分鐘內提交故障排除計劃
12小時內
第四級:常見問題;具體癥狀為:系統(tǒng)技術功能、安裝或配置咨詢,或其他看似不影響業(yè)務的預約服務。
10分鐘,2小時內提交故障排除方案
24小時內
7.2 行為準則
(1)違反用戶各項規(guī)章制度,嚴格按照用戶相應規(guī)章制度行事。
(2)與用戶運維系統(tǒng)其他部門和環(huán)節(jié)密切配合,共同組織技術支持工作。
(3)遇到技術、業(yè)務疑難問題和重大突發(fā)事件及時向負責人報告。
(4)現場技術支持要細膩,著裝得體,文明,說話簡單。接電話時,文明禮貌,語言清晰,語氣謙虛。
(5)遵循保密原則,負責受支持單位的網絡、主機、系統(tǒng)軟件、應用軟件等的密碼、核心參數、業(yè)務數據等的保密,并不得隨意復制和傳播。
歡迎訂閱賬號。運維幫是由原創(chuàng)始人之一法國蜘蛛維護的技術共享平臺。
歡迎加入QQ討論群()和陌陌討論群,陌陌群需要先添加陌陌()再拉你進去。
新技能get√,好工具get√,快讓更多男人知道吧。