了解最新公司動態(tài)及行業(yè)資訊
根據(jù)百度百科的定義:運維工程師負責(zé)維護和保證整個服務(wù)的高可用,同時不斷優(yōu)化系統(tǒng)架構(gòu)以提高部署效率和資源利用率,從而提高整體投資回報率。無論運維做什么,運維工程師最基本的職責(zé)就是對服務(wù)的穩(wěn)定性負責(zé),保證服務(wù)能夠7*24H持續(xù)改進為用戶提供的服務(wù)。
定義:IT 團隊向內(nèi)部和外部用戶提供的所有流程和服務(wù)的超集,并由他們自己用于開展業(yè)務(wù)。
IT 運營團隊的重要角色包括技術(shù)管理和質(zhì)量保證以及基礎(chǔ)設(shè)施管理,并確保 IT 產(chǎn)品(或服務(wù))滿足客戶的所有需求和期望。運營團隊以所需的質(zhì)量和成本提供有效的服務(wù)。
我們主要想討論三個話題:
1、什么是運維
2、初學(xué)者如何系統(tǒng)學(xué)習(xí)運維知識
3、云時代的運維
1、什么是運維
首先我們來看看目前主流招聘平臺對運維工程師職位的工作內(nèi)容要求和專業(yè)技能要求:
工作職責(zé):
1、企業(yè)數(shù)據(jù)中心建設(shè)和管理相關(guān)工作,包括基礎(chǔ)網(wǎng)絡(luò)、信息安全、服務(wù)器、存儲、備份、操作系統(tǒng)、數(shù)據(jù)庫、中間件等基礎(chǔ)軟硬件建設(shè)、管理和優(yōu)化。
2、信息系統(tǒng)運行保障相關(guān)工作,包括生產(chǎn)系統(tǒng)生產(chǎn)支持、日常運維、變更和應(yīng)急處理。
3、開發(fā)測試支持相關(guān)工作,包括測試環(huán)境搭建、日常運維以及相應(yīng)的技術(shù)支持。
4、內(nèi)控管理相關(guān)工作,包括堡壘機等技術(shù)和產(chǎn)品的管理,以及流程體系的制定和實施。
工作要求:
1.熟悉虛擬化和主流linux系統(tǒng)和HA軟件。
2.熟悉mysql等主流關(guān)系型數(shù)據(jù)庫。
3.熟悉nginx、redis等軟件。
4.熟練使用shell或編寫日常管理腳本。
5.熟悉X86服務(wù)器、SAN存儲等常用硬件設(shè)備。
6.熟悉網(wǎng)絡(luò)知識服務(wù)器運維技術(shù),能對常見的交換機、路由器、防火墻、IPS、WAF等設(shè)備進行簡單的配置和管理。
7.熟悉常見的監(jiān)控、管理和控制系統(tǒng),如堡壘機等。
8.熟悉網(wǎng)絡(luò)和應(yīng)用安全相關(guān)知識和技能,能夠處理基本的網(wǎng)絡(luò)和安全問題。
可以得出結(jié)論,運維工程師的工作內(nèi)容非常廣泛服務(wù)器運維技術(shù),需要及時、適當?shù)貐⑴c到軟件產(chǎn)品的整個生命周期中。作業(yè)需求涉及的技術(shù)棧深度較大,包括:
1、腳本語言、shell、perl 或
2、網(wǎng)絡(luò)知識
3、分布式計算
4、應(yīng)用服務(wù)器
5、數(shù)據(jù)庫等中間件
6、監(jiān)控系統(tǒng)
7、安全
那么,究竟什么是運維?我們看下圖,一個軟件產(chǎn)品(或信息系統(tǒng))的交付過程,在1-5階段,運維團隊負責(zé)基礎(chǔ)設(shè)施資源供給(計算、存儲、中間件部署、安全),在第6階段,產(chǎn)品和研發(fā)團隊完成主要工作后,系統(tǒng)進入上線后運維階段。運維團隊對系統(tǒng)運行質(zhì)量、穩(wěn)定性、可靠性、安全性等指標全面負責(zé)。
在實際的運維項目中,運維團隊應(yīng)該關(guān)注的知識領(lǐng)域包括:需求變化、輸入/輸出、資源、策略、前瞻性、控制、計劃和成本。也就是說,需要在這些要素的約束下制定。運維工作標準及相應(yīng)流程。
運維部門的職能層次(發(fā)展前景)一般有以下幾個層次:
a、初學(xué)者、操作系統(tǒng)、中間件安裝部署、通用配置
b、中級工程師、應(yīng)用部署與配置、系統(tǒng)運行監(jiān)控
c、高級/專家級,運維架構(gòu)設(shè)計/優(yōu)化,具備綜合考慮成本、效率和水平的能力
d、有團隊,超前規(guī)劃
2、初學(xué)者如何系統(tǒng)學(xué)習(xí)運維知識
一、學(xué)習(xí)和掌握Linux系統(tǒng):
1、Linux基礎(chǔ)知識、基礎(chǔ)命令(cp、ls、file、rm、cat、ps等操作命令)
2、Linux 用戶和權(quán)限基礎(chǔ)知識
3、Linux系統(tǒng)進程管理
4、文本編輯命令(vim、grep、sed、find等)
5、shell 腳本
學(xué)習(xí)完以上Linux知識后,進一步了解相關(guān)知識,
1、TCP/IP 網(wǎng)絡(luò)基礎(chǔ)
2、Linux企業(yè)常用服務(wù)(如dns、http、ftp、mail、nfs等)
3、企業(yè)級安全原則和防范技能(系統(tǒng)性能監(jiān)控、安全威脅模型和解決方案)
4、 加解密原理及數(shù)據(jù)安全、系統(tǒng)服務(wù)訪問控制
5、安全策略構(gòu)建
6、高級shell腳本(主要是結(jié)合一些應(yīng)用,寫一些案例)
7、應(yīng)用php、mysql搭建CMS或個人網(wǎng)站系統(tǒng)
如:
至此,你基本可以成為入門級的運維工程師了。
3、云時代的運維
隨著云計算時代的到來,業(yè)內(nèi)流傳著一個廣為流傳的“觀點”:云計算將淘汰傳統(tǒng)運維。
那么我們來討論第二個話題,什么是云計算運維,運維工程師如何在云計算時代保持自己的專業(yè)競爭力。
云時代,運維工作發(fā)生了深刻變化。傳統(tǒng)運維需要處理服務(wù)器、網(wǎng)絡(luò)、存儲等硬件設(shè)備。在云時代,不需要去碰硬件設(shè)備,而是去處理虛擬資源(其實虛擬化就是云平臺的核心支撐技術(shù),軟件定義計算,軟件定義存儲,軟件定義網(wǎng)絡(luò))。云平臺廠商提供的負載均衡、動態(tài)伸縮、數(shù)據(jù)遷移等服務(wù)降低了運維的復(fù)雜度,在一定程度上降低了運維的門檻。
云計算時代的運維,通過人工智能、大數(shù)據(jù)等技術(shù),將節(jié)省更多的人力物力成本,減輕運維人員的壓力。
但是,云時代的運維也將出現(xiàn)新的挑戰(zhàn):
1、工程師不再直接操作物理資源,而是面對一堆API(云平臺提供),更難發(fā)現(xiàn)問題。有編程經(jīng)驗的同學(xué)都知道,世界上沒有完美的系統(tǒng)。
2、大型系統(tǒng)所涉及的資源(包括可橫向擴展的彈性計算服務(wù)、PaaS平臺提供的第三方服務(wù)、負載均衡、數(shù)據(jù)同步等)大大擴展,資源的增長帶來關(guān)于管理復(fù)雜性的急劇增加
3、云產(chǎn)品本身的版本升級增加了系統(tǒng)運行的不穩(wěn)定性
4、云平臺和云產(chǎn)品的按需特性帶來了控制成本的需求,即如果可能,運維團隊應(yīng)該考慮是否可以減少云資源的使用來控制成本,以及這種“縮水”無疑會給運維工作帶來一定的風(fēng)險。