了解最新公司動態(tài)及行業(yè)資訊
云運維上線一年半,企業(yè)用戶已突破1400家。 為了更好的協(xié)助客戶實現(xiàn)系統(tǒng)穩(wěn)定高效的使用,我們對云運維報表的布局和功能進行了優(yōu)化升級。 本次更新主要有以下三個亮點:
1.報表模塊化分頁展示
2. 新的 BI 報表
3.內(nèi)存負載評分功能上線
1 內(nèi)容豐富分頁展示,條理更清晰
隨著云運維功能的不斷縮減,報表內(nèi)容越來越豐富多彩,讓數(shù)據(jù)分析更加全面,但也帶來了結(jié)構(gòu)不清晰、關(guān)鍵數(shù)據(jù)難以查找等問題。
熟悉云運維的用戶都知道,云運維的目的還是為了系統(tǒng)的穩(wěn)定和高效,所以要達到這樣的效果,雖然分為兩個層面來重點優(yōu)化:
1.服務(wù)器級別-穩(wěn)定
指的是我們使用的服務(wù)器(硬件服務(wù)器或者云服務(wù)器)和支持應(yīng)用運行的服務(wù)器容器(比如,等等)。那些是保證我們的應(yīng)用能夠支持用戶的基礎(chǔ),所以從角度運維方面,我們需要關(guān)注以下兩個方向的數(shù)據(jù)
服務(wù)器運行方向:訪問狀態(tài)(次數(shù)、人數(shù))、內(nèi)存峰值、CPU使用率峰值、輔助系統(tǒng)管理的一些數(shù)據(jù)(化機內(nèi)存、jdk版本、操作系統(tǒng)、處理器架構(gòu)等)
用戶體驗方向:宕機、卡頓
服務(wù)器級別的數(shù)據(jù)是整個報表的第一頁(概覽)。 說白了就是可以反映出我們的系統(tǒng)是否能夠正常流暢的使用。
2、應(yīng)用層面——高效
是指安裝部署在服務(wù)器上的具體應(yīng)用項目(如報表項目、BI項目),是系統(tǒng)用戶直接與系統(tǒng)交互,進行數(shù)據(jù)錄入/采集/分析/價值挖掘等操作的窗口,所以從運維的角度,我們需要關(guān)注以下兩個方向的數(shù)據(jù)
使用效率方向:各統(tǒng)計單元的延時狀態(tài)(模板/儀表盤、數(shù)據(jù)連接、數(shù)據(jù)集等)
使用頻率方向:模板訪問量(次數(shù)/人數(shù))、日訪問量/趨勢
應(yīng)用層面的數(shù)據(jù)是整個報表的第二頁和第三頁(報表工程分析、BI工程分析),分別從系統(tǒng)可用性的理論指標(biāo)和實際數(shù)據(jù)來判斷。
結(jié)合以上兩個層面下的所有方向,在保證系統(tǒng)正常穩(wěn)定使用的基礎(chǔ)上,進一步考慮系統(tǒng)用的多,用的好不好,讓系統(tǒng)真正穩(wěn)定高效.
2 全新BI報表,運維分析更專業(yè)
由于兩款產(chǎn)品的定位不同,運維層面的數(shù)據(jù)雖然很多,但很難統(tǒng)一判斷和分析。 如果想對系統(tǒng)使用情況有更準(zhǔn)確的控制,可以根據(jù)兩款產(chǎn)品的不同特點進行精細化分析。 方為上策。
雖然云從今年開始就有了這個想法,但在明年上半年持續(xù)的用戶考察和功能反饋中,貴方對BI云運維報表的需求也驗證了這個方向的正確性和必要性。 現(xiàn)在跟著云運維報表的BI云運維報表整體布局終于和大家見面啦~
1、判斷用多了好不好的方法
報表工程更適合中國式的復(fù)雜報表。 在企業(yè)中,信息部門/IT部門的專業(yè)人員往往會在收集業(yè)務(wù)人員的需求后開發(fā)報表。
判斷這種報表用的多不多,更看重的是業(yè)務(wù)人員訪問報表的頻率和人數(shù)
判斷用的好不好,更多的是關(guān)注業(yè)務(wù)人員在訪問那些報表時所需要的各個環(huán)節(jié)的時長(SQL時長,報表預(yù)估時長等)的后臺展示
作為一款簡單易用的自助式大數(shù)據(jù)分析工具,在應(yīng)用上,有別于IT連接需求的開放報表模式。 定位為業(yè)務(wù)用戶或數(shù)據(jù)分析師,根據(jù)數(shù)據(jù)需求做探索性分析,判斷這個儀表盤的性能。 Usage,在訪問維度的基礎(chǔ)上,我們額外縮減了編輯情況的觀察維度,包括三類數(shù)據(jù):編輯用戶數(shù)、平均每日編輯次數(shù)、編輯時長。
從編輯的用戶數(shù)中,我們不僅可以直觀的看到用于分析的用戶總數(shù)和每日用戶數(shù)的變化,還可以分析企業(yè)自助分析模式和業(yè)務(wù)用戶數(shù)據(jù)的實現(xiàn)水平更深層次的分析能力。 企業(yè)的實力,企業(yè)內(nèi)具有數(shù)據(jù)分析能力的人才儲備等。
從日均編輯次數(shù)可以得到業(yè)務(wù)用戶用于數(shù)據(jù)分析的平均日編輯次數(shù),相當(dāng)于在自助分析模式下為業(yè)務(wù)用戶解決了每日臨時分析問題的次數(shù)。 結(jié)合編輯儀表盤/數(shù)據(jù)集的時長,綜合對比使用excel進行分析或IT幫助業(yè)務(wù)開發(fā)報表模式,從而驗證自助分析模式對企業(yè)的價值,是否達到了以下效果:降低成本,提高效率。
分析實例:西洋雙陸棋過去只有一個IT部門為每個業(yè)務(wù)部門處理數(shù)據(jù),現(xiàn)在通過BI平臺,將分析應(yīng)用數(shù)據(jù)的部門擴大到近10個,擁有30+編輯用戶,培養(yǎng)潛力企業(yè)數(shù)據(jù)分析人才,業(yè)務(wù)部門模板平均每月編輯300次以上,平均每晚編輯10次以上,意味著業(yè)務(wù)每晚自行解決10個以上的眼前問題。
另外,從訪問的角度,包括訪問用戶數(shù)和訪問次數(shù),可以估算每個用戶對模板的平均訪問次數(shù),這不僅可以反映用戶對數(shù)據(jù)分析結(jié)果的依賴程度,而且也體現(xiàn)了自助分析下的業(yè)務(wù)。 用戶自己開發(fā)的模板的價值,即平均訪問次數(shù)越高,表明用戶對數(shù)據(jù)分析結(jié)果的依賴程度越高,單個模板的分析價值越高,依賴的可能性就越大根據(jù)數(shù)據(jù)做出決策。
2、用的多不多,好不好的統(tǒng)計細度
對于直接用戶,在整個使用過程中只接觸到(cpt或frm),不需要其他任何東西。 所以這部分用戶體驗的重點是問題模板,訪問頻率高,時間長的模板是運維人員優(yōu)化的重點。
但是對于用戶來說,理清了數(shù)據(jù)和關(guān)系之后,使用過程涉及到的不僅僅是儀表盤,還有數(shù)據(jù)集的制作(尤其是自助數(shù)據(jù)集),所以關(guān)注的范圍不僅僅是問題儀表盤,而是還有問題數(shù)據(jù)集,經(jīng)常能及時發(fā)現(xiàn)一些由于誤操作(比如在兩個大數(shù)據(jù)規(guī)模之間合并合并)導(dǎo)致的問題數(shù)據(jù)集,并進行優(yōu)化,對性能的提升可能不亞于甚至超過問題儀表盤的提升。
3內(nèi)存負載評分,詳細分析每次卡頓
卡頓表現(xiàn)為在感知比較顯著的時候系統(tǒng)沒有反應(yīng),無法交互。 一般一段時間后可以手動恢復(fù)正常。 但是頻繁卡頓會給用戶帶來很差的體驗,所以卡頓問題應(yīng)該解決。 同樣關(guān)注系統(tǒng)停機時間。
1、為什么不關(guān)注卡頓?
數(shù)量多,人力少,系統(tǒng)掛起時間長
如今,我們通常會遇到停機問題。 比較有效的方法是在重啟前導(dǎo)入系統(tǒng)的dump文件分析定位。 理論上也可以應(yīng)用于凍結(jié)問題的處理。 但是相對于宕機,卡頓的頻率要高很多,系統(tǒng)運維人員沒有足夠的精力對所有卡頓做如此詳細的排查。 退一步說服務(wù)器運維,我們不缺錢,所以需要招更多的人來看,所以還是有一個問題——dump 期間系統(tǒng)不可用服務(wù)器運維,即使人手跟得上,影響系統(tǒng)不可用性的影響超過了滯后的影響得不償失。
支持深度分析的數(shù)據(jù)很少
遇到卡住的問題,你的第一反應(yīng)是什么? “網(wǎng)絡(luò)不好”絕對是最佳答案。
不排除確實有一定比例的情況是因為網(wǎng)絡(luò)環(huán)境的影響導(dǎo)致后端加載卡住,但是顯然這樣一個非人為可控的原因會隱藏很多問題,而網(wǎng)絡(luò)有太多的責(zé)備。 那為什么傳統(tǒng)的卡頓分析還停留在網(wǎng)絡(luò)環(huán)境、前端加載等淺層分析上呢? 由于缺乏數(shù)據(jù)支持深入分析,問題又回到了之前導(dǎo)入dump的矛盾。
卡頓體驗標(biāo)準(zhǔn)不統(tǒng)一
上面說的“卡頓表現(xiàn)是在感知比較顯著的時候系統(tǒng)沒有響應(yīng),無法交互”,雖然這個定義也有點模糊,但是“感知比較顯著”的感知成分比較多. 同樣的接入需求,新入職的小白可能認為加載20秒內(nèi)可以接受,但公司領(lǐng)導(dǎo)可能等了10多秒才想和信息部談。 再加上系統(tǒng)的硬件條件不同……干擾原因太多,導(dǎo)致系統(tǒng)操作人員難以準(zhǔn)確判斷很多卡頓的嚴(yán)重程度,而優(yōu)先級的缺失讓高效處理變得更加困難。
2.如何通過內(nèi)存負載評分解決以上問題
分析過程完全手動且免費
依托于云運維強大的數(shù)據(jù)分析處理能力,顯存的復(fù)雜評分功能是根據(jù)GC日志手動關(guān)聯(lián)模板的執(zhí)行狀態(tài)。 全程云端運維分析,無需人工輸入,不影響系統(tǒng)正常使用
豐富的數(shù)據(jù)支持深度分析
以當(dāng)前系統(tǒng)顯存使用情況,輔以推廣數(shù)據(jù),綜合考察系統(tǒng)顯存負載,但jvm顯存、cpu使用率、存活會話數(shù)、系統(tǒng)在線用戶數(shù)、加載模板等。鏈接起來,為后續(xù)分析優(yōu)化提供方向
求“同”存“異”,力求判斷準(zhǔn)確
在同一個報表系統(tǒng)中,使用該時間點的各個系統(tǒng)參數(shù)對卡點進行打分,防止人為激勵影響判斷的準(zhǔn)確性; 不同系統(tǒng)根據(jù)自身硬件配置和實時顯存情況確定評分標(biāo)準(zhǔn),具體系統(tǒng)具體分析,避免系統(tǒng)差異。 判斷無聊和不合理的標(biāo)準(zhǔn)
比如目前主流的軟件——小到補報、查詢、部署、集成,大到可視化大屏、駕駛艙,功能強大。 最重要的是,得益于這個工具,整個公司的數(shù)據(jù)結(jié)構(gòu)可以出現(xiàn)標(biāo)準(zhǔn)化,下一步就是為企業(yè)建立一個大數(shù)據(jù)平臺。 而且,它是用java編寫的,支持二次開發(fā),是一個類Excel的設(shè)計器。 無論是IT還是業(yè)務(wù),都非常容易上手:編輯sql優(yōu)化、數(shù)據(jù)集復(fù)用簡直就是小case,大大提高了報表開發(fā)的門檻。 . 在企業(yè)最關(guān)心的數(shù)據(jù)安全方面,支持多人同時開發(fā)同一套報表,通過模板鎖定功能避免編輯沖突; 通過數(shù)據(jù)分析和權(quán)限控制,保證數(shù)據(jù)安全。