陳默的聲音通過麥克風傳遍整個大會議廳。
大屏幕切換成2ms系統界面,密密麻麻的案例標題瀑布般滾動,“現在這里躺著4760個實戰案例,光是跨國故障處置就有542例。”
林雨晴悄悄調暗燈光。
陰影中,陳默照得棱角分明:“我一直強調運維不是救火隊,而是要把每一次故障處理變成可復制的經驗,要把這些經驗變成能傳承的武器。現在,舞臺交給你們。”
第一個上臺的是erp財務領域支持部的張偉,作為主管的他算是給開了個好頭。
他分享的案例是“德國子公司年終結賬系統崩潰應急處理”。
屏幕上彈出的是2015年12月31日的監控截圖,密密麻麻都是紅色報警點。
“當時德國時間23:00,正是他們的財年結賬高峰期。”張偉推了推眼鏡,“我們發現erp系統的物料憑證過賬模塊卡住了,初步排查是多時區數據同步導致的鎖表。但德國同事堅持說本地運維已經做過三次重啟,問題依舊。”
臺下傳來輕微的議論聲。
張福全在筆記本上畫了個問號,胡笳則在手機上快速調出德國時區的運維手冊。
“重點不是技術排查。”張偉點擊下一張ppt,“而是跨國協作中的信息不對稱。我們讓德國同事錄制了操作視頻,發現他們在調用中國服務器的物料主數據時,沒有啟用時區轉換函數。這不是技術故障,是流程漏洞。”
他展示了優化后的跨時區數據同步流程圖,右下角標注著“已錄入全球運維知識庫,避免12個國家子公司出現同類問題”。
當張偉提到通過調整api調用邏輯,將該模塊結賬時間從時壓縮到2小時時,后排的年輕工程師們紛紛拍照記錄。
第二個案例來自oa支持部的李媛,就是前段時間被胡卻敢搞得心力交瘁已經想離職的那頭快牛。
他分享的是“流程引擎邏輯漏洞修復”。
投影幕布上是oa系統的審批流界面,紅色箭頭標出了兩個部門同時申請會議室時的隨機分配邏輯。
“這不是簡單的系統漏洞。”李媛的ppt背景是他親手畫的流程圖,“當研發部的技術評審會和行政部的例會同時申請a215會議室,系統隨機分配導致研發會議被迫改期,直接影響了產品上線進度。”
她調出林雨晴當初提出的三維評分模型:參與人數、跨部門數量、議題等級,詳細講解如何通過權重系數讓關鍵會議優先審批。
當屏幕上出現優化后三個月的會議室沖突次數從47次降至2時,胡笳抬頭看了眼坐在角落的林雨晴,后者正對著筆記本電腦記錄,嘴角微微上揚。
作為這次大會組織人的林雨晴也很開心,這個案例她就是提需求的“用戶”。
眼瞅著系統按照自己的想法優化以后效果很好,對她來說是一件很有成就感的事。
第三個上場的是數據庫支持部的劉洋,他的案例帶著一絲驚險:“今年3月,oracle數據庫第三節點突然出現大量閂鎖爭用,導致訂單系統卡頓。我們遠程連接后發現,是新上線的促銷活動導致用戶畫像更新事務激增,b+樹索引在熱點數據區引發閂鎖風暴。”
劉洋展示了當時的awr報告,紅色預警的閂鎖等待事件讓人觸目驚心。
“我們沒有立即重建索引,而是用了張福全經理在2014年分享過的哈希分片方案。”他看向第一排,張福全笑著對她比了個大拇哥,“結合公司高斯數據庫的內存優化表,最終將停機時間控制在8分鐘。”
階梯教室里響起掌聲,徐雙龍在筆記本上記下“哈希分片復用2014年案例”。
劉洋的ppt最后一頁是對比數據:優化后數據庫吞吐量提升40%,服務器資源節省30%,右下角附著她編寫的《高并發場景索引優化手冊》鏈接。
接下來的三個小時里,來自不同部門的分享人輪流上臺。
有的展示如何通過自動化腳本將服務器部署時間從2小時縮短到15分鐘;