寧為也想說點什么。
卻突然發現他還沒微博號,好在申請挺方便,然后實名注冊。
成功后,看著話題的內容他一時間也不知道該說些什么好,雖然滿懷感激,但這一刻思路卻卡殼了。
空有學霸的大腦此時竟然想不出應景的文字,苦惱。
此時電話突然亮起,跟著響了起來。
來自京城的號碼,寧為想了想,接了起來。
“喂,請問您是江大數學與統計學院的寧為同學嗎?”
“哦,我是,請問您是哪位?”
“哦,寧為大神您好,我姓潘,是新浪微博的工作人員,我們在后臺看到您剛剛申請了微博,請問需要我們幫您做一個官方的實名認證嗎?經過認證之后,就能在您的微博上顯示出您官方認證的身份,也能避免有人冒充您的身份混淆視聽。”
“麻煩嗎?”
“不麻煩的,最多耽誤五分鐘,我引導您提交一些資料就行。”
“那行吧。”
……
十分鐘后,寧為看著認證過后的微博,終于想好了措辭。
“我是寧為,剛看到整件事情,感謝大家的信任與支持。想說點什么,又不知道說什么好!那就給大家拜個早年吧!祝大家新的一年快樂能單調遞增,煩惱是高階無窮,好運連續且可導,理想一定洛必達!”
沒去試圖解釋什么。
因為寧為發現根本沒有必要,所有基于邏輯跟理性的判斷,大家已經都幫他說了,再去解釋自己沒說那些話,有些畫蛇添足了。
而且紀子珩那條最新聲明已經論述了事情的前因后果,他在說一遍也沒了什么意義。
就這樣,挺好的!
做完這些,他便關了微博,長出了口氣,開始下載今天實驗室最新上傳的實驗數據,繼續做各種記錄跟比對,心情放松之下突然來了靈感,開始將所有異常數據歸類,然后按照今天靈感爆棚時想到的一種數學方法進行堆棧。
很快,寧為似乎從這些紛雜的數據中找到了規律。
終于他在無數紛雜的數據中找到了一個個異常值,再次歸類,寧為發現所有這些找出的異常數據在一定情況下,滿足正態分布特點。
這次終于有眉目了。
對比數據的特點,寧為終于發現所有發生錯誤的數據同時指向算法回歸部分的一個問題。
湍流算法在讀取異常數據流的時候需要經過多層判定,并對初篩出的疑似爬蟲或惡意連接信號做出一個預標記,并導入自己的數據庫,進行下階段的數據比對。
比如最淺層的對不合規瀏覽器頭,或者包含了爬蟲信息的瀏覽器頭的判定,以及對某類IP一定時間內訪問次數的判定等……
而在數以億次的處理正常連接請求之后,記錄下當數據對流時產生的數據特征,再跟數據庫內異常數據進行比對,嘗試放入,再比對,發出驗證碼,再比對,這一過程中,最后反饋給算法的是數據流的異常特征碼,對符合異常特征碼的信號進行標記,而不是標記具體的IP。
問題就出在這里,在某次次遞歸過程中,極少數正常的請求在比對并自動記錄特征碼的過程中,反饋時出了異常,這就導致同一類特性的數據全部被系統錯誤判定。
這個時候就體現出文檔做得足夠細致帶來的好處了。