2011年8月15日,路舟筆記——《不得已而為之》:
這是一個非常困難的決定,但一如曾前,我不得不去按下這個按鈕。
在去年這個時候,微訊和夢谷云的規模還沒有達到這么大,嚴格意義上,當時只有夢谷廣告的業務是進入了商用階段。周文負責了當時整個夢谷廣告的數據處理,而這個成為了夢谷云后來做D+的原型。
當然,往后的發展中,連夢谷廣告都將相關的業務數據處理遷移到了夢谷云的D+。
一切順利運轉。夢谷廣告為此招收了一批數據崗的員工,內部稱是數據工程師。他們通過D+所提供的可視化圖形或者數據接口來處理數據。這應該稱作是經驗學,它仰賴于工程師的經驗學識。
在微訊的起步中,程旭元并沒有過度考慮這中間的問題。事實證明,這是一種明智的選擇,在企鵝的夾擊下,我想將產品推進迭代是比優化數據的優先級更高。今年春節之前,當數據的處理提上了微訊的議程,一切卻變得近乎失控。
很明顯,即使微訊再招收上千名數據工程師,也永遠無法將數據處理完成。因為隨著數據量呈指數級增長,待處理的數據量就始終維持在了90%以上。人力終究有限,而數據卻無窮極。
所以,人工智能是必然。它可以取代更多人力。
將整個事情抽離些概念,我想,不外乎有三:數據、算法、算力。即使不去談論人工智能,我想,也同樣需要面對這三個問題。
數據正在不斷膨脹,無論微訊抑或其他公司。其體量之龐大,已經大到我有些難以想象。而它每天仍然在大量產生,不斷消耗著夢谷云購置的存儲硬件。
算法大部分在上世紀就已經出現,我們所做是在重新構建和工程化。這是七星的臥龍、微訊以及夢谷云在共同探討的問題。
算力,計算的能力。在演進的路途上,它也同樣到了不得不考慮的地步。通用型計算的cpu在這個領域注定是比較差的選擇。一如我在比特幣社區看到有人探討FPGA礦機一樣,對于人工智能和公司內的數據處理,我想也是需要更高層次的硬件,比如FPGA和ASIC。
硬件的演進上,人工智能和區塊鏈在這里有些微妙的相似。當然,關聯性沒想象中那么大。或是我還難以遠望到?也許吧。
梳理到這里,接下來的論述也不會太困難。我將之分成了數個層次:應用平臺、算法實現、框架接口和硬件。
硬件機器是構成算力的總要組成部分,是物理基礎;框架接口實現硬件和軟件之間的通道,將與硬件溝通的接口暴露給上層使用;算法則是在已有的理論基礎上實現,可能我們會嘗試做圖形、語音和文字等的基礎識別;應用平臺,這里就應指夢谷云,它將整個底下三層的東西進行封裝,為開發者提供計算能力。
如果說云計算是將計算能力虛擬成流,用戶打開開關即可獲得計算流,那么,對人工智能而言,我相信也是如此,它也可以理解為云的一個新的拓展。
用戶打開開關,即可利用人工智能,而無需考慮硬件、接口、算法,就像云一樣,即插即用。我想,這是個不錯的愿景。
至于插上去做什么?
我想,應是由你決定的事情。
......
小葉子:已閱,不懂。請指教~