二十來分鐘后,大家鍛煉完畢,回寢室稍作整頓,盥洗一番之后,就去了食堂。
由于早起運動的關系,每個人都多吃了一個饅頭,精神頭也好了不少。
飯后溜達了一會兒,幾個人就結伴回班,上早讀。
江寒端正地坐在座位上,拿出一個嶄新的筆記本,開始寫論文的第一稿。
先寫下標題:《感知機:大腦信息存儲和組織的概率模型》。
然后是摘要:“本文探討了生物神經元的工作機制,并建立了一個簡單的數學模型,以及探索了如何在機器學習中運用這個模型……通過對生物神經元的模擬,來解決線性可分的二分類問題。”
寫完摘要后,又設了幾個關鍵字,接下來就進入了正文。
第一部分是背景介紹,主要討論生物神經元。
“要了解智能對知覺識別,泛化,回憶和思考的能力,首先我們要回答三個問題:生物系統如何感知或檢測物理世界的信息?以什么形式存儲或記住信息?存儲或記憶中的信息如何影響識別和行為?
第一個問題屬于感官生理學領域,而且人們對它已經有了可觀的認識。第二和第三個問題,目前仍然只有大量的猜測,而且神經生理學提供的一些相關事實,還沒有被整合成為一個可以被人們接受的理論……”
開宗明義之后,接下來,就可以詳細討論生物神經元的工作機制了。
足足用了兩千來字,才寫完這些羅里吧嗦的東西,最后下了結論。
“綜上所述,不管什么信息被保留,都必須以某種方式,存儲為特定響應的偏好,即信息包含在連接或關聯中!”
接下來,進入下一環節,建立數學模型。
對于很多人來說,這是論文寫作之中,最為困難的地方。
就算拿出“感知機”這種大殺器,江寒也并不擔心,會被人懷疑是重生者。
除非屢見不鮮,否則誰會一碰到厲害的人,就懷疑是穿越、重生來的?
網上關于劉秀和王莽的段子,只是調侃和玩笑罷了。
但江寒仍然決定,將數學部分精簡一下,盡量不涉及太高深的東西。
很多高等數學的東西,大學生學起來都挺費勁,自己一個普通高中生,憑啥能熟練運用?
除非能證明自己,的確是個不世出的天才,不然很難解釋。
如果得到足夠的學術點,將七維屬性都加到10以上,那自己不想當天才都不可能。
可現在是起步階段,還是穩一點的好。
“感知機”的工作邏輯很簡單,本來也不是什么復雜的東西,只是表述上要稍微嚴謹一點。
前世刷過的那篇同名論文,大部分內容都是枯燥的論述,數學推導并不多,關于如何在計算機上實現,則基本沒怎么講。
這也不怪原作者,那個年代的計算機科學,本來就不怎么發達。
而且那篇論文的精華,也就是一個模型,一個原理。
至于編程實現,有了模型之后,那還不是Soeasy嗎?
但現在是2012年,計算機技術已經取得了長足進步,足夠將機器學習技術,運用于生產生活實踐了。
所以,江寒將這篇論文的重點,放在了原理解析,以及如何實現上。
除了開頭第一段,江寒并沒有照抄原文,事實上,他也沒那個本事。
那么長的論文,能記住大概思路,就相當不錯了。
一個字不差背下來?江寒做不到啊!
根據自己對該技術的理解,江寒開始自由發揮。
先從最簡單的情況,也就是單變量開始討論。
“對于只含有1個輸入信號xi的樣本集T,我們期望找到一個線性函數y=wx+b,通過輸入的數據xi和標簽yi,確定其中的權重w和偏置b,其中權重w控制輸入信號的重要性,而偏置b可調整神經元被激活的難易程度……”