像素只有210*120,不算特別清晰,但看清面部特征,還是沒什么問題的。
其中,同班級里重名的情況,都在姓名后標記著數字1、2……
江寒猜想,這可能是輸入報名表的順序。
接下來要做的,就是在臨時文件1里,找到每張照片對應的人。
這很簡單,照片的文件名就是姓名,輕松就能和表格里的名字對上。
在解決了數量不算很多的同班重名問題后,就生成了一個照片索引,將每一張照片和報名序號一一對應上了。
然后,是判斷性別,填入新《報名信息表》對應的單元格里。
這一步,按照高老師的想法,就是一個笨功夫,用眼睛去看,然后一個一個敲進去。
這十分麻煩,而且太沒效率。
江寒希望能找個輕巧的辦法,能更快、更好的完成這一步。
那么,這樣的辦法真的有嗎?
是的。
江寒畢竟搞過機器學習,編程思維有點不一樣。
高老師那樣的普通程序員,也能做到剛才那些步驟。
但江寒接下來的操作,就是他的思維盲區了。
機器學習里,有多種算法,都可以輔助完成這樣的任務。
其中江寒最擅長的,自然是人工神經網絡。
人工神經網絡也分為好多種類。
比如,也就是卷積神經網絡,是最擅長圖形識別的;
而RNN,也就是循環神經網絡,比較適合語音識別、自然語言理解……
如果采用人工神經網絡,哪怕不出動,只用多層神經網絡,也就是所謂的“深度學習”,也可以非常完美地解決這個問題。
但江寒琢磨了一下,還是放棄了這個想法。
一旦泄露出去,他很可能會有麻煩。
因為這些技術的來源,他根本沒法解釋。
技術跨度太大了。
好吧,安全第一,先用“感知機”湊合一下。
哪怕準確率低點,也無所謂了。
江寒現在唯一可以拿出來的,就是“單層感知機”。
這種技術只能解決二分類問題,并且還要求線性可分。
好在當前所面臨的問題,這兩個要求正好都符合。
江寒重生前,做過一個實驗,用“單層感知機”識別手寫數字,應用場景與現在差不多。
效果也還過得去。
所以,看照片識別男女的任務,完全可以使用“單層感知機”解決。
說起來,這可能是神經網絡技術,在這個世界的第一次實戰?
江寒前幾天寫的論文里,就有“單層感知機”的代碼,稍微改動了一下,就能用上了。
研究機器學習,首選語言是Python,語法簡單,開發效率高,不容易出錯,也不用關心底層如何實現。
不過,這篇論文的代碼,實在太簡單,用什么都一樣。
所以,江寒使用了最熟悉的C++。
代碼略……
(PS:絕對不是空白太小寫不下。)