“樣本是足夠的,所以基本可以確定,以漢字撰寫的文獻,在2萬字篇幅下,不重復的獨立單字平均1200個。
“這和隕石文明的2000個不重復獨立單字,有一些差距。不過差距不到兩倍,這個差距在外星文字的研究上,其實并不大。
“因此,從出現的獨立單字數量來看,隕石文明所使用的文字,和漢字有相似的特征。
“可以初步確定,隕石文明的文字庫,應該比漢字大,他們常用的文字數量也比漢字多。
“根據這些文字特征,進行破譯,會簡單很多。”
方源思索片刻后問道:“要多久才能破譯出這些信息的含義?”
“這個還無法確定,由于沒有一個基礎點,要用窮舉法進行破譯,難度很大。而且,更困難的是,即便是窮舉法,也沒有一個標準答案,即便破譯出了結果,也無法確定破譯的結果是否正確,這才是最困難的地方。”郎同光解釋道。
“沒有更好的辦法了嗎?”方源覺得軍科院的技術手段,應該不至于此。
“辦法當然是有的,可以通過猜測,先確定一部分文字……”
郎同光接著解釋:“比如,通過分析,我們已經基本可以確定,隕石文明是所有的文字,和漢字有很多特征相似。
“那么,我們就可以更進一步猜測。隕石文明所留的文獻里面,重復最多的字代表什么含義?
“比如漢字文獻里面,重復最多的字,一般是‘的’字,第二的是‘是’字。
“那么,我們就可以繼續猜測,隕石文明的文字里面,是不是也有‘的’這樣的字。
“如果有,重復最多的那個字,是不是就是‘的’,或者是含義相近的字。
“當然這只是猜測,因為漢語中的‘的’是個助詞,本身沒有含義。
“我們還不能確定隕石文明的語言中,也有這樣的無意義助詞。
“所以,這個猜測的過程需要進行驗證,才能確定是否正確。”
魯修文接過話頭道:“確實,對于外星文字的研究,難度確實比較大。它還不像甲骨文,甲骨文還能通過文字的形狀猜測其含義。
“現在擺在我們面前的是一串沒有含義的編碼,要通過編碼的特征猜測文字的含義,難度確實大。”
方源一邊思考一邊點頭道:“確實,不過,也可以先猜測一下隕石文明有可能留下什么信息,再和進行編碼破譯。
“比如,隕石文明在毀滅時,最想要留下的信息,開篇應該先介紹他們的文明。然后應該還會講述文明滅亡的原因,是被高等文明毀滅的?還是在宇宙天災中毀滅的。
“先對信息的內容進行推測,再進行文字破譯,應該會容易一些吧?”
郎同光點頭贊同道:“這個思路是對的,不過還是需要超級計算機來進行破譯,人類的大腦優勢是想象力,但在計算力上,還是計算機更有優勢。”
“應該不用太長時間,一兩個星期,應該就能得出結果。”魯修文說道。