聽到秦毅安慰的話,王正陽微微苦笑。
能夠進入星河科技研究院,他的工資待遇非常不錯,富足的小康生活是完全沒有任何的問題,生活上沒有什么煩惱的事情。
可是這工作上面,研究這漢語編程和漢語操作系統,長期沒有什么進展之下,整個人都變的非常的煩躁,一度甚至都想要辭職不干了。
“跟我說說,這漢語編程和漢語操作系統方面到底有那些問題?”
秦毅笑了笑,其實漢語編程和漢語操作系統的研究方面,秦毅多少也是知道一些的,并且自己也是去認真的學習和研究過。
在科技塔之中,秦毅也是仔細的研究了宇宙之中諸多文明的語言和文字,找到了很多和漢語差不多的語言,仔細的研究他們的計算機操作系統和編程系統。
而科技塔作為高級文明的作品,對于不懂語言和文字之間的系統、編程之類的也是有詳細的說明,各種各樣的文字該如何去出發,如何去理清思路都有一個指引。
這一次過來,秦毅也是打算將這些思路和方法傳授給大家,不然,等虛擬機都研究出來了,這漢語操作系統和漢語編程系統都未必已經研究出來。
“從哪里說起好呢~”
王正陽帶著秦毅來到了研究所里面,來到一間會議室當中,會議室里面坐滿了研究所的研究漢語編程和漢語操作系統的人。
王正陽仔細的整理了一番自己的語言,想了想說道:“先從語言說起吧,漢語相比起英語來,有很多優勢。”
“漢語文字精煉,言簡意賅,冗余度低,以最少的符號表達最豐富的含義,我們從信息學的角度予以闡述,漢字、西文字母作為語言文字的最基本單位,用以構成詞匯、句子,傳達一定的信息,是信息的載體,如何對每一個漢字、字母所負載的信息進行度量?”
“現代信息學用熵來衡量平均信息量,熵表示指定符號出現的不肯定性。西文字母采用的拼音文字字母有30個左右,漢語以方塊字為書寫單位,數目成千上萬,顯然其隨機出現的不肯定程度比西文字母的不肯定程度要大得多,從這一角度講每個漢字載荷的信息量遠遠大于一個字母的信息載荷量。”
“我們經過統計計算,得出法語字母的零階熵值為3.98比特,意大利字母零階熵值為4.00比特,西班牙字母零階熵值為4.01比特,英語字母的零階熵值為4.03比特,德語4.10比特,羅馬尼亞語為4.12比特,俄語為4.35比特。”
“英語詞的零階熵為10.0比特,漢語詞的零階熵為11.46比特,這表明漢語的詞義也比英語豐富。”
王正陽一邊說,旁邊有人開始打開投影儀,播放出他們對漢語和英語差異方面的研究成果。
“因為我們的漢語太過言簡意賅,一個字、一個詞表達的意思太豐富了,同樣的一個字一個詞在不同的場合下,語氣下,意思就完全不一樣。”
“因而由漢字組成的句,它的意思就更加的豐富,往往非常簡單的一句話,它卻是擁有多個意思。”
“比如能穿多少是多少?”