漢字編程其實并不簡單。
縱觀無數的網絡小說中,很多的作者都是一開始就寫漢字編程。
愛國是一回事兒,但是,也要考慮現實的問題。
專業的編程程序員就說過,漢字編程,就目前來說,很難,非常難。
不管是算法還是開發環境,都需要很長一段的路要走。
限制漢字編程語言發展的,不僅僅是漢字本身的繁雜,還有漢語的不同音,不同意的巨大語言環境。
就比如說臥槽這兩個字,算上輕音一共二十五個變化,就是二十五個不同的意思。
所以,沒有龐大的計算力和智能計算環境,就算你有十八臺超級計算機,那也不行。
傳統的計算機,僅僅只有兩個字符,0和1。
剛剛誕生的量子計算機中,如賈維斯所說,是三十六個個字符,二十六個英文字母加上十個阿拉伯數字,分別賦予不同的值。
其實,單純用二十六個也行,但是,本來就是用來做龐大運算的賈維斯,將英文字母組成單詞,再轉化為阿拉伯數字導出,這個過程,都能完成幾千億個圓周率的計算了。
相比于傳統計算機的笨拙,量子計算機的
計算速度是非常快的,相對于的,計算精度和計算力也不是傳統計算機能夠比的。
所以,使用更加直接的東西,會比一點點的去轉換,要方便的多。
光量子的波段加上量子核心的精確識別能力,就算是細微的差異,也能將之體現出來。
而漢子,又可以精準的做到這一點。
通過賈維斯智能分配,就可以將相近波段里面的光量子賦值成為多音字,簡繁體字。
每一個字的不同音,賦予其更加相近的光量子,計算速度,也會大大的提升。
當然了,在具體的設置中,要是檢測到造成歧義的可能性會很大,那就將之拉的更開,說不準造成閾值近了,意思的變化就會非常大,給出來的東西,看出錯誤不就更簡單了嗎?
當然了,這一起都是需要實踐操作才能確定的,現在,還是要先統計,做一個龐大的詞庫,然后再轉化為數據庫。
這是一個不小的工程,而且,秦陸也順便打算趁著這個過程,將華夏各地的方言,所有的文字,做成一本書。
可能,這本書的厚度會超過幾米,但是,這將是堪比當年永樂大典的功績。
對于華夏文化的傳承,絕對是一個壯舉。
要是沒有賈維斯這樣的人工智能,單憑人類自己,要想收集全,那是不可能的。
一時間,整個華夏幾乎所有的電子設備全部被悄無聲息的入侵,賈維斯開始依靠量子計算機的強大計算力,統計、測試、總結、匯編全華夏各個地方的方言的特色,將他們和相應的書面語對接起來,然后分類整理,再匯總整理。
這個過程,需要的時間不短,就算是量子計算機,也需要數據才能處理。
只有當設備周圍的人說話的時候,才能將之采集下來,并且根據周圍的其他人的表現,才能確定這句方言具體是什么意思。