向山大概聽明白了。
或者說,唯一讓向山懵逼了一瞬間的,也就是英格麗德舉出的那個例子。
他沒想到會在這種場合聽到這種……奇怪的例子。
但是,除此之外,好像并沒有什麼更有價值的東西。
隻能說,任何專業人士,在超出自己專業領域之後,就不比一般人更加智慧吧。
雖然在英格麗德眼中,這些外星人的書寫方式有趣極了,但歸根結底,這就是一種壓縮算法。
而這無法解釋向山現在在琢磨的問題。
“所有外星機械的設計圖紙、裝配工藝、材料制造的參數,再加上它們自身運行的AI,加在一塊,是如何壓縮到兩三百MB這個水平的”。
外星人使用了兩種壓縮算法。
一種大緻可以稱作“字典算法”,即“将高頻出現的排列組合用,做成對應字典,然後用字典内編号代碼來替代該組合”。這種手段人類也在使用。當然,如果“字典”做得很大,那麼數據本體就可以壓縮得很小。但有些時候,又會形成“字典比數據本體還要大”的情況。
外星人大概是選擇了一個恰好的數值,保證“本體+字典”的大小最小。
另外就是英格麗德所說的這種二維的符号矩陣。
但不管怎麼樣,信息的無損壓縮一定是有極限的。
而這種二維矩陣的算法,不管外星人将讀取規則設計得怎樣花裡胡哨,它都存在一個“上限”的。
就如英嘉所說,如果多增加一個“下一個終止方向符号無效”的符号,固然可以增加讀取路線的數量,但是卻會導緻符号之中混入大量除了表示“下一個終止方向符号無效”之外沒有其他任何意義的符号,“字典”的集合之中也要增加項目。
“讀取路線”的增加,會導緻“摻雜過多隻與讀取規則有關的符号”以及“字典”的膨脹。
同字典算法一樣,到最後,同樣也會出現“讀取規則”大小大于數據本體大小的問題。
這裡面同樣存在一個平衡點。
按照向山估計,關于讀取規則的符号可能也就那麼幾個,不會太多。
而二維的符号矩陣也存在另一個問題。就好像“填字遊戲”一樣,一個空間坐标上的符号,要受到來自四個方向内容的制約。這反而使得信息的表達不像一維的文字那樣自由。
“就用你舉的例子來說吧……”向山是如此說的:“雖然那個古代詩人在八百四十字裡面壓縮了七千九百五十八首詩,但是我敢肯定,這七千九百、将盡八千首的詩,單獨拆出來的話,沒有一首可以流傳千古吧,說不定還存在那個什麼……格律啊韻腳不那麼工整的情況。”
英格麗德有些好奇:“你看上去好像是剛剛才知道這玩意的……”
“如果那個文字遊戲裡面拆出來的詩足夠優秀的話,肯定會上課本。那我肯定會有印象。”向山在這一點上倒是非常确信:“仔細一想,古代多半沒有标點符号,斷句也得後人來猜……”
英格麗德捂臉:“我猜你想說‘句讀’。”
向山無視了英格麗德的提示:“你看,從這一點來看,這種文字遊戲,對信息的壓縮,損失很大,效率也就那樣。它甚至不是‘壓縮任意八千首詩’,以壓縮算法的标注來看……嘶……”
向山好像意識到了什麼……
——不是“壓縮了任意八千首”……不一定是壓縮……
——什麼……
請勿開啟浏覽器閱讀模式,否則将導緻章節内容缺失及無法閱讀下一章。
相鄰推薦:這是一個淡淡憂傷的江湖 被師弟捅死以後 影帝他風評不保+番外 握住他+番外 白首不相離 公元2150 反派女配和路人甲 (綜漫同人)[綜]我可以去你家采訪嗎? (韓娛同人)女主她又美又海[娛樂圈]+番外 單善的戀愛小事 念你入懷 騎砍戰團:卡拉迪亞戰紀 任務失敗後和反派HE了 你可以養我嗎 喜歡的心事 奪帝為後+番外 我為對家吹彩虹屁 複仇成妻/追妻火葬場 賬中臣 認錯鏟屎官後我被碰瓷了[娛樂圈]+番外