E 是一個點,Q 是四個符號,這不是隨機的
摩斯電碼裏,E 只有一個點(.),T 只有一條橫(-)。而 Q 是(--.-),Z 是(--..),光數符號個數就是 E 的四倍。
這個安排不是隨便設計的。Samuel Morse 在設計編碼時,專門跑去印刷廠數活字數量——哪個字母的鉛字最多,說明這個字母在英文裏出現最頻繁,就給它分配最短的編碼。
結果是這樣的:
| 編碼長度 | 字母 |
|---|---|
| 1個符號 | E(.)、T(-) |
| 2個符號 | A、I、M、N |
| 3個符號 | D、G、K、O、R、S、U、W |
| 4個符號 | B、C、F、H、J、L、P、Q、V、X、Y、Z |
對照英文字母的實際出現頻率排行:E(13%)、T(9%)、A(8%)、O(7.5%)、I(7%)……基本上越常見的字母,編碼越短。這不是完全一一對應,但整體趨勢非常明顯。
這個思路和一百多年後發明的哈夫曼編碼(Huffman Coding)是同一個邏輯——出現頻率越高的符號用越短的編碼,讓整體傳輸的信號量最小。區別在於哈夫曼編碼是用數學方法嚴格推導出最優解,而摩斯是靠數鉛字的方式做了一個工程近似。在沒有信息論的1800年代,這已經相當了不起。
實際效果也能驗證這一點:用摩斯電碼發一段普通英文文本,平均每個字母的符號數大約是 2.5 個。如果不按頻率分配,給每個字母都用4個符號,平均就要 4 個。頻率優化讓傳輸效率提高了將近40%。
時序規則:點和橫不只是形狀
摩斯電碼裏"點"和"橫"不只是兩種符號,背後有嚴格的時序規則:
- 一個點持續 1個時間單位
- 一個橫持續 3個時間單位
- 同一字母內,符號之間的間隔是 1個時間單位
- 字母之間的間隔是 3個時間單位
- 單詞之間的間隔是 7個時間單位
所以摩斯電碼本質上是一種時序編碼,用信號持續時間和停頓時間的比例來區分點、橫、字母邊界和單詞邊界。這也是爲什麼手工發報有技術門檻——節奏感差的話,收報方很難準確區分字母內的短停頓和字母間的長停頓。
SOS 不是任何詞的縮寫
SOS(...---...)是國際通用遇難信號,但它不是 Save Our Ship,也不是 Save Our Souls,這些說法都是後來強行配上去的。
SOS 被選中純粹是因爲它在摩斯電碼裏好發、好辨認、不容易出錯——三短三長三短,節奏對稱,極端情況下即使操作者手在發抖,這個信號也很難發錯。而且這個序列在摩斯碼裏不對應任何字母組合,不會和正常報文混淆。
1906年柏林國際無線電報大會上,代表們討論了好幾個候選遇難信號,最終選了 SOS,理由就是這個。
Titanic 沉船時,操作者同時發了舊式的 CQD(當時的舊遇難信號)和新式的 SOS,那是 SOS 第一次在真實海難中被使用。
爲什麼今天還值得了解
摩斯電碼早已退出日常通信,但有幾個地方它還活着。
業餘無線電(Ham Radio)社區裏依然在用,他們叫它 CW(Continuous Wave)。全球有幾百萬持證的業餘無線電愛好者,其中相當一部分熱衷於用手鍵發報,認爲這比語音通信更有技術感。美國 FCC 直到 2007 年才取消了考證必須掌握摩斯電碼的要求。
更日常的一個延伸是手機的緊急 SOS 功能。iPhone 按側鍵五次觸發 SOS 呼叫,設計邏輯和摩斯的 SOS 一脈相承:緊急情況下操作要簡單、不容易誤觸、任何人都能識別是求救。
另外,摩斯電碼是講解信息編碼的絕佳入門例子,比直接講二進制直觀得多——變長編碼爲什麼比定長編碼效率高,頻率分析爲什麼重要,在摩斯電碼上都能看得很清楚。
如果想實際體驗編解碼,把文字或摩斯碼粘到 摩斯電碼在線工具 裏,工具支持斜槓、豎線、空格三種分隔符,中英文都可以處理。



加載中...