Unicode意思

Unicode 是一個國際標準,它定義了一組字元集,用於表示世界上各種語言的字元。Unicode 字元集包括了拉丁字母、希臘字母、斯拉夫字母、阿拉伯字母、希伯來字母、漢字、日文假名、韓文等字元,以及各種符號和表情。

Unicode 的目的是解決不同字元集之間的互操作性問題。在 Unicode 出現之前,不同的作業系統和應用程式使用不同的字元集,這導致了在不同系統之間交換文本時會出現亂碼。Unicode 通過為每個字元分配一個唯一的碼點(code point)來解決這個問題,這樣無論是在哪種系統上,只要知道字元的碼點,就可以正確地顯示和處理該字元。

Unicode 碼點是一個16位的數字,通常表示為一個由連字號分隔的四個字元的代碼(例如,U+0048 表示拉丁字母 H)。在某些情況下,一個碼點可以映射到多個字元(例如,重音符號可以疊加在多個拉丁字母上),而在其他情況下,一個字元可以由多個碼點表示(例如,一些東亞字元需要四個碼點來表示)。

Unicode 標準由 Unicode 聯盟(Unicode Consortium)維護,該聯盟是一個非營利組織,負責管理和更新 Unicode 標準。隨著新的語言和符號被添加到 Unicode 標準中,Unicode 碼錶也在不斷擴展。