当前位置:首页 > linux > 正文

linux默认编码(修改linux的字符编码)

  • linux
  • 2024-04-03 19:28:49
  • 3790
Linux 默认编码
Linux 系统默认使用 UTF-8 编码。 UTF-8 是一种可变长度字符编码,可以表示 Unicode 字符集中的所有字符。
UTF-8 的要素:

- 可变长度: UTF-8 编码使用 1 到 4 个字节来表示一个字符,具体取决于字符的 Unicode 值。


- 向后兼容: UTF-8 向后兼容 ASCII 编码,这意味着 ASCII 字符可以用一个字节表示。


- 国际化: UTF-8 可以表示世界上所有已知的语言和符号。


- 通用性: UTF-8 是 Web 和电子邮件的标准编码,并被广泛用于 Linux、macOS 和 Windows 系统。


示例:
ASCII 字符(使用 1 个字节):"A"
拉丁字母(使用 2 个字节):"é"
中文汉字(使用 3 个字节):"中"
表情符号(使用 4 个字节):"😂"