首頁 運維干貨Linux下的Locale詳解

Linux下的Locale詳解

運維派隸屬馬哥教育旗下專業運維社區,是國內成立最早的IT運維技術社區,歡迎關注公眾號:yunweipai
領取學習更多免費Linux云計算、Python、Docker、K8s教程關注公眾號:馬哥linux運維

locale這個單詞中文翻譯成地區或者地域,其實這個單詞包含的意義要寬泛很多。Locale是根據計算機用戶所使用的語言,所在國家或者地區,以及當地的文化傳統所定義的一個軟件運行時的語言環境。

locale把按照所涉及到的文化傳統的各個方面分成12個大類,這12個大類分別是:

  1. 語言符號及其分類(LC_CTYPE)
  2. 數字(LC_NUMERIC)
  3. 比較和排序習慣(LC_COLLATE)
  4. 時間顯示格式(LC_TIME)
  5. 貨幣單位(LC_MONETARY)
  6. 信息主要是提示信息,錯誤信息,狀態信息,標題,標簽,按鈕和菜單等(LC_MESSAGES)
  7. 姓名書寫方式(LC_NAME)
  8. 地址書寫方式(LC_ADDRESS)
  9. 電話號碼書寫方式(LC_TELEPHONE)
  10. 度量衡表達方式 (LC_MEASUREMENT)
  11. 默認紙張尺寸大小(LC_PAPER)
  12. 對locale自身包含信息的概述(LC_IDENTIFICATION)。

所以說,locale就是某一個地域內的人們的語言習慣和文化傳統和生活習慣。一個地區的locale就是根據這幾大類的習慣定義的,這些locale定 義文件放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義文件,這些文件都是用文本格式書寫的,你可以用寫字板打開,看看里邊的內容,當然出了有限的注釋以外,大部分 東西可能你都看不懂,因為是用的Unicode的字符索引方式。

對于de_DE@euro的一點說明,@后邊是修正項,也就是說你可以看到兩個德國的locale:/usr/share/i18n/locales /de_DE@euro和/usr/share/i18n/locales/de_DE。打開這兩個locale定義,你就會知道它們的差別在于 de_DE@euro使用的是歐洲的排序、比較和縮進習慣,而de_DE用的是德國的標準習慣。

上面我們說到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用戶都知道是系統采用的字符集。

zh_CN.GB2312到底是在說什么?Locale是軟件在運行時的語言環境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。一個locale的書寫格式為: 語言[_地域[.字符集]]。所以說呢,locale總是和一定的字符集相聯系的。下面舉幾個例子:

  1. 我說中文,身處中華人民共和國,使用國標2312字符集來表達字符。zh_CN.GB2312=中文_中華人民共和國+國標2312字符集。
  2. 我說中文,身處中華人民共和國,使用國標18030字符集來表達字符。zh_CN.GB18030=中文_中華人民共和國+國標18030字符集。
  3. 我說中文,身處中華人民共和國臺灣省,使用國標Big5字符集來表達字符。zh_TW.BIG5=中文_臺灣.大五碼字符集
  4. 我說英文,身處大不列顛,使用ISO-8859-1字符集來表達字符。en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集
  5. 我說德語,身處德國,使用UTF-8字符集,習慣了歐洲風格。de_DE.UTF-8@euro=德語_德國.UTF-8字符集@按照歐洲習慣加以修正,注意不是de_DE@euro.UTF-8,所以完全的locale表達方式是 [語言[_地域][.字符集] [@修正值]。

其中,與中文輸入關系最密切的就是LC_CTYPE,LC_CTYPE規定了系統內有效的字符以及這些字符的分類, 諸如什么是大寫字母,小寫字母,大小寫轉換,標點符號、可打印字符和其他的字符屬性等方面。而locale定 義zh_CN中最最重要的一項就是定義了漢字(Class“hanzi”)這一個大類,當然也是用Unicode描述的,這就讓中文字符在Linux系統 中成為合法的有效字符,而且不論它們是用什么字符集編碼的。

怎樣設定locale呢?

設定locale就是設定12大類的locale分類屬性,即12個LC_。除了這12個變量可以設定以外,為了簡便起見,還有兩個變量:LC_ALL和LANG。它們之間有一個優先級的關系:LC_ALL > LC_ >LANG??梢赃@么說,LC_ALL是最上級設定或者強制設定,而LANG是默認設定值。

  1. 如果你設定了LC_ALL=zh_CN.UTF-8,那么不管LC_*和LANG設定成什么值,它們都會被強制服從LC_ALL的設定,成為 zh_CN.UTF-8。
  2. 假如你設定了LANG=zh_CN.UTF-8,而其他的LC_=en_US.UTF-8,并且沒有設定LC_ALL的話,那么系統的locale設定以LC_=en_US.UTF-8。
  3. 假如你設定了LANG=zh_CN.UTF-8,而其他的LC_,和LC_ALL均未設定的話,系統會將LC_設定成默認值,也就是LANG的值zh_CN.UTF-8。
  4. 假如你設定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設定的話, 那么系統的locale設定將是:LC_CTYPE=en_US.UTF-8,其余的 LC_COLLATE,LC_MESSAGES等等均會采用默認值,也就是 LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。

所以,locale是這樣設定的:

  1. 如果你需要一個純中文的系統的話,設定LC_ALL= zh_CN.XXXX,或者LANG=zh_CN.XXXX都可以,當然你可以兩個都設定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設定,不要作無用功。
  2. 如果你只想要一個可以輸入中文的環境,而保持菜單、標題,系統信息等等為英文界面,那么只需要設定 LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。
  3. 假如你高興的話,可以把12個LC_*一一設定成你需要的值,打造一個古靈精怪的系統:LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內碼GBK字符集);LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數字系統) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德國的度量衡使用ISO-8859-15字符集) 羅馬的地址書寫方式,美國的紙張設定……。估計沒人這么干吧。
  4. 假如你什么也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統將采用POSIX作為lcoale,也就是C locale。

另外LANG和LANGUAGE有什么區別呢?

LANG – Specifies the default locale for all unset locale variables

LANGUAGE – Most programs use this for the language of its interface

LANGUAGE是設置應用程序的界面語言。而LANG是優先級很低的一個變量,它指定所有與locale有關的變量的默認值。

鏈接:https://www.cnblogs.com/idlo/p/10427409.html

(版權歸原作者所有,侵刪)

本文鏈接:http://www.thecarconnectin.com/43083.html

網友評論comments

發表回復

您的電子郵箱地址不會被公開。

  1. 夏日博客說道:

    Linux系統不錯。

Copyright ? 2012-2022 YUNWEIPAI.COM - 運維派 京ICP備16064699號-6
掃二維碼
掃二維碼
返回頂部
国产曰批视频免费观看完|久久久一本精品99久久精品66直播|色天使色偷偷AV一区二区三区|国产色秀视频在线播放|亚洲欧洲免费三级网站