page_adsence

2011年3月15日火曜日

文字コードを変換する

ファイルの文字コードを調べたりするのに使う。

文字コードがわからないファイルを以下の方法で開くときちんと見れる
nkf ファイル名

オプション一覧
-j(省略可能) : JISコード(ISO-2022-JP)を出力
-e           : EUCコードを出力
-s           : Shift-JISコードを出力
-w           : UTF-8コードを出力(BOM無し)
-Lu          : unix改行形式(LF)に変換
-Lw          : windows改行形式(CRLF)に変換
-Lm          : macintosh改行形式(CR)に変換
-g(--guess)  : 自動判別の結果を表示
--overwrite  : 引数のファイルに直接上書き
--version    : バージョン情報を表示(インストール済チェック)

文字コードを確認する方法
$ nkf -g example.txt

文字コードをEUC-JPに変換する
$ nkf -e --overwrite example.txt

文字コードをUTF-8に変換する
$ nkf -e --overwrite example.txt