coco


coco はテキストファイルのコード系を変換するフィルタプログラムです. Mule で表示できる文字コードはすべて対応しており, 加えて改行コードも同時に処理できます. Windows で作成した Shift-JIS ファイルを UNIX 用の EUC ファイルに変換したり, メイルで流れてきた ISO-2022-JP のテキストを Shift-JIS に変換したり といったことも簡単に実現できます.

Mule と同時に coco も自動的にインストールされます. 特別な設定や追加インストールは不要です. すぐに使用できます.

使い方は,引数として出力コードを指定し, 標準入力にテキストを流すだけです. 引数でファイル名を与えることはできません. 同様に,出力先も標準出力に固定されています. 入力のコード系は自動判別されますが, 起動時に与えることもできます. この場合,入力コードと出力コードを順に記述します. 例えば UNIX で作成した ISO-2022-JP の index.html を, Windows 用の Shift-JIS ファイル index.dos に変換する場合, 以下のような指定になります.

coco '*iso-2022-jp*' '*sjis*dos' < index.html > index.dos

コード系の指定は Mule と同じです. 日本語のコード系は以下の3通りがあります.

*iso-2022-jp**junet* も同様)
ISO-2022-JP.Internet のメイルやニュースで使用される文字コード. JIS コードと呼ばれることもある.
*sjis*
いわゆる Shift-JIS. Windows や Macintosh など,パソコンでよく使われている.
*euc-japan*
EUC.UNIX の世界でよく使われている. 最近は ISO-2022-JP に移りつつあるような….

これらの後に改行コードの指定を追加できます. 何も書かなければ UNIX 式(LF のみ)になります. dos をつけると MS-DOS 形式(CR + LF), mac をつけると Macintosh 形式(CR のみ)になります.

UNIX のコマンドラインから起動する際は, コード系の指定をシングルクオート(')で囲んでください. アスタリスク(*)があるので, 囲まないと何かと面倒なことになります.

とても強力な coco ですが,弱点もあります. 起動が少し面倒なのと,速度が遅いことです. 速度を求めるなら nkf や qkc など, 他のソフトを使った方がよいかもしれません.


[Japanese] [English]
[Mule]
nagae@tk.airnet.ne.jp