ことえり辞書登録用テキストファイルの作り方。

 MS-IME2ちゃんねる顔文字辞書MacOSXことえり向けに変換するためがんばりました。以下、その作業ログ。

 用意するものはUTF-16が扱えてタブの置換が出来るテキストエディタ。私はTextWranglerを使ってます。

 参考にことえりヘルプを見ていただきたいのですが、ことえり辞書登録用テキストのフォーマットは以下のようになります。

  • 文字コードUTF-16、改行コード:UNIX(LF)
  • ひとつの単語は、"よみがな","単語","品詞"<改行>で表す。引用符やカンマはASCII(半角)です。
  • 各行の長さは127文字以下。
  • 読みはひらがなを使い、32文字以下。
  • ひとつの単語の長さは64文字以下。
  • 品詞として、普通名詞、サ変名詞、人名、地名、形容詞、副詞、数字列接尾語、無品詞のうちのひとつを指定する。
  • メモを入力するには、メモの前に2つのASCIIカンマ(,,)を入力する。
  • 単語にASCII引用符(")を入力する場合は、二回続けて入力する(""と入力すると"と変換される)。

 これらのことを踏まえつつ、MS-IME用の辞書をことえり用に直していきます。

  1. MS-IME2ちゃんねる顔文字辞書から@アットマーク変換辞書をダウンロード。@はテキストの置換に使います。フォーマットのところにも書きましたが、ことえりは読みがなに使えるのはひらがなだけです。@を用いて必要なときだけ2chの顔文字を呼び出す大人のたしなみは出来ないのでご注意ください。
  2. まず、ファイルを開きます。『ime-atm.txt』を『Japanese (Windows, DOS)』モードで開いてください。
  3. 先頭にあるメモの処理をします。最初の3行分の頭についている『!』を『,,』に書き換えてください。
  4. 次に、行頭を置換します。『@(全角)』を、『"(半角)』に全部置換してください。
  5. 次に、タブを置換します。『半角バックスラッシュt』(※半角バックスラッシュはoption+¥キーで入力できるはずです)を、『","』に全部置換してください。
  6. それが終わったら『顔文字』を『無品詞"』に全部置換してください。このとき、無品詞のあとにASCII引用符をつけることを忘れないでください。もし忘れた場合は慌てずにcmd+Z
  7. ここまでで大まかなフォーマット合わせは終わりましたが、最後にASCII引用符の処理をします。761行目、767行目、777行目、905行目、977行目には単語の中に『"』が使われていますので、ここにもうひとつ『"』を追加します。777行目の場合は二カ所あり、さらに結果的には両方とも『"""』とASCII引用符が3つ並ぶようになるはずです。
  8. テキストの加工が終わったら、適切なフォーマットで保存します。別名で保存を選び、文字コードUTF-16、改行コードをUNIX(LF)にして保存してください。
  9. 右上にあることえりメニューから、単語登録/辞書編集を選択してください。そうすると、ことえり単語登録というアプリケーションが起動しますので、メニューバーの『辞書』から『新規ユーザー辞書の作成』を選んでください。名前は適当に、2ch顔文字辞書にしておきます。
  10. 単語登録ウィンドウで2ch顔文字辞書が選ばれ、登録されている語数が0になっているのを確認します。そして、再びメニューバーの『辞書』から、『テキストや辞書から取り込む』を選択してください。そこで、ことえり用に加工した辞書登録テキストを選択し、読み込まれるのを待ちます。
  11. 無事成功したら、1,000の単語が登録されるはずです。もし途中で落ちるようなことがあったら、単語内のASCII引用符の処理は的確かどうか確認してください。

 今回は2chの顔文字辞書で説明をしましたが、他の辞書も同じような要領でことえり用にコンバートできると思います。問題になるのは行頭行末の処理ですが、TextWranglerなら以下の方法で対処できます。

  1. メニューバーの『text』から『Prefix/Suffix Line』を選択。
  2. 『Insert』にチェックがついているのを確認し、Prefix欄には行頭に追加したい文字を、Suffixには行末に追加したい文字を入力。どちらかが空でも可。OKをクリック。
  3. 全行(もしくは選択した行)の行頭行末に文字が追加できたか確認。

 というわけで、お粗末さまでした。