■ 文字コードの互換性問題に直面

C++のソースからC#に移植する事になったのだが、全角文字の文字コードの問題に直面した。

と、ライブラリを使っているため、C#のEncodingで変換すると結果が合わなかった。
互換性の為、変換処理を書いてみた。

■ JISからSJIS(_mbcjistojms)

(※1) _mbcjmstojis は、2byte目が 0x00,0xFF の場合、変換しない。なんでだろ？

1byte目が 0xC1(193)以上か判定。
結果が真の場合
2-1. 1byte目から0xC1(193)を減算
2-2. 2-1.の結果を2倍にする
2-3. 2-2の結果に0x21(33)を加算
結果が偽の場合
3-1. 1byte目から0x81(129)を減算
3-2. 2-1.の結果を2倍にする
3-3. 2-2の結果に0x21(33)を加算
2byte目が、0x9F(159)以上かつ 0xFF(255)以下の場合、0x01(1)を加算。
2byte目が、0x01(1)以上かつ 0x1E(30)以下の場合、強制的に0xFF(255)とする。(※2)

(※2) 1byte目が、0x01(1)~0x1E(30)の場合に 0xFF(255)になっているのが良くわからん。

0x9E(158)以下か判定。
1.の結果が真の場合
2-1. 0x1F(31)を減算した結果が0x60(96)を超過している場合、2バイト目から0x20(32)を減算する。
2-2. 0x1F(31)を減算した結果が0x60(96)を超過していない場合、2バイト目から0x1F(31)を減算する。(※3)
1.の結果が偽の場合
3-1. 2バイト目から0x7E(126)を減算する。

(※3) 2byte目が、0x01(1)~0x1E(30)の場合に、0x1F(31)を減算するとマイナスとなり桁あふれが起きる。例えば、0x01(1)の場合は、0xE2(226)となる。