裏に逝かなくてもよさそうなカナ(「せ」とか。「ぜ」を抜いても出現率が高い。)までが裏いっているところも同時に生じているわけで。
たとえば、「ま」が表なのに「そ」が裏なのはなんでだろう。
頻度表とにらめっこしてきま。
自前の頻度表で見直したら、「せ」が「ま」より頻度が高いその他の問題はなく、TRONのシフト側にはちゃんと低頻度カナが並べられているのが確認できました。
どうやら 最初に見た国研の文字頻度データが普通の文章と比べて偏っていた≒TRONの設計に使われた文章サンプルと異なっている のが悪いようです。
国研はだめだなあ。