分かち書きの扱いが難しかった件について

先日作った分かち書き例文データは、結局使っていません。
理由はいろいろあるんですが、
日本語の「分かち書き」には、欧文の「スペース」のような実体がないというのが大きいです。


スペースキーが挟まれないということはもちろん、
分かち書きによく用いられる「文節区切り」で考えても、結局2〜3文節が一度に入力されることが多いし、
文節内で切れ目が発生する(はっせい - する、など)こともあって安定しません。


実際の分かち書きデータを調べてみても、「助詞や「く」、「い」の次に切れ目が来ることが多いな」という当然のことがわかるだけで、特に収穫はありませんでした。


月配列系統の原理上、不必要に打ちやすい場所に助詞が来てしまうということはあまり起きないでしょうから、分かち書きデータがあってもなくても結局同じことです。


切れ目の問題は、実際に打ってみる段階で考えるべきであるように思います。