てるてるのぺぇじ 更新履歴    サイト情報
総合ホーム 文芸作品館 IT研究所 日記帳 読書ノート
ホーム > 日記帳 > 五十音順

五十音順

ちょっと仕事で五十音順というものが話題になったので調べてみました。
五十音順というものは、言うまでもなく、
あいうえお順とか辞書順と呼ばれる「あれ」です。

ところで、僕が仕事で直面したのは、
言葉をコンピュータのプログラムで五十音順に並べるという問題。

コンピュータのプログラムで、日本語の語句を並べ替える場合は、
五十音順ではなく、文字コード順というものを使うことが多いです。

WindowsXPをご利用の方であれば、
「スタート」→「すべてのプログラム」
 →「アクセサリ」→「システムツール」→「文字コード表」
とメニューをたどっていただけると文字コード表というのが出てきますが、
この表に書かれている順番に並べ替えることが一般的なのです。

で、この表の通り語句を並べ替えてやると何となく五十音順になるのですが、
実はそんなに簡単な話でもないのです。

たとえば、
「きいと(生糸)」「きあい(気合い)」「きー(キー)」「きんき(禁忌)」
という語句は、五十音順ではどのようなに並べ替えればよいでしょうか?

五十音順では次のようになります。
1. きあい
2. きー
3. きいと
4. きんき

文字コード順では次のようになります。
1. きあい
2. きいと
3. きんき
4. きー

この例では長音(「ー」)が、その前にある文字によって読み方が変わるために、
単純に文字の順に並べ替えでも五十音順にならないことを示しています。

ただ、五十音順といっても、明確な定義があるわけではなく
実際には、辞書、百科事典、電話帳などによっても違いがあるようです。

長音の問題だけでなく五十音順に並べ替えるには、
いろいろと、超えなければいけないハードルがあるようです。
調べてみると、コンピュータで五十音順を扱う場合には
「日本語文字列照合順番」というものが、JISで規格化されているようです。

■トラックバック

このエントリーのトラックバックURL:
http://t-mikami.net/mt/mt-tb.cgi/88


= カテゴリー =
ビジネスのこと
文芸のこと
日常のこと
言葉のこと
アーカイブ
2010年03月 (6件)
2010年02月 (2件)
2010年01月 (2件)
2009年10月 (1件)
2009年08月 (3件)
2009年07月 (2件)
2009年06月 (1件)
2009年04月 (1件)
2009年03月 (1件)
2008年10月 (1件)
2008年06月 (4件)
2008年03月 (2件)
2008年01月 (1件)
2007年12月 (6件)
2007年08月 (9件)
2007年07月 (6件)
2007年06月 (3件)
2007年05月 (4件)
2007年04月 (3件)
2007年03月 (11件)
2007年02月 (1件)
2006年11月 (2件)
2006年10月 (1件)
2006年09月 (1件)
2006年08月 (9件)
2006年07月 (12件)
2006年06月 (6件)
2005年11月 (3件)
2005年10月 (3件)
2005年09月 (3件)
2005年08月 (2件)
2005年07月 (1件)
2005年06月 (4件)
2005年05月 (3件)
2005年04月 (12件)
2005年03月 (4件)
2001年11月 (1件)
1999年10月 (1件)
1999年08月 (1件)
1999年07月 (1件)
1999年06月 (1件)
1999年05月 (2件)
あわせて読みたい
このブログのフィードを取得
[フィードとは]

自作文芸作品館小説集詩集エッセイ集] / 情報技術総研論文集ITノート] / 日記帳 / 読書ノート

Copyright (C) 2007 Takeshi Mikami