ベストアンサー

c言語でハッシュを作るらしいのですが...

2009/12/08 09:20

c言語でハッシュを作るんですが、勉強不足のためいまいち理解が追いついていないのが現状です。昔の字体を、今の字体に変換するために下記の記述のあるファイル読み込むんですが、この2,3列目が昔の字体で、この文字があったら1列目の今の字体へのポインタを返すように配列に入れたいんです。誰かやり方をおしえてくれませんか？、没,沒,歿壱,壹,弌奇,竒,綺協,恊,叶

yxia001
お礼率19% (13/67)

C・C++・C#
回答数5
ありがとう数4

みんなの回答 （5）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

titokani
ベストアンサー率19% (341/1726)

2009/12/08 13:27 回答No.3

どうもよくわかりません。この場合にハッシュを使うなら、１．旧字体の文字コードより、ハッシュキーを作成２．ハッシュキーより、検索用テーブルを選択３．検索用テーブルを使って実際の検索という流れになると思うのですが、わからないのはどのあたりなのでしょうか？

質問者

補足 2009/12/08 14:24

最初の1番からです。ハッシュの作成がよくわからないんです。

その他の回答 (4)

titokani
ベストアンサー率19% (341/1726)

2009/12/08 15:21 回答No.5

>ハッシュはこんな感じで作ろうというイメージはあるのですが、具体的にプログラムをどうすれば、ハッシュを作れるかをまだつかめていないのですだから、まずはハッシュキーを作ります。ハッシュキーというのは、単に検索テーブルを選択するだけの値ですから、0～(検索テーブル数-1)の値をとります。なので、検索テーブルを256個にするなら、それこそ、文字コードの下位１バイトでも十分です。

質問者

補足 2009/12/21 09:44

すいません。まだ、よく意味がわかりません。調べてみます。

titokani
ベストアンサー率19% (341/1726)

2009/12/08 15:02 回答No.4

>最初の1番からです。ハッシュの作成がよくわからないんです。それは、＞ハッシュの作り方としては、旧字体を文字コードにして数字とみなし、その数字を最大値よりも大きい素数で割ってその数字でハッシュを作ろうと考えています。と、書かれていましたので、わかってらっしゃるのかなと思ったのですが。どこがわからないのでしょうか？

質問者

補足 2009/12/08 15:13

＞ハッシュの作り方としては、旧字体を文字コードにして数字とみなし、その数字を最大値よりも大きい素数で割ってその数字でハッシュを作ろうと考えています。ハッシュはこんな感じで作ろうというイメージはあるのですが、具体的にプログラムをどうすれば、ハッシュを作れるかをまだつかめていないのです。

titokani
ベストアンサー率19% (341/1726)

2009/12/08 10:35 回答No.2

>旧字体から新字体へぶつけ方は旧字体を一列の配列にいれ、検索する字体を、旧字体を入れた配列に全件検索して見つけていく感じです。ハッシュというのは、つまり、その検索用の配列が非常に大きくなった場合に、配列を分割するための手法です。１Mバイトの検索用配列も256個に分割すれば、一つ一つは２５６Kバイトから検索すればいいので、高速化になります。そして、この分割方法（＝ハッシュキーの作り方）次第でどの程度高速化されるのかが違ってきますので、このあたりが工夫のしどころだったりします。

質問者

補足 2009/12/08 11:44

ハッシュの作り方としては、旧字体を文字コードにして数字とみなし、その数字を最大値よりも大きい素数で割ってその数字でハッシュを作ろうと考えています。ハッシュのバイト数を指定してchar型のポインタとint型で作ろうとしています。

titokani
ベストアンサー率19% (341/1726)

2009/12/08 09:43 回答No.1

なにがわからないのでしょうか？１．ファイルの読み方２．旧字体から新字体の検索のしかた３．ハッシュの作り方「全部わからない」というなら、上から順番に。ハッシュというのは、高速化すための手法なので、とりあえずはあとまわしにしても問題ありません。ファイルがUNICODEなのかSJISなのかも非常に重要な点ですので、押さえておきましょう。

質問者