- ベストアンサー
ニューラルネットワークの入力データについて
例えば 性別、身長、体重、足のサイズ があった場合、身長・体重・足のサイズは正規化し、性別については 男→0 女→1として学習できるのではないな?と素人ながら思っております。 この時仮に性別が「男」「女」以外に「性別3」「性別4」と性別が4つだったとしたら、データはどう作れば良いのでしょうか? 2つの場合に倣ってそれぞれを0,1,2,3とラベル付けする感じでよいんでしょうか?
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
択一的データの場合は、OneHotVectorにするべきです。 男、女、性別3、性別4の4項目を用意して、それぞれの出力が0~1になるようにして、最終的に最も値の大きい項目が選択されたと判断します。 1項目で4つの選択肢を学習させると、各項目に実際には存在しない大小関係を学習してしまいます。今回の例であれば、男<女<性別3<性別4という関係が学習されてしまいます。
その他の回答 (3)
- SPROCKETER
- ベストアンサー率26% (2131/8006)
それはパソコンのデータ形式であって、ニューラルネットワーク(神経網)ではありません。ニューラルネットワークというのは、1つの情報を入れると、関連する情報を選び出して出力するもので、たとえば、顔画像が大量に保存されているニューラルネットワークにあなたの顔画像を入力すると、それが画像データとして保存されていれば、あなたの顔だと識別して、関連するあなたの個人情報を検索して出力するなどの処理が出来るシステムです。 あなたの友達があなたの顔を見て、****君だと識別し、あなたの個人情報を覚えているのと同じ事が出来るわけです。同様に、あなたの顔の一部を入力すると、それでも、あなたの顔だと判別出来るのがニューラルネットワークです。あなたの声を入力しても、あなたの声だと識別出来るのがニューラルネットワークです。あなたの趣味、学歴、住所、氏名の一部を入力しても、あなただと識別出来るのがニューラルネットワークです。人間に近い判別能力があるのがニューラルネットワークなのです。 あなたが友達の後姿を見ても当人だとわかるように、ニューラルネットワークはあなたの顔や姿の写真画像が大量に入力されていれば、あなたを判別出来ます。パソコンのデータベースとは根本的に違うのです。
お礼
ありがとうございます
- hiodraiu
- ベストアンサー率15% (451/2846)
いきなり「例えば」って例え話を始められても、何がしたいのかが分からなければ、0,1,2,3でよいのか他の方法が良いのかは誰にもわからないと思いますよ。そもそも、性別も正規化の一言で片付ければよいのではないですか。
お礼
ありがとうございます
- sknbsknb2
- ベストアンサー率38% (1158/3037)
データをどう作るかは、その処理系がどうなっているかによって変わるので、回答できません。 処理系の要請に沿った形でデータを作ればいいとしか…
お礼
ありがとうございます
お礼
ありがとうございます。 なんかそんな感じがしてたんです。数値の大小自体に意味が無いし、最終結果に連続的な(線形の?)影響を及ぼすわけでもないしどうしたものかと思案していました。 やっとこの初心者の質問の意図を理解していただける方に巡り合えて感謝です。