• 締切済み

スパースモデリングという分野について

スパースモデリングという学問分野は近年のデータサイエンスの1種だと思っています。だいたいどういうことなのだろうとウィキで拾い読みすると以下のような説明がありました。 --- 疎性モデリング:少ない情報から全体像を的確にあぶり出す科学的モデリング 略 膨大なビッグデータを解析して大量のデータに埋もれて見えにくくなってしまう有為な情報を抽出したり...略 --- 上記の文言は書いてあることが逆のように思えてしまいます。すなわち、データがまばら(すなわち少ない)ということなのか、ビッグデータ(データが大量)にあることなのか、ということです。私はデータが少ないということなのではないかと思います。盲人が象に触って全体を理解するというようなことなのではないかと思うのですが。どうでしょうか。また、”データが少ない”という点についてお尋ねしたいのですが、大災害のように頻繁に起こるわけではないということなのか、現象は連続的に起こっているけれど、観測が困難なのでデータの数が少ないという場合はどうでしょうか。現在、後者のようなデータがあり、気象観測のようなものは定時的に行われるのですが、それに関連したデータの取得が難しく、データが少ないということなのですが。こういうものもスパースモデリングに含めることができるでしょうか。 よろしくお願いします。

みんなの回答

  • masudaya
  • ベストアンサー率47% (250/524)
回答No.1

私も詳しくありませんが,だれも回答されていないようなので... 日常にある様々な関係を考えたとき,様々な多数の入力因子があり, 複数の特性を注目したい出力因子があります. 簡単に線型性を仮定すると,入力から出力への変換は行列を使って表されます. 一般に,この行列の係数は全く関係ないときの0となります. この係数をできるだけ0にするようにすることをスパースモデリングと言います. つまり少ない係数で全体を表現するので,有益な情報が得られる訳です. ちなみに,大規模な行列で係数に0が多い行列をスパース行列と言いますので (日本語では疎行列といいます.)スパースモデリングになったものと思います. 良くある,様々なシミュレーションは結局大規模な連立方程式をとくことに帰着する場合が多く その係数行列がスパース行列であることが多いことから,類推したのでは無いかと思っています.

skmsk1941093
質問者

お礼

回答ありがとうございます。複雑な現象が実はシンプルな法則で示される場合、大量なデータ(複雑に見える)からそれを見破るということでしょうか。これは科学技術の王道というか、それこそがだいご味ということになりますね。科学技術は基本スパースモデリングを目指すという風に見えます。オッカムの剃刀とか思考の経済とかもそういうことになりますね。説明変数が少ない方がいいということです。私はそれとは逆、すなわち少ないデータから複雑な実相を説明せざるを得ないという嘆かわしい状況で何とかそれに近づこうとする努力だと思っていました。