- 締切済み
目・脳が、時間的な刺激の変化を認識する器官や仕組み
目・脳が、時間的な刺激の変化を認識する器官や仕組み 目が、(脳が?)、以下の現象(Shape From Motion)を認識する時の仕組みや、認識の為の器官が、どうなっているのか、ご存じの方がいらっしゃれば教えて下さい。 ・ドットがたくさん打ってあり、その中にある形の部分だけ、ドットが一方向に流れる、この時、その形が認知できる。 ・しかしながら、流れが止まれば、ただのドット群に戻り、形が認知できなくなる。 実際のアニメーションGIFを以下のサイトから見て下さい。 [動きを形で見る。] http://web2.chubu-gu.ac.jp/web_labo/mikami/brain/23-1/index-23-1.html リンゴの形が何故か分かる、という錯覚の一種を扱った項目。 解説が難しくて読みにくいのですが、理由や原因がここには記述していないと思います。代わりに、これを見ているときに活発に働く脳の部位が解説してあるように思います。 この錯覚を知って後日、FullBasicを使って同様のアニメーションをプログラムしました。その際、形の内部を流れではなく、ランダムドットの打ち直しという仕様にしたところ、僕には同様に形が認識できました。このことから、流れに限ったことではなく、単にドットの現れたり消えたりする動作が形の情報を伝えていると考えられます。 今まで調べたところでは、水平細胞という視細胞が、RGBや明度の細胞を水平方向に(互いを繋ぐようにして)リンクし、差分を取ることによって、「空間的な差異」の認知に役立っているということがわかりました。 しかしこれは、ある時間における近隣のピクセル同士の差分のようなものであって、「Shape From Motion」のように「ドットが今点いていて、その後消える」といった時間的な差分を説明できる細胞ではないように思います。 遅延素子とフィードバックのような細胞があって時間前後の差分を取るような細胞があったりするのでしょうか。 明るさ等が短い時間で急に変化した場合のみ反応する細胞があるのでしょうか。 宜しくお願いします。m(_ _)m
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- el156
- ベストアンサー率52% (116/220)
リンク先と同様な現象の説明は本で読んだことがありますが、質問者様の「ランダムドットの打ち直しという仕様にした」実験には感心致しました。 リンク先の場合には、「背景の不動」と、それを遮蔽する「リンゴ表面の移動」が同時に認識されるはずですが、質問者様の実験の場合には恐らく「背景の不動」だけが認識されたのだと思います。 人が目で見た物を認識する時、映画のフィルム撮影のようにまず静止画のコマを捉えてコマとコマの間の動きを計算する、という仕方では無いと思います。人が物を見ている時、瞳も頭も身体も、場合によっては対象物も常に動いていて、それを前提に動く物を認識しています。見る方向が変われば網膜上の像は歪みますし、動きは移動、拡大縮小、歪みと、様々です。人や動物はそれらを「網膜像がどのように変化しているか」という視点で捉えているのではなくて、溢れる程の情報がめまぐるしく変化する中で「変わらないのは何か」を抽出します。「変わらないもの」は通常網膜上では常に動いています。仮に静止した網膜像があったとしても、それが何か特別な意味を持つことは無いと思います。 ランダムな点の一つ一つの位置を細かく記憶できなくても、ランダムな点のパターンが不変なのか変化しているのかを認識するのは簡単です。質問者様の実験では不変項としての背景を認識できたから中のリンゴがぽっかりあいた穴の様にして認識されたのではないかと思います。恐らく背景を静止ではなく流動させても同じ様に認識可能な筈ですし、逆に背景をランダムな打ち直しにするならリンゴ表面を静止させるか流動させれば認識できるのではないかと思います。でももしリンゴと背景の両方をランダムに打ち直すなら、リンゴが認識できるはずがありません。 不変項の抽出については、ジェームス・ギブソンという人が、「生態学的視覚論」という本で「生態光学」と呼んで丁寧に説明しています。日本では東大教育学部の佐々木正人教授がギブソンの紹介本その他のいくつかのわかり易い本を著しています。冒頭「読んだことがある」と申し上げたのはたぶん佐々木正人教授の本だったのだと思います。
- ruehas
- ベストアンサー率68% (816/1194)
こんにちは。 まず最後のご質問からゆきますと、我々が運動を認識するためには、何か時間を把握するための細胞が必要なのではないかということですね。ところが、脳内に実際そのような機能が存在するかどうかは別としまして、実は我々の視覚が運動を知覚するのにそのようなタイマー機能は必ずしも必要ありません。 運動量を決定するためには、まず「距離、時間、速度」というパラメーターが必要となります。加えて運動方向といいますのは「X,Y,Z」の三次元座標で表されるわけですが、脳内では頭頂葉連合野に「空間認知座標」というものが形成されており、ここでは主に視覚情報や、あるいは聴覚(音の方向)などといったものが統合されています。 この場合は「網膜中心座標」と言い、自分の身体の向きや視線などの情報を基に脳内座標は常に更新されています。では、三次元方向の位置情報はこれで良いとしまして、肝心の運動量というのはどのようにして認識されるのでしょうか。 距離(及び方向)といいますのは運動前と運動後の結果を比較することによって決定されます。ですが、果たしてこれだけではまだ時間や速度を算出することはできません。ところが、我々の視覚がこのような運動の結果を比較するためには最低でも「0.03秒」という時間を要します。つまり、それ以上早く距離を測ることができないということです。ならば、0.03秒の間にどれだけ移動したかにより、逆にその速度を算出することが可能となります。従いまして、我々の視覚においてこの「0.03秒(以下30ms)」が定数である以上、運動量の算出にわざわざ時間を計測する機能は必要ないということになります。 これがどういうことかと言いますと、つまり我々の視覚は運動の一部始終を把握しているのではなく、それを30ms、即ち「1秒間に30コマ」で区切って見ているということです。 これを別に「点滅限界」といい、電球の点滅を1秒間で30回以上にしますと我々はそれを点滅として認識することができなくなります。映画のフィルムなどはこれを基に1秒間で24~30コマ辺りに設定されています。これにより我々は、スクリーンに映った俳優の演技をスムースな運動として楽しむことができます。 この30msといいますのは人間の目の分解度の限界です。このため、我々にとって運動といいますのは元から30コマに区切られたものになります。ですから、映画のフィルムやテレビなどで同様の条件を満たしてやるならば、そこに文句の付けられない動画を再現することができるというわけです。そして、このように実際に存在しない運動がスクリーンやテレビに作り出されることを「仮想運動」といい、プログラムによってディスプレーに映し出されるドット画が動いて見えるのもこれと全く同じことです。 URLにありますリンゴの中身は一定の速度で同じ方向に動いています。ですから、この辺りですと多少数が多くとも予測機能などによってそれを運動として捉えることができます。では、恐らく質問者さんがお作りになったランダム・ドットといいますのはこれとは違い、それが何時、何処に現われるのか全く予測が付きませんので、速かったり数が多かったりしますと、脳がそれを処理できなくなってしまうのではないでしょうか。しかし、質問者さんはそこに輪郭が感じられたと仰います。だとしますならば、運動としては認識されていませんが、そこに何らかの「変化」は知覚されているということになると思います。 このURL説明は、何故それが動いて見えるかではなく、どうして動くもの、変化のあるものの形が見えるのかということですよね。 これに関しましてまずひとつは、視覚といいますのは感覚であるため、変化のないものには何れ麻痺して慣れてしまいます。あるいは、特に注意は払われません。ところが、そこにひとたび動きが表れますと、感覚系を中心に活動が活発化され、注視という状態になります。これにより、変化のあるものが対象、そうでないものが背景という識別が必然的に行われることになります。 自然界で動くものといいますならば、それは敵か獲物と相場が決まっていますよね。ですから、それを即座に対象と認識するこの機能は、我々動物にとってたいへん重要なものです。 例を挙げますと、ヤマネコといいますのは500m先の獲物を探し出すことができます。ところが、動きがありませんと背景と識別することができません。つまり、相手が動いてくれませんとどうやっても見付けることができないのであります。 また、トビやタカなどの猛禽類も高空から小さな獲物を見付け出します。ところが敵も然る者、小動物の中には空にその姿を見ますとそのまま硬直して動かなくなってしまうというのがいます。これは、怖くて竦んでいるのではなく、下手に動くと見付かってしまうために本能的に身に付いた習性と考えられています。 話を元に戻しますが、質問者さんのもうひとつの疑問は、どうしてそこに形という情報が生み出されるかということですね。 動くもの、変化のあるものが対象として認識されるというのは只今ので良いと思うのですが、これでは何故その形が見えるのかというのに説明が付けられません。と言いますのは、我々の視覚路といいますのは脳内で以下の二系統に分かれています。 「背側路:頭頂葉空間座標に運動の情報を連絡する(運動認知)」 「腹側路:側頭葉TEO野に色形の情報を連絡する(形状認知)」 このように、運動と形状はそれぞれ別の連合野で認知処理されており、視覚路に関しましては何処の解剖学の教科書を見ても昔からそう書かれています。ですが、そうなりますと何かおかしいですよね。 ところが、URLの実験ではサルが変化を知覚したとき、運動を処理する頭頂葉ではなく、形状を扱う側頭葉に活発な反応を示す部位が発見されたということです。ということは、背側路の運動情報は頭頂葉だけではなく、形状認知を行う側頭葉にも送られているのではないかということになります。そして、このURLにはっきりと紹介されている経路図が取りも直さずそれです。では、これがどういうことかと言いますと、形状を扱う側頭葉に背側路からの運動情報が入力されるため、ここで初めて「運動する物体の形状」という認知が可能になるということだと思います。 因みに「水平細胞」といいますのは網膜内で水平に連結しているという解剖学的な名称です。この細胞はRGBとは無関係で、明暗(コントラスト)連絡において抑制に働き、余分な情報を処理することによって輪郭を鮮明にするという役割を担っています。ですから、ここでは特に時間的な変化といいますのは処理されていません。 これまで述べました通り、このような運動差異などの認知処理といいますのはもっと中枢の方で行われており、果たしてこのURLの実験では、その根拠となる事実がまたひとつ確認されたということですね。