• 締切済み

python解説本の機械学習サンプルコードについて

pythonの本巻末近くで総集編として機械学習のサンプルコードが示されることが多いと思います。 私もその辺まで学習をすすめてきたのでやってみると、思うように動作しません。 pythonのコードではコード中からネットにアクセスしてファイルをダウンロードするということのようです。実際にやってみるとサイトからファイルをダウンロードできない(ホストが応答しない)と表示されます。サイトが現存することは確認しました。データもありそうです。サイト更新等の確認も必要ですが、そもそもpythonのコードがどうなっているのかということです。関連する部分は以下の2行のようです。 from sklearn import datasets, ... ... mnist = datasets.fetch_mldata('MNIST original', data_home='.') ... ...の部分はほぼ関係ないと言えると思います(printとかですから)。これだけでサイトのURLとかデータの情報(ファイル名とか)が言い尽くされているとは思えないのですが。'MNIST orijinal'というところに対応したURLを手入力するってことなのでしょうか。scikit-learnのdatasetsと言うものが裏側でダウンロード情報を持っており、それが実体と齟齬を生じているということでしょうか。 pythonはライブラリとかを使うのでそれを呼び出して進めていくのですが、このようなやっても動かないという問題にすぐ遭遇するし、自分で全くエディットしていないので(つまりある意味ひとまかせ)、対処が分かりずらいということにもなるのでしょうか。 よろしくお願いします。

みんなの回答

回答No.2

いろいろお察しします。(こちらのことはお察しください・・・) とりあえず、このへんご参考にならんでしょうか。 https://github.com/YutaroOgawa/Deep-Reinforcement-Learning-Book/issues/4 取り急ぎ。

skmsk1941093
質問者

お礼

回答ありがとうございます。以下雑感なのですが、これだけ本やサイトが乱立し、環境も進化し、ユーザの背景も千差万別、深層学習の御大のシステムもどんどん更新していくと、解説書・解説サイトにちょこちょこと綻びがでるのは仕方がないと思っています。そのことを挙げてアマゾンで批判されているのを見ることがありますが、私はあまり気にしません。それよりも目線が読者側に立っているかどうかは大きいと思っています。多分この辺でつっかえるとかの見通しです。読者としては頭の中でやっていることが大雑把にでもマッピングができて、あの辺はここだな、みたいなことがわかるようになりたいと思います(大雑把にわかりたい)。機械・深層学習はすべてpythonのライブラリ(?)の中身を見せない状態でただ(正しく)呼び出して使ってくれっというのばかりだと思います。こちらの意図(使用者)と受け側(作成者)の意図が違うということはないということは信じるしかないのですが。いつもこれ、正しく使えているのかな?という不安を払拭できません。話がそれてしまいました。すみません。

  • f272
  • ベストアンサー率46% (8477/18146)
回答No.1

from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784', version=1,) のようにfetch_openmlを使ったらどうですか?

skmsk1941093
質問者

お礼

回答ありがとうございました。今、ここでは確かめられないので帰宅してからやってみます。 このような変更はネット上に出ているのでしょうか。正誤表とかみたいな感じで。どうでしょうか。

関連するQ&A