- ベストアンサー
意味の無い日本語のブログ
はじめてこちらで、質問させていただきます。 (過去に類似の質問があるかと思って、検索・遡及したのですが、膨大でよくわからず、重複の時にはご容赦・ご指摘いただければ幸いです。) 最近、キーワード検索した結果、かなり上位に表示されたブログページに跳ぶと、日本語の文章の形態にはなっているものの、全く内容がおかしいページに行き当たることが多いのです。(昔の言葉で言いますと、「人工無能」的な無意味センテンスと言いますか・・・) 実例ではありませんが、たとえば 「○○さんが、□□駅で、逆立ちして××しているのは、すばらしいスペックで評価が高い。」 みたいな感じの、どう考えても、ありえないような内容のものを言っています。 どうも、重要キーワードで釣って、アフリエイトへのヒットや詐欺誘導しようとしている気配のものがあるようです。 で、ご質問事項は、以下の3点です。 1)この行為に対して、何か、固有の用語はあるのでしょうか。 (たとえば、「スパムブログ」とか、「意味無し日本語サイト」とか) 2)あまりに似た傾向のところが多いので、どうも、この行為を助長する、専用のツールがあるような気がするのですが、そうなんでしょうか? (もし、答える事が、この行為を助長するような懸念がある場合には 「はい」「いいえ」だけでもけっこうです。) 3)検索エンジン側は、この行為に、有効な対策を打ちはじめているのでしょうか?素人考えでは、かなり高度な文脈判断をしないと、この行為をリジェクトすることは難しく思えるのですが・・・。 どうもお読みいただきまして、ありがとうございます。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
自動記事作成ツールというのは今はやりですね。私もアフィリエイトをやってますので回答の中にはアフィリエイター擁護という気持ちもあると思いますが。 ツールはいろいろあります。自動のものは、無意味な日本語をつくるのがせいぜいです。人口無能にも及ばない。でも、それではグーグルアドセンスのような良質の広告を使えません。それに非効率な集客しかできません。そんな所を経由して物を買おうという人は稀ですから。母数が巨大になれば稀でも意味はありますが。 使っている人も多数いると思いますが、グーグルも翻訳の研究をやっており、翻訳は文脈判断に応用できる技術が含まれていると思いますから、そのうち意味の無いサイトは意味が無くなっていくと思います。今は検索スパム通報制度はありますが、グーグルは文脈まではみてないと思います。ヤフーは目視が入っているとよく言われます。順位が上がったサイトでも、中味がなかったら落とす。目視には限界があるので目の届かない所もありまが。それとグーグルは元々被リンクの多さを重視してますが特定の被リンクは数に数えないということをやってますね。 広告主も無意味なサイトに広告をだされるとイメージを損ないますから、審査を行っています。グーグルアドセンスは厳しいです。これは人の目が入ります。収益が出てきたところを中心に監視しているらしいという話もあります。他のアフェリエイトサービス会社も審査基準を儲けて広告を載せてよいかどうかを判断しているところが多いです。アドセンスを何とか使い続けたいと考える人は多いので、アドセンスのポリシーに違反する行為はやらない人も多いと思います。なんといってもアドセンスが一番で、初心者でも収入が得られ、上級者ほど大きな報酬がもらえる広告は他にはないですから。 効率よくアフィリエイトをやる人はこういう無意味な日本語のものを使うより、記事を書くこと自体、外注してます。アフィリエイトが目的の広告宣伝行為なんだけれども見た人にもそれなりには意味のあるサイトを作ることで人をあつめ、グーグルのコンテンツマッチ広告でその人が欲しがっていた情報やサービスを提供する会社への橋渡しをやる。それに記事提供サービスというのもあります。ライターにあるテーマにそって、意味のある内容の記事を書いてもらって、提供を受けるのです。それを元にしてアレンジして自分のサイトで使う。 ばらばらで見つけにくくなっている情報を求めている人を自分のサイトに集めて興味を持ちそうな所に誘導する。アフィリエイトでしっかり稼いでいる人というのは、多くの人が求めている情報だが、ネット上であまり整理されていない情報を見つけて、人を集められるようにして広告主側へサービスや情報の提供をゆだねるということをやっている。(専門性の高いサイトの人もいれば、最低限のレベルの情報を作ってあとは広告側にバトンタッチという人もいます。)
その他の回答 (4)
それが果たして検索スパムに当たるのかは、こちらも内容を見てみないことには判断を致しかねますが、Googleではこうした検索スパムに対して報告を受け付けています。以下がそのURLです。 スパムサイトの報告(正式名称ではありません) ttp://www.google.co.jp/webmasters/spamreport.html また、Yahooでも同等の対策を取って入る様です。以下がそのURLです。 Search Spam Report(英文) ttp://help.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam 今後、何かしら迷惑かけている疑いのあるサイトを発見したらこちらの方にご報告をお願いいたします。
補足
ご回答、どうもありがとうございます。 ご紹介のサイト、さっそく拝見してきました。 Googleも、YAHOOも、しっかりした作りで 「検索スパム」に対応しているようなので、 (意外でもあり)感心してしまいました。 わたしも、サイトやブログをやっているので 「スパムメール」は、日々数100通来るもんですから ウイルス対策の方へ、毎日10通づつくらい登録して いるんですが、 サイトやブログの「検索結果がスパム」だった時には (検索内容が、後ろめたかったり、秘密事項だったりして) いまだかって、 「検索エンジン側に連絡しよう!」 などとは、思ったことがありませんでした。 ご指摘のように、やはり、重要なことですから(私に限らず) みんなが、積極的に、検索スパムを登録・訴えていかないといけないな~! と考えを新たにしたところです。 どうもありがとうございました。 と思った次第です。
- Muller3
- ベストアンサー率81% (800/979)
>Googleなどで、どう対策がとられているのか? 専門的な知識はないのでわかりませんが、技術的な手法については推測の域を出ないのではと… 以下参考になるかは?ですが、 サーバーやブログサービス全体をバッサリ除外してしまうとか手荒いやり方もするみたい(以前、FC2ブログでGoogle八分、ロリポはYahooの検索エンジンに反映されなくなったことがあった模様)ですし、サービスを提供する側も検索エンジンに嫌われないように、目を光らせてはいるようですが…(サーバーに負荷がかかる、ということもあるんでしょうけど) フェイクブログの温床になっているseesaaブログの規約改正記事:http://info.seesaa.net/article/7364746.html 以下禁止行為引用**** 自動的にアカウントを登録、ブログを作成、記事を投稿、コメントを投稿、トラックバックを行うなどのプログラムなどの準備または設置および行為 **** まあ…いたちごっこですよね…
補足
専門的なコメント、ありがとうございます。 大変参考になりました。 仮に「スパムブログ」と、この手法を呼んでも よさそうですが、使っておられる「フェイクブログ」 の方が、実態をよく表しているような語感・ フィーリングがありますね? FC2では、Google八分があったんですか! それは、ブログ存亡の問題ではありますね! 御指摘のseasaaの規約記事を読むと 1)登録を、よくみかける、数字画像を読み取る手動認証をする 2)登録用APIの安全性強化 というものですね?! かなり強力な手法には思えますが、そこに金儲けの手法 があるかぎり、破られるのが世の常でもあるわけで? ま、極論すれば、プロキシいじりながら、人海戦術で、 手動で1日中登録していれば、いくらでも登録できる わけでしょうし・・・ そのうち、自然画像のなかから、6桁の数字を抜きだして 読み取るソフトを作るなんていう豪の者も出てきそうな気が・・・。 わたしたちのような、1つのブログに、毎日1件づつくらい 地道に書き込んで、ときどき、Googleの上位にヒットすると とてもうれしく思う、なんていう「普通の」ブロガーにとっては ブログを金儲けに使うこと自体に、違和感があるんですけどネ~!。 この問題って、検索サービスとブログサービスの関係自体 を考えるべき部分があるんだな!ってのが実感できました。 そうゆ~意味では、GoogleやYAHOOのブログサービスには、 そこのあたりにの手法開発にガンバッテ欲しいと期待して しまうわけですネ。 どうもありがとうございました。
- Muller3
- ベストアンサー率81% (800/979)
検索で引っかかるととても腹が立つので、私も気になっていたので調べていました… 「CNET Japan Blog - 渡辺隆広のサーチエンジン情報館:コンテンツ連動広告で稼ぐ人々(1) - MFAサイトとは?」 http://blog.japan.cnet.com/takawata/a/2006/11/_mfa.html こちらの記事が参考になるかと思います。
補足
情報、どうもありがとうございます。 参照サイトを拝見すると 1) 米国サイトには2000~5000円で、 キーワードを入力すると、ブログやRSSフィードを検索して それらの文章を組み合わせ、キーワードランクの高そうな、 検索エンジンには見分けられない、一見日本語らしい文章 を生成するソフトがある。 これは自動的に行われ、毎日数千ページを作ることも可能。 2)これら無意味なページは、検索結果に釣られてやってきた 人間が、ほんのチョットの確率で、「コンテンツ連動広告」を クリックしてくれることを期待して作られている。 なんせ、母数が膨大なので、確率が0.1%でも利益に結びつく。 3)通常これらのページは、ページランクが低いので、検索下位に なり、問題にならないが、ブログに限っては、全体で一つのサイト である形式が多いため、ページランク判定が健全に機能せず、 上位にランク されてしまうことが多い。 ということですね。 だいたい分かりました。 今現在、Googleなどで、どう対策がとられているのか?が まだ、よくわかりませんでしたが、類似性などの手法を組み あせているんでしょうネ?
「翻訳ページ」 ってことじゃないですかね 元サイトを翻訳ツールを通して表示してるみたいですよね そういうことじゃないんでしょうか それ以外にも検索ワードを使って 「○○をお探しなら!」とか「○○の品揃え豊富」っていうのも多いですが(実際には○○はそのサイトにはない)
補足
さっそくのお答え、ありがとうございます。 たしかに、外国人の方が、何かやろうとして、翻訳しただけのページで、この傾向ってありますね。(自分が翻訳したときもきっとそうに違いない・・・と思ったりします。) ただ、ちょっと気になるのが、「○○さん」が、有名人だったり芸能人だったりして、明らかに意図的にヒットを狙っているようなものが多いんですが、なにか意図的なものを感じてしまいます。 まるで、キーワードを指定すると、適当な日本語文章を、ランダムに発生しているような・・・とでも言いますか。 更になにか情報がございましたら、よろしくお願いいたします。
補足
ご回答、本当にありがとうございます。 そして、ご専門でなくてはわからないような、長文で詳細な、御文を いただきましたお手間、本当に感謝いたします。 特に、以下の3点がよく理解できました。 1)けっして、検索エンジン側が努力してなわけではないこと 2)善良なアフィリエイタの方々は、散在する情報を収集し まとめることで、データベース型のサイト等を構築していること。 3)「記事を外注して、物量的・効率的?にやっておられる方も いる」等の現状。 ありがとうございました。 この件とは、微かにベクトルがズレるのですが、 SIXBOW様も触れられておられるように > 専門性の高いサイトの人もいれば、最低限のレベルの > 情報を作ってあとは・・・ のところは、最近気になっております。 良いサイトにあたらず、ウィッキペディアや専門サイトの内容を 箇条書きにしただけのような場所・・・が多いこと・・です。 できるだけ、生データ、一次データに近い情報に当たりたい 場面で、いつまでたっても、Google検索結果並の 「他人のふんどし程度の、薄い情報・リンクの渦」 から抜け出せない!というジレンマは、私だけでなく、 多くの方々が経験していることではないでしょうか? 本当に、ご情報・ご意見が賜れて幸いでした。 どうもありがとうございました。