WordPressのプラグインでbot対策&著作権侵害対策(2)Blackhole for Bad Bots

Blackhole for Bad Bots-2

はじめに:

漫画村問題で議論となったサイトブロッキングですが、採用するか否か以前に、インターネット上で他人の著作物を悪用する行為を防ぐための仕組みが追い付いていない事が、一番の問題ではないでしょうか。

そこで前回から、受信者ではなく「発信者側」のサーバーで出来る自衛方法として、「ボット」による悪質なアクセスを拒否する方法を掲載しています。

 

ボットといえば、GoogleやYahooのように、検索エンジンとして有用なボット(別名:クローラー、スパイダー)もありますが、コピー行為を営利的・継続的におこない、サーバーに負担をかけるような大量のアクセスを行う悪質なボットも存在します。

こちらとしては、robots.txtと呼ばれる専用の文書を設置して、アクセス禁止ファイルやクロール頻度などルールを指定しておけるのですが、ボットによってはまったく従ってくれないこともあります。

そこで今回ご紹介するのは、「立ち入り禁止」と事前警告しているファイルに再三侵入しようとするボットを、ブラックホール(仕掛け)に落として今後一切拒否する方法です。

検索エンジン用のGoogle、Yahoo、Bingなどのボットはブロックしません。robots.txtとBlackhole for Bad Botsプラグインを使用します。海外サイトから得た情報に日本語訳をつけました。 

目次
1.Blackhole for Bad Botsとは
2.導入方法
3.設定方法
4.類似プラグインとの干渉:今のところ無し

 

1.Blackhole for Bad Botsとは

2018年4月現在、このプラグインは日本語に翻訳されていません。
https://ja.wordpress.org/plugins/blackhole-bad-bots/の英文を訳して載せておきます。
訳がこなれていない部分はご容赦下さい。

説明

悪質なボットのためにあなた自身の仮想ブラックホールトラップを追加してください。 Blackholeプラグインには、ページへのリンクが隠されています。

次に、robots.txtファイルに、隠れたリンクをたどることを禁止する行を追加します。 ルールを無視または拒否するボットはリンクをクロールし、ハニーポットトラップに落ちます。

トラップされると、悪質なボットはあなたのWordPressのWebサイトへのアクセスをさらに拒否されます。

私はそれを「ワンストライク」ルールと呼びます。ボットはあなたのサイトのrobots.txtルールに従う機会が1回あります。 従わなかった場合、即時の追放が行われます。

最良の部分は、Blackholeが悪質なボットだけに影響を及ぼすということです。人間のユーザーは隠れたリンクを見ることは決してありません。良いボットは最初にルールに従います。 Win-Win! 🙂

キャッシングプラグインを使用していますか? 重要な情報については、「インストールに関する注意事項」を参照してください。

 

機能

  • セットアップが簡単
  • クリーンなコード
  • 集中的でモジュラー
  • シンプルで、余計な部分がない
  • 軽量、高速、フレキシブル
  • WordPress APIで構築
  • 他のセキュリティプラグインと連携
  • 悪いボットのリストを簡単にリセット
  • どのボットもリストから簡単に削除できます
  • ブラックホールのリンクには「nofollow」属性が含まれています
  • 設定画面で設定可能なプラグインオプション
  • あなたのサイトを保護するために舞台裏で静かに働きます
  • すべての主要検索エンジンをブロックしないようにホワイトリスト化
  • 柔軟性、パフォーマンス、およびセキュリティに重点を置く
  • ブロックされたボットのWHOISルックアップを電子メールで通知
  • [ヘルプ]タブを使用してインラインで文書化
  • 任意のIPアドレスをホワイトリストに登録する設定を提供
  • 悪いボットに表示されるメッセージをカスタマイズする
  • ワンクリックで復元するプラグインのデフォルトオプション

BadhotsのBlackholeは、不正なボット、スパマー、スクレーパー、スキャナー、その他の自動化された脅威からサイトを保護します。

WordPressを使用していませんか? Blackholeのスタンドアロン版PHPをチェックしてください!

今すぐ利用できるProバージョン»

 

ホワイトリスト

デフォルトでは、このプラグインは主要な検索エンジンをブロックしません。

  • AOL.com
  • baidu
  • Bingbot / MSN
  • DuckDuckGo
  • Googlebot
  • Teoma
  • Yahoo!
  • Yandex

これらの検索エンジン(およびその無数のバリエーションすべて)はホワイトリストに登録されています。 robots.txtルールに違反していても、サイトに常に完全にアクセスできます。 このリストは、プラグインの設定でカスタマイズできます。

 

Blackhole for Bad Bots

 

2.導入方法

1. 管理画面⇒プラグイン⇒新規追加
wp-plugin-maintenance-1

 

2.「プラグインを追加」画面が出るので、検索窓に Blackhole for Bad Bots と入力

Blackhole for Bad Bots-1

3. 「今すぐインストール」をクリック

Blackhole for Bad Bots-2

4. インストールが終わったら「有効化」をクリック

 

3.設定方法

管理画面⇒Blackhole をクリック

Blackhole for Bad Bots-3

1. Blackhole(仕掛け)の作成

(1) robots.txtを作成する

テキストエディタで作成できます。Windowsのメモ帳でもOKです。
robotsという名前で、テキスト形式(.txt)で保存して下さい。
robot.txtではありませんので、ご注意下さい。

※既にrobots.txtがある場合は、そのrobots.txtに追記して下さい。

(2)  robots.txt に2行を記述する

Blackhole for Bad Bots-4
↓ 記述するのは、黒背景の箇所に表示された次の2行です。

User-agent: *
Disallow: /フォルダ名(英語)/?blackhole

※WordPressをインストールしたフォルダ名になります。

(3) robots.txt をサーバーに設置する

FTPソフトまたはサーバーのFTP機能を使って、robots.txtをサーバーにアップロードして下さい。
robots.txt ファイルのアップロード先は、そのサイトのトップになります。WordPressだと、WordPressをインストールしたルート直下(例えばwp)です。

root-folder

FTPソフト等の使い方とアップロード方法は、下記記事で掲載しています。
初めてのワードプレス(10).htaccess/TeraPad/FTPソフト

robots.txtの作成と設置方法は、下記記事で掲載しています。
初めてのワードプレス(16)検索に表示したくない画像がある場合の対処法(robots.txtの作成と設置方法)

 

2.連絡先メールアドレスの設定

ブロックしたボットの詳細な情報を、メールで受け取ることができます。

チェックマークを入れておくと、入力されたメールアドレス宛に情報が届きます。標準設定では、WordPressで登録しているアドレス宛に情報が届くようになっています。
Blackhole for Bad Bots-5

3.警告メッセージの設定

ブロックしたボットに表示されるメッセージを設定できます。Default Message(標準)のままで構いません。

Blackhole for Bad Bots-6

 

4.ホワイトリストの設定

googlebot,bingbot,msnbotなどの検索エンジンがあらかじめ除外されています。不都合がなければ標準設定のままで構いません。IPアドレスの設定も可能です。

Blackhole for Bad Bots-7

 

4.類似プラグインとの干渉:今のところ無し

◆前回ご紹介した「StopBadBots」との干渉はありませんでした。

StopBadBotsは、あらかじめ2570以上のボットがリスト化されており、事前に網羅的にはじいてくれるプラグインです。併用をおすすめします。

◆All in One SEO Packの機能の一つ「悪意あるボットのブロッカー」との干渉もありませんでした。

All in One SEO Packは有名なプラグインで、使用している方も多いのではないでしょうか。「悪意あるボットのブロッカー」はStopBadBotsの簡易版のような内容ですが、設定が簡単で、主要なボットはしっかりはじいてくれている印象です。

※「悪意あるボットのブロッカー」と「StopBadBots」だけを併用しても干渉はありませんでした。ただしサーバーの消費メモリは上がりますので、ご注意ください。

 

関連記事(copyright/著作権

WordPressのプラグインでbot対策&著作権侵害対策(1)StopBadBots

amazonaws.comからの大量スパムをブロックする方法【知っておいたほうがいいサーバー対策・続編】

初めてのワードプレス(15)画像の直リンク禁止と自動コピーサイト作成阻止法(.htaccessで出来る盗用対策)

【画像無断利用から作品を守ろう!】COPYTRACKに登録してみました(1)日本語での登録方法

Googleに著作権侵害の申し立てをするときは「名前の公開」に気をつけて!~ブログ移転裏話その1