きっかけ
ブログが謎のサイトにコピーされたので対処しておいた。
たまたま、サイトのドメイン(b.0218.jp)をGoogleで検索したところ、コピーサイトを発見した。
ブログが謎のサイトにコピーされたので対処しておいた。
たまたま、サイトのドメイン(b.0218.jp)をGoogleで検索したところ、コピーサイトを発見した。
コピーサイトは、単に本文がコピーされたというよりも、サイト全体のレイアウトがそのまま模倣されている。これはスクレイピングと呼ばれる技術で、ウェブサイトのデータを自動で取得する手法を使用している可能性があった。
また、こちらのブログの新規投稿が、コピーサイトにもすぐに反映されている。さらに、CSSやJavaScriptなどのリソースも直リンクで利用されている。
コピーサイトのURLは以下のような形式になっている。
https://コピーサイトのドメイン/b.0218.jp/~.html
いくつかの対応方法を検討したが、以下の理由で実行には至らなかった。
根本的な解決にはならない。
コピーサイトがリソースの直リンクを避ける対策をした場合、再び同じ問題が発生する。
この方法も、コピーサイトが名称変更に追従してくるため、効果が薄いと考えられた。
労力をかけすぎるのもバカらしいので、簡単な方法で対処することにした。具体的には、自サイトのドメインでない場合にリダイレクトを行うスクリプトを実装した。
switch (location.hostname) {
case 'localhost':
case 'b.0218.jp':
break;
default:
location.href = 'https://b.0218.jp/';
break;
}
このコードでは、まずhostname
を取得する。localhost
または自サイトのドメイン(b.0218.jp
)でない場合、強制的に自サイトのURLにリダイレクトする仕組みだ。このように、簡単な対応策でコストを抑えつつ、効果的にコピーサイトへのアクセスを制限できる。
Googleに対して、著作権侵害による削除申請を行うことも可能である。
著作権侵害による削除から、Googleの著作権侵害フォームに通報しておいた。
通報して数週間経つが返事はまだない。
Googleから返事がないまま、パクりサイトが消えた。