先日、本サイトでアクセス解析で正しいトラフィックの集計を妨げる「リファラスパム」の除外設定方法を紹介しました。
「リファラスパム除外」
私自身もこのブログを開設してしばらくは、設定をしないままでだいぶトラフィックを乱されました。
今回は、リファラスパム除外設定後の状況と、実際に施したフィルタリングを紹介します。
除外設定前と設定後の変化
グラフを見て分かるとおり、設定後はリファラスパムからのトラフィックはまったく無くなりました。
除外設定は正規表現のコードで設定していくので、コピペで使い回しできるよう、コードをまとめておきます。
リファラスパムフィルタ用正規表現コード
正規表現でのフィルタリングはトップレベルドメイン毎に設定していきます。
フィルタ名はご自由に、フィルタの種類をカスタム→除外→参照と設定して、フィルタパターンにコピペしていきます。
リファラスパム.com系
(sanjosestartups|ilovevitaly|theguardlan|free-share-buttons|forum\.topic61784245\.darodar|editors\.choice61784245\.hulfingtonpost|googlsucks)\.com
リファラスパム.ga系
(youporn-forum|pornhub-forum|depositfiles-porn|rapidgator-porn)\.ga
リファラスパム.info系
buy-cheap-online\.info
リファラスパム.me系
youporn-forum\.uni\.me
リファラスパム.org系
generalporn\.org
正規表現で除外できないスパムへのフィルタリング
中には上記の設定方法で除外できないスパムも存在します。
それらに対しては、以下のようにブラウザ、言語設定が「not set」のパターンに一致した時に除外するよう設定しておきます。
ひとまず上記の設定をしておけば今のところ完全に除外が確認できていますが、今後新たなスパムが出てくるであろうと思うので、こまめにチェックして更新をかけていく必要がありますね。