ラズパイ って何だべ~? 私設 基板実験室

地元東松島市のイベントや、パソコン・ラズベリーパイの実験報告しています

ラズパイ3 とWordPressのブログサーバーで  プラグインCount per Dayの訪問者数が多過ぎると思った問題

 

 

はじめに

Raspberry Pi 3 とWordPressで構築した自前のブログサーバーで経験したことです。

訪問者数のカウントをプラグインCount per Dayで行う場合、ちゃんと設定しないで放置していたら、たくさんの訪問者が見えてびっくりした、お話です。

 Count per Dayとは

f:id:masa19569810303:20181121013419p:plain

  Wordpressで、たくさんの人に使われている、訪問者数カウント機能の無料プラグインです。閲覧ページ数や発信国も見え、わかり易く1ページにまとめてあり、良く出来ています。

カウント数に問題?

ただし、以前から、訪問者数が、幾分多く出ているのでは?と思う現象がありました。

f:id:masa19569810303:20181121005528p:plain

 原因は?

自前のサーバーに、毎日、平均30人の訪問者数とのことでしたが、Googleのアナリティクス(訪問者数と広告などをカウントするツール)と比較しても、カウントが多い傾向でした。ところが今週の日曜日に、一日の訪問者が60人を超えました。この増え方は異常では?と思い、プラグインCount per Day統計データをじっくり見直ししました。

すると、

f:id:masa19569810303:20181121011044p:plain

なんと、ブラジルや、中国、ロシア、インド、イランなど、外国の訪問者数があって、日本の訪問者の2倍以上もありました。さらに調べて行くと、これは、BOT(検索ロボット、クローラーとも言う)の仕業だったようです。

訪問者数が多い原因は、このBOTの数が含まれていたためでした。

BOT数を何とか対策したいと思っていたところ、プラグインCount per Dayの設定で対応が可能ということが、下記ブログで分かりました。

対策は設定で解決

 uzu-official-style.com

記事通りに、カウントの除外条件にBOTと海外から発信を除外するだけで良かったです。(下記)

f:id:masa19569810303:20181121171440p:plain

 

 

 訪問数のBOT除外には、無視するBOT欄に、下記BOT名を追加します。

Acoon
ask.com
BecomeJPBot
BecomeBot
Baiduspider
BaiduImagespider
bot
butterfly
Crowsnest
crawler
e-SocietyRobot
FlipboardProxy
facebookexternalhit
findlinks
feed
Googlebot-Image
Googlebot
gooblog
Hatena::BookmarkAcoon
ICC-Crawler
ichiro
ia_archiver
Jakarta Commons
JS-Kit
larbin
netluchs
Microsoft URL Control
MetaURI API
PostRank
Steeler
spider
search
snoopy
suchen.de
suchbaer.de
shelob
semager
such_de
TurnitinBot
Teoma
twieve
UnwindFetchor
validator
WWW-Mechanize
xenu
YodaoBot
Yahoo-MMCrawler
Yeti

 

 海外の(BOTを含む)訪問数カウント除外の指定を、Excude Counturiesに入れます。

 

 is, ie, az, af, us, vi, as, ae, dz, ar, aw, al, am.ai, ao, ag, ad, ye, gb,
io, vg, il, it, iq, ir, in, id, wf, ug, ua, uz, uy, ec, eg, ee, et, er, sv,
au, at, ax, om, nl, gh, cv, gg, gy, kz, qa, um, ca, ga, cm, gm, kh, mp, gn,
gw, cy, cu, cw, gr, ki, kg, gt, gp, gu, kw, ck, gl, cx, ge, gd, hr, ky, ke,
ci, cc, cr, km, co, cg, cd, sa, gs, ws, st, bl, zm, pm, sm, mf, sl, dj, gi,
je, jm, sy, sg, sx, zw, ch, se, sd, sj, es, sr, lk, sk, si, sz, sc, gq, sn,
rs, kn, vc, sh, lc, so, sb, tc, th, kr, tw, tj, tz, cz, td, cf, cn, tn, kp,
cl, tv, dk, de, tg, tk, do, dm, tt, tm, tr, to, ng, nr, na, aq, nu, ni, ne,
eh, nc, nz, np, nf, no, hm, bh, ht, pk, va, pa, vu, bs, pg, bm, pw, py, bb,
ps, hu, bd, tl, pn, fj, ph, fi, bt, bv, pr, fo, fk, br, fr, gf, pf, tf, bg,
bf, bn, bi, vn, bj, ve, by, bz, pe, be, pl, ba, bw, bq, bo, pt, hk, hn, mh,
mo, mk, mg, yt, mw, ml, mt, mq, my, im, fm, za, ss, mm, mx, mu, mr, mz, mc,
mv, md, ma, mn, me, ms, jo, la, lv, lt, ly, li, lr, ro, lu, rw, ls, lb, re, ru, ap

 

 これで、BOTと海外からの関係のない訪問数を除外し、現実の国内の訪問者数が出て来そうです。
また、”オンライン判定時間の設定”でも、訪問者かどうかの選別していが可能でした。(デフォルトは300秒です) 

 

今回の感想(ネット接続の脅威)

訪問者カウントの設定が、こんなにも奥が深いものだと分かりませんでした。人間かBOTかの判別方法もいろいろあるし。BOTで有名な、Googleの検索クローラーもあったり、それ以外にも、世界各国から、いろいろなBOTハッカー(もしかして)がやって来ていることを。各国に存在していることをプラグインCount per Dayで認識ができました。ハッカーがいるかも知れないので、記載内容には注意が必要。間違っても、個人情報やパスワードは投稿しないようにしたい。

今後は、このBOTのような、自動でWeb検索する仕組みがpythonのプログラムで出来そうなので、やってみようと思います。あくまでも統計・集計の目的です。 

今回はここまで。