自作ホームページのアクセスログを分析してみた

注意事項

この記事を書いた時にはGoogle Search ConsolとGoogle Analyticsの存在を知りませんでした。
ただホームページにどれくらい人が来てくれるかを知りたいのであればこの2つのツールを使ったほうが幸せになれます。
Google Search Consolはサイトに来る人達がどのような検索ワードで検索かけているかやクリック率なども分かり、Google Analyticsではサイト滞在時間や直帰率などkibana(アクセスログ)では知りえない情報もたくさんあります。
特にWebサイト作成者側には値千金な情報です。(インフラ側でも役には立つと思いますが・・・)
何かしらの理由で上記が使えない(お客様サイトなのでアナリティクスを仕込めない)、あるいはすぐに本日分のログを分析する必要がある、リアルタイムで今攻撃されている、とかであればkibanaを使うかも知れません。

作業記録~kibanaでアクセスログ分析~

アクセスログを分析する練習と、純粋に自分のホームページにどのくらい人が来てくれているのか知りたくてやってみた。
まずは日ごとにローテートされているログファイルをひとつにまとめる。

cd <ログの保管場所>
cat access_log.202008* > /home/centos/knowledgehdoratokyo_access_log.20200801-09

このあと、kibanaをインストール済のサーバを起動させ、http:<ipアドレス>:5601にアクセスする。
「knowledgehdoratokyo_access_log.20200801-09」名でファイルをインポートする。

ログを開き、time, clientip, request, bytesあたりの情報のみを表示する。
続いてフィルタをかけていくのだが、まずは家のwifiのipアドレスやサーバ自身のipアドレスを排除、加えて66.とかから始まる、明らかに日本のグローバルIPアドレスでないものも排除。※いくつか見たがグーグルっぽい
https://ipvx.info/country/jp/range/
agureも使って日本以外のipアドレスも丁寧に排除していく。
そうすると結構絞り込まれてくるがまだ足りない。
/ のみにアクセスが来ているのも純粋なアクセスではないと思われるのでそれも排除。ブラウザでトップページにアクセスすれば、wp-なんちゃらというものも大量にリクエストされるはずなので。
また、/?p= で絞りこめば、実際に見られているコンテンツページを確認できる。

調べて分かったこと

1週間で3人のユーザが来ていて、1ページだけ見て帰っていたことが分かった・・・。
もうひとつあるブログサイトも似たような結果・・・。
まだまだ人気サイトになるには遠いようだ。
一応、Newの下にあるSaved Queriesってやつでクエリを保存しておいた。

次の記事

curlのお勉強