Google Analytics で得られるキーワード情報で遊んでみようと思い、ちょっとその辺り触ってみた。
キーワードレポートを表示した後、Web ブラウザで今表示しているページの URL に末尾に&limit=50000 を追加 (公式ブログ参照)した URL のページを表示させて、次にエクスポートから TSV 形式でレポートを取得。
で、簡単なスクリプトで処理してキーワードを眺めてみた。
Google Analytics のページ上だと、現在このサイトのキーワード1位は「スーベレーンm400」。 ここにあがってくるのはキーワードの組み合わせによる順位なので、一旦バラしてみる。
そうすると結果はperlが1位。 最近そっち系の記事は減っているのだけれど、いちおうまだまだ主にコンピュータ関連のキーワードで検索されているようである。
個別に見てみると「-楽天」「-楽天市場」「-rakuten」「-yahoo」「-amazon」「-2ch」あたりもちらほら見かける。 検索結果の上位が通販ページで占められて、なかなか欲しい情報に辿りつけないことも実際多い。それらをうまく外したいという思惑だろう。 ちなみに自分は主要な通販サイトやオークションサイト を CustomizeGoogle でフィルタリングしてしまっている。
not 演算子って自分のサイトでどの語が嫌われてリーチしなかったかわわからない(当然アクセスしてこないから統計にあがらない)から、共有できると面白いとは思うんだけれどもな。
それと Google Analytics のエクスポートは API はないのかな。メールで定期的に送ってもらうことはできるので、設定すれば自動的にローカルでスクリプトにかけることはできるといえばできるのだけれど、こちらから簡単に取りにいければもっと嬉しい。
Google Analytics から1日1回キーワードのレポートを TSV 形式でメールで配信するように設定している。 このデータをもとに「よく検索されるキーワード」を抽出して、nDiki の下の方に表示するようにした。
1日1回の作業なので、メールからスクリプトにかける部分とアップロードする部分は手動で。
そこそこの処理なので、そこそこの精度なのだけれど傾向は何となくわかる感じだ。
実際にはアクセスログの対象となっているのは nDiki 以外の www.naney.org 内のアクセスも含まれているけれどもまあいいであろう。
キーワードの処理は細かいことをいうと結構面倒だったりする。
などなど。
この辺りは精度を上げようとするといろいろ工夫の余地がって楽しそうではあるな。
最近 HiveQL クエリを実行して集計したりしている。 可視化は Google スプレッドシートで。 Google スプレッドシートは考察を一緒に書いておきにくい。
MkDocs で生成しているノートに一緒にチャートをおけるといいなと思って Chart.js をちょっと使ってみた。
MkDocs プラグインはなさそうなので、素で canvas 要素と script 要素を Markdown ファイルの中に書いて動かしてみた。
CSV ファイル (あるいは TSV ファイル / JSON ファイル) を読み込むようにできると管理が楽かな。
機会がある時にちょっとずつ使ってみよう。
Naney (なにい) です。株式会社MIXIで SNS 事業の部長をしています。
※本サイトの内容は個人的見解であり所属組織とは関係ありません。