トップ(最新) | <前

nDiki : 統計

統計

スポンサード リンク

Related term

2002年6月8日 (土)

14:00 お買い物 このエントリーを含むはてなブックマーク

新宿へ。

@ 「エーゲ海に誘われて」

昨年、新婚旅行ギリシャに行ってきた。 エーゲ海のミコノス島・サントリーニ島へ行ってきてとても良かったのだが、案外この地を写した写真集って見かけない。 「現地で買ってくれば良かったなぁ」とも思うのだが、実際現地でぷらぷら眺めたのだけれどいい奴なかったんだよね。

紀伊國屋書店を覗いたら「野矢慶記写真集 エーゲ海に誘われて」東方出版 ISBN4-88591-741-7 というのを発見。 結構希望していたイメージのもので、お値段もリーズナルブルなので入手。

@ 「すぐわかる統計用語」

東京図書 ISBN4-489-005220-9。 易しくまとめられた、事典っぽい統計の本。 各語に英訳がついているのが嬉しい。 プログラムを書く際の識別子のための辞書引きって結構大変だから。

@ マジシャン

伊勢丹のおもちゃ売場の手品コーナーにマジシャンがいましたよ。 子供の頃は近くだった博品館によく通っていたのだが、ここにもマジシャンが常駐していたんだよね。 その後いなくなったみたいだけど。 子供ながらに、からかってみたりして楽しんでいたんだけど今だに健在だったようでちょっぴり嬉しい(別人だろうけどなんとなくね)。

スポンサード リンク


[ 6月8日全て ]

2004年1月17日 (土)

[ WiKicker ] 「最近のアクセスログ」処理思案 このエントリーを含むはてなブックマーク

今のところ WiKicker 自体にはアクセスログ機能はなく、Apache のそれに頼っている(NaneyOrgWiki ではサーバ側で combined log を提供していないので別途自前で、似非 combined log を吐かせている)。

1日毎程度のアクセス統計チェックはこれでまぁある程度済むのだが、それとは別に瞬間的なアクセス状況を知りたい時がままある。 特にサーバの負荷が上がりつつある時は

  • 特定のホストから連続的なアクセスがないか?(ロボットなど)
  • 特定のページのリクエストが一時的に増えているのでは?(ドラマ放映終了直後など)
  • 特定の訪問者がリロードしまくってないか?(チャット等と勘違いして)

などをチェックしたい。 ロボットのアクセスがひどい場合は早急にはじく必要があるし。 しかし、生アクセスログの目視チェック(+grep etc)では限界がある(wiki のURIはページ名がエスケープされているからパッと見どのページかわからないし)。

ということで、直近のログを簡単にチェックできるような機能を検討。 まずはログをどこに取るか。 複数のCGI プログラムのプロセスから、ガシガシ書ける必要有り。

  • 普通のファイル
  • daemon
  • mmap
  • 共有メモリ

あたりか。 直近の数百アクセスだけあれば良く、逆にそれ以上のログはばんばん破棄したいのだが何が一番いい実装かなぁ。

シンプルに普通のファイルに append するのが一番楽だが、ログが増えると tail を取るのが遅くなるだろうし、ログを切り詰めるのも面倒。 PerlTie::File を使うとファイルの各行を配列要素に見立てて push、 unshift、splice ができるのだが、やはり切り詰めに時間がかかりすぎる。

使えそうなモジュールがないかいろいろCPAN検索して、とりあえずどんどんビルドしてみる(サーバの Perl5.005_03 なので、目的にあっても使えないかもしれないし)


[ 1月17日全て ]

2004年5月18日 (火)

www.naney.org のアクセス統計停止 このエントリーを含むはてなブックマーク

ディスク容量などの問題から、www.naney.org 上で1日1回行っていた analog での統計処理を停止。 www.naney.orgインストールしてあった analog や logkf 等を削除。

一旦、統計処理はローカルで行うようにするつもり。 ローカルで統計処理したものを定期アップロードするかは未定(まぁ見る人もあまりいないと思うので)。


[ 5月18日全て ]

2004年5月21日 (金)

AWStats 6.0 このエントリーを含むはてなブックマーク

www.naney.orgアクセスログをローカルにもってきて統計解析をするのに、今回は analog ではなく AWStats を使うことに。

以前 www.naney.org に入れてみた時より、随分使いやすくなった感じ。

@ セットアップ

Debian パッケージを入れた後、awstats.naney.org というバーチャルドメインをローカルのApacheに用意(/var/www/awstats.naney.org)。

 Alias /icon/ "/usr/share/awstats/icon/"

も設定に追加しておく。

ファイルレイアウト:

 /var/www/awstats.naney.org/
  |
  +-- .htaccess
  |
  +-- awstats.conf  <-- 作成
  |
  +-- awstats.pl    <-- コピーしてきて一部修正
  |
  +-- cache         <-- DNSキャッシュ用 (まだ未使用)
  |
  +-- data          <-- データを保存
  |
  +-- plugins       <-- プラグイン
       |
       +-- wikicker.pm <-- /wiki/(.*).html を $1 で表示するプラグイン(自作)

awstats.pl はパッケージのものをコピー。DecodeEncodedString の中で Jcode.pm を使って文字列を UTF-8 に変換するように修正。

ローカル用なのであまり気にせず DocumentRoot の下にもりっとファイルを置いておく。

awstats.conf はこんな感じ。

 LogFile="/path/to/downloaded-log/access.log"
 LogType=W
 LogFormat=1
 LogSeparator=" "
 DNSLookup=2
 DirData="./data"
 SiteDomain="www.naney.org"
 HostAliases="localhost"
 DNSStaticCacheFile="cache/dnscache.txt"
 DNSLastUpdateCacheFile="cache/dnscachelastupdate.txt"
 URLWithQuery=1
 URLReferrerWithQuery=1
 LevelForWormsDetection=2
 ShowWormsStats=1
 LoadPlugin="wikicker"
 ValidHTTPCodes="200 304 -"

ValidHTTPCodes の '-' というのは、本来不要。自前のSSIで似非 Combined Log を生成する際に '-' を出力する事があるので追加。

日本語もきちんと出るしいい感じ。 指定した月ではなく、指定した日のログを見れるといいのだが設定すればできるようにならないかな。

analog と違ってプラグインが使えるのが良い。 Perlスクリプトだから、その気になれば簡単に awstats.pl 自体を変更する事もできるし。

今回は ShowInfoURL 用プラグインを書いて、/wiki 以下のURLの際は unescape して PageName を表示するようにしてみた。

その他いろいろ遊べそう。


[ 5月21日全て ]

2004年12月7日 (火)

モンドセレクション の謎 このエントリーを含むはてなブックマーク

モンドセレクション(MONDE SELECTION)は現在、年間どれぐらいの商品がエントリしどれぐらいの商品がメダル(賞)を獲得しているのだろう?

統計データも、受賞リストもまだ探し出せていない。


[ 12月7日全て ]

2005年2月13日 (日)

Bloglines に巡回先の一部を集約 このエントリーを含むはてなブックマーク

最近急に巡回・チェック先が増えてきてしまった。 挙げてみると

その他もろもろ。

さすがにちょっとしんどくなってきた。 とりあえず RSS まわりを集約したい。 今は Sage を使っているのだけど、未読管理がいまいちうまくできていない。

ということで遅ればせながら Bloglines に登録。 RSSが取れるものはできるだけこちらに集約。

さて、これで巡回が楽になるのか。 それとも巡回先が増えるだけなのか。


[ 2月13日全て ]

2006年8月22日 (火)

統計情報を維持したままファイル/ディレクトリを移動する amaroK スクリプト Move このエントリーを含むはてなブックマーク

久しぶりに amaroKインストール・起動して音楽をかけてみる。 現在はすでに安定版で AAC 形式ファイルの中のタグに対応しているので、普通に Debian パッケージインストールして使うことができる。

amaroK では再生回数やスコアなどの統計情報がデータベースに保存されており、これらを条件に設定したスマートプレイリストを作成できる。

しかし残念なことに、ファイルの場所を移動してしまうとこの情報を引き継ぐことができなかった。 このため一旦あるディレクトリに曲を保存すると移動させるわけにいかないのでちょっと不便であった。

もしかしたら最近はこれらをうまく扱えるのではと調べてみたところ、amaroK スクリプト Move がこれに対応していることを確認。

[ツール]->[スクリプトマネージャ]->[他のスクリプトを取得] で Move をインストールし実行しておくと、曲の上での右クリックメニューに Move というメニュー項目が追加される。

これを使うとその曲やその曲を含んでいるディレクトリを、別の場所に移動すると同時にデータベース上の統計情報を維持するように書き換えてくれえる。

これは便利。


[ 8月22日全て ]

2006年10月26日 (木)

Web 解析サービス Google Analytics を申し込む このエントリーを含むはてなブックマーク

昨年無料サービス開始時には申し込みが殺到して新規登録を一時中止したという経緯があった Google Analytics、当時はそのうち試してみたいと思っていたのだが気がつけばもうすぐ1年だ。

アクセス解析を見るのは結構楽しいもので、周期的に見たいという衝動がくる。 analog やら AWStats やら自作やらで過去にもいろいろ解析してみた経験がある。

会社でも最近アクセスログ解析が話題になっているし、www.naney.org 用に Google Analytics に申し込んでみた。

解析を取りたいページの最後に JavaScript を埋め込むタイプの解析で、404 であったりその他のリソースのアクセス数のチェックには向かないものの、その分 Web サーバアクセスログ解析では得られない統計を得ることができる。

レポートの種類は豊富で、最初は「あのレポートは、どれだっけ?」と何度もいろいろ見直したりしなければならないぐらい。

アクセス傾向が分かるようになるので、重点的に内容を充実させるべきページを把握してサイトを改良していきたい。


[ 10月26日全て ]

2007年4月6日 (金)

Twitter のアカウントを作成して、今何をやっているかを晒す このエントリーを含むはてなブックマーク

しばらく前から話題になり始めている Twitter のアカウントを作成してみた。

以前初めて Twitter のサイトを訪れた時には、何だか知らない人の1行メッセージが並んでいるだけに見えて(実際そうなのだけれども)「ふーん」という感じだった。

知っている仲間が使い始めると、チャットよりはユルく、 AIMSkype などの1行コメントよりはコいコミュニケーションツールとして面白く使えるのかもしれない。 大学仲間の雰囲気が似合いそうなサービス。

自分の場合は、Blog のエセライブカメラを補完するアクティビティ晒し用として使うのがまずは良さそう。 ということで、nDikiサイドバーに Badge を貼ってみた。

今していることを変えるたびに入力するのって、ある意味作業記録をつけているようなものだな。 統計とか取れるようになるとと Life Hacks 的には面白いかも。


[ 4月6日全て ]

2007年11月18日 (日)

Google Analytics から TSV エクスポートしてキーワード詳細をチェック このエントリーを含むはてなブックマーク

Google Analytics で得られるキーワード情報で遊んでみようと思い、ちょっとその辺り触ってみた。

キーワードレポートを表示した後、Web ブラウザで今表示しているページの URL に末尾に&limit=50000 を追加 (公式ブログ参照)した URL のページを表示させて、次にエクスポートから TSV 形式でレポートを取得。

で、簡単なスクリプトで処理してキーワードを眺めてみた。

Google Analytics のページ上だと、現在このサイトのキーワード1位は「スーベレーンm400」。 ここにあがってくるのはキーワードの組み合わせによる順位なので、一旦バラしてみる。

そうすると結果はperlが1位。 最近そっち系の記事は減っているのだけれど、いちおうまだまだ主にコンピュータ関連のキーワードで検索されているようである。

個別に見てみると「-楽天」「-楽天市場」「-rakuten」「-yahoo」「-amazon」「-2ch」あたりもちらほら見かける。 検索結果の上位が通販ページで占められて、なかなか欲しい情報に辿りつけないことも実際多い。それらをうまく外したいという思惑だろう。 ちなみに自分は主要な通販サイトやオークションサイト を CustomizeGoogle でフィルタリングしてしまっている。

not 演算子って自分のサイトでどの語が嫌われてリーチしなかったかわわからない(当然アクセスしてこないから統計にあがらない)から、共有できると面白いとは思うんだけれどもな。

それと Google Analytics のエクスポートは API はないのかな。メールで定期的に送ってもらうことはできるので、設定すれば自動的にローカルでスクリプトにかけることはできるといえばできるのだけれど、こちらから簡単に取りにいければもっと嬉しい。


[ 11月18日全て ]

Related web page

統計のパラドックス | Okumura's Blog
どこかで見た<strong>統計</strong>のパラドックスの最小例を作ってみた(1..nの乱数を8個生成して,パラドックスが生じる最小のnの例を一つ見つけた)。 次の表は,教授法A,Bで合格者o,失格者xの数を示したものである。男女合わせて集計すれば6/11&lt;5/9でBが優れるが,男女別に集計すれば3/4&gt;4/6,3/7&gt;1/3でいずれもAが優れる。「人数が少ないから」は関係ない(全部の数値を1万倍しても同
http://oku.edu.mie-u.ac.jp/~okumura/blog/node/2254
1000年後、日本人は埼玉に1人 厚労省統計
厚生労働省が発表した人口<strong>統計</strong>によると、このまま人口減が続いた場合、3006年(平成1018年)には日本人は1人しか残らず、3106年(平成1118年)までに日本列島から日本人が消滅するおそれがあることが明らかになった。 厚生労働省が今月まとめた「わが国の少子高齢社会<strong>統計</strong>」によると、初めて人口が自然減となった今年2006年(平成18年)を境に
http://www.f7.dion.ne.jp/~moorend/news/2006022401.html
嘘には 3 つの種類がある。 嘘、真っ赤な嘘、そして統計である。
おおげさなタイトルでまぎらわしくて申し訳ない。 いや、Google Sitemapsにログインして<strong>統計</strong>情報を見ていたら、右下にこの格言が書かれているのに気がついた。 右下の赤でマルした部分には、次のように書かれている。 嘘には 3 つの種類がある。 嘘、真っ赤な嘘、そして<strong>統計</strong>である。 — Benjamin Disraeli (1804-1881)、イギリスの政治家 サービスとして<strong>統計</strong>情報を出しているけど、鵜呑
http://neta.ywcafe.net/000525.html
「いんちき」心理学研究所 | 『正しい統計データ』を使ってウソをつく方法
●少年の強盗件数が急増している まず、少年の強盗検挙件数のデータを見てみましょう。 少年の強盗件数 この<strong>統計</strong>データから分かることは、20年以上も横ばいだった強盗件数が近年になって、一気に急増したということです。 昨今の少年は凶悪な殺人を犯さなくなりましたが、その代わりに実利目的の強盗へとシフトしました。これは「お金こそ全て」という価値観が大人だけ
http://psychology.jugem.cc/?eid=48
ハンバーガー統計学にようこそ!
この教材は、早稲田大学人間科学部eスクール(通信教育課程)のために開発したものです。それを一般公開しますので、どうぞお役立てください。 下のメニューに従って1章から7章まで順番に学習していくと、平均から分散分析までを習得することができます。大学の卒業論文レベルで使う<strong>統計</strong>学として、きっと役立つことでしょう。なお、相関(相関から因子分析まで)につ
http://kogolab.jp/elearn/hamburger/
YappoLogs: 統計的手法?で人気がでるURLを予測するサイトを作った
はてなブックマーカーランキング - Ceekz Logs 国内のソーシャルブックマークは、はてながシェアトップだと思うのですが、そのユーザーのがんばり度をランキングにしてみました。 をみて何か物足りないなぁと思ってたわけですよ。 そう、がんばってる人のランキングが見れるんなら、その頑張る人達の集めたクリップを見たい! 小難しくいうと「人気の出るURLをいち早く察知す
http://blog.yappo.jp/yappo/archives/000285.html

■よく検索されるキーワード

perl(47) windows(44) 提案書(43) ドラマ(39) cvs(36) debian(31) linux(27) ほぼ日手帳(27) torrent(24) x31(24) 書き方(23) 使い方(23) サンプル(23) ganttproject(20) java(19) wiki(18) thinkpad(17) tc-1(17) 壁紙(15) アジェンダ(15) 作り方(15) ノート(14) 動画(14) usb(14) アジェンダとは(13) google(13) 手帳(12) ヨドバシカメラ(12) subversion(12) apache(12) ウォーターボーイズ2(12) インストール(11) ssh(11) フリー(11) centos(11) 2008(11) 影舞(11) c#(10) 画像(10) 秋葉原(10) svn(10) rcs(10) 日本語(10) リフィル(10) ほぼ日(10) tortoisesvn(10) 修理(10) ボールペン(9) cgi(9) 本名(9) ポーター(9) dvd(9) usbメモリ(9) クラリチン(8) web(8) 2009(8) a6(8) make(8) ヨドバシ(8) ubuntu(8) truecrypt(8) gtd(8) 設定(8) 写真(8) so905ics(7) ガントチャート(7) activeperl(7) 万年筆(7) 無料(7) svn+ssh(7) 冷蔵庫(7) ツール(7) バッグ(7) porter(7) gantt(7) project(6) firefox(6) scons(6) eclipse(6) flash(6)

この日記のはてなブックマーク数 Add to Google RSS

Process Time: 0.193392s / load averages: 0.60, 0.57, 0.55
nDiki by WATANABE Yoshimasa (profile)
Powered by DiKicker
Base theme by Nana (for tDiary)