NetScrander » Posts for tag 'データ'

週刊e-Reportの作り方(購読RSSフィードを公開します)

 ドラゴンフィールドが毎週木曜に発行しているメールマガジン「週刊e-Report」の編集発行を担当しています。その中で、好評を博しているのが、e-Report冒頭のニュースダイジェストというコーナーです。これは先週のe-Report発行後から、今週のe-Reportの発行までにIT系ニュースサイトに掲載された、各ITニュースの中で「お!これはチェックししておかねば!」と僕が感じたニュースを毎号30個ほど紹介しているコーナーです。

 他にも、「お!これは興味深い」と感じたブログ記事を紹介する「blog clip」や、1週間の間に発表された統計データ系のニュースを紹介する「データダイジェスト」もあり、これら3つのコーナーを見るだけで、IT界隈の流れがなんとなーく把握できます(たぶん)。

今回はそのニュースの集め方をご紹介したいと思います。

 ニュース収集作業で使っているのは、RSSリーダーだけ。
 RSSリーダーといっても色々ありますが、僕が使っているのは「フレッシュリーダー」。サーバーインストール型のRSSリーダーで、自分のサーバー(このブログのサーバです)に置いてます。会社、自宅、実家、出張先とどんなところにいても、ブラウジングが出来る状況であれば閲覧できるメリットは大きいです。

 以前は、Headline-Readerも使っていましたが(いまだにRSSリーダーとしてはこれが一番使いやすいと思う)、PCにインストールするタイプなので、自宅と会社のPCにそれぞれインストールしなくてはいけない、RSSフィードの同期が取りにくい(できないことはないけど)、PCがクラッシュするとかなり悲しいことになる、などの理由から乗り換えました。ちなみに、フレッシュリーダーに落ち着くまで、10個くらいのRSSリーダーを使っています(Bloglines、Livedoor Reader、といったメジャーどころから、ThunderbirdやSleipnir、海外のRSSリーダーまで色んなタイプ試した)

 フレッシュリーダーを使うもうひとつの理由。それがブックマーク機能です。Livedoor Readerの「ピン」と同等の機能だと思うのですが、気になった記事を次々とブックマークしていきます。一日に何百と流れてくるRSSフィード情報の件名だけをかなりスピードで流し読んでいき、ブックマークを付けていきます。そしてあらためてブックマークを見直して、良かった記事はそのまま残して、そうでもなかった記事はブックマークから削除いきます。そして1週間分の記事をまとめて、e-Reportに掲載します。

 「大事なニュースを見逃すんじゃない?」と心配される方もいると思いますが、ほとんどの場合、心配要りません。
 たしかに見逃すことも無くは無いのですが(そんなに無いけど)、有益な記事であれば、必ずどこかのソーシャルブックマーク(SBM)に捕捉されます。では、「SBMだけを追っかけていればいいんじゃないの?」と思う方もいると思いますが、僕のように仕事としてニュースを集めるというのでもない限りそれで充分だと思います。僕の場合、SBMでスルーされている記事に光を当てたいという思いがあり、SBMに100%頼っていないというだけですので。

 そんなわけで購読している各ニュースサイト・ブログのRSSフィード約420個を公開します。
 sitelist.xml
(右クリックで保存してください)

 ITとは関係の無いフィードも混じっていますが(競馬系のやつとか)、そのまま公開します。カテゴリー分けされてますが、これも相当適当です。

 また、GoogleやMicrosft Live Searchの検索結果RSSフィードもありますが、これは「オープン」でブログ検索した結果のRSSフィードです。僕が手がけている「WEB FLASH」は企業サイトのリニューアル情報を掲載しているのですが、その情報収集のために「オープン」という検索キーワードで検索をかけて、いち早くサイトの公開情報を掴もうと試みています。とはいえ、Webサイトのオープン情報が引っかかってくることが少ないので、検索キーワードを見直すべきでしょうね。 

たまひよ2007名前ランキングは壮大な釣りなのでスルー

たまひよ2007名前ランキング

 今年生まれた子供の名前ランキングがベネッセから発表されてます。
 もっとも調査対象が、「たまひよの直販商品をご利用いただいたお客様」ということで、実際の戸籍データに基づいた統計データではない、ということはまず注意しておきましょう。

 んで、気になるランキングなんですが、

  男の子 女の子  
1位 大翔(ひろと) 陽菜(ひな) 1位 
2位 悠斗(ゆうと) 葵(あおい) 2位
3位 颯太(そうた) さくら 3位
4位 翔太(しょうた) 結衣(ゆい) 4位
4位 蓮(れん) 結菜(ゆいな) 5位
6位 悠人(ゆうと) 美羽(みう) 6位
6位 優斗(ゆうと) 凛(りん) 7位
8位 優太(ゆうた) 美優(みゆ) 8位
8位 大輝(だいき) 優奈(ゆうな) 9位

他にも、24位「流生(るい:流浪するみたいでイメージ良くなくない?)」、29位「心音(ここね:普通に「心音」って医療用語があるので微妙じゃね?)」、83位「昊(そら:こういう漢字があることを初めて知った。夏の空という意味らしい。パッと見、臭みたいだけど)なんて、眩暈がしそうな名前がズラズラと並んでいます。いいのか、これ?

 さて、1位からして読み仮名を振ってもらわないと読めない名前なんですが、本当にこういう一発で読めない名前が増えたら嫌だなぁと個人的に思います。語感重視で、文字に込められた意味をないがしろにしてるような感じがしてちょっとね。

 ちなみに、このランキングを見ると、実は男の子1位の名前でも、占有率は0.69%、女の子1位は0.87%しかありません。つまり1位の名前といえども、100人に1人いない計算になります。1学年に1人くらいは大翔君がいるかなぁくらいの占有率ですね。90位くらいになると占有率0.1%程度で、1,000人に1人いるかなぁくらいの占有率になってしまいます。

 1位から90位くらいまで足しても占有率は20%程度ですので、どんだけ名前が多様化してるんだよ、という感じですね。こういうときって、上位2割が全体の8割を占める、みたいになるのが常なのに。なので、このランキングを見て、DQNっぽいネーミング多くない?と嘆いている方はご心配無用です。(もっとも残り80%に、90位くらいまでの名前が可愛く見えるほどのとんでもないDQNネームが隠されている可能性は否定できませんが)

 かく言う僕の名前は、4月10日の春ド真ん中に産まれたんで、正春、
 まさに春!ですわ。・・・安直すぎないか、親よ。でもまぁ、この名前で嫌な思いをしたことないんで、その点では親に感謝しています。

疑問が多いWeb制作会社ランキング

・総合ランキング
 http://tokyo.web-db.info/?cid=41495(WEB制作会社を評価採点するウェブ制作データバンク)

 ゴールネットが運営している「WEB制作データバンク」で、制作会社ランキングを発表している。
 親会社が3位にランクインして、それはそれでありがとうございます。

 だがやはりこのランキングはいかがなものか。
 キャンペーンサイトもコーポレートもいっしょくたに評価対象にされているが、それは明らかにおかしい。打率が1割のピッチャーに対して、お前はバッティングがダメだ!って怒るのと一緒で、的外れもはなはだしい。打率が評価の対象になるのは野手であり、投手は勝利数や防御率が問われるべきだろう。

 103位のソニックジャムが制作した「UNIQLOCK」は、W3Cで0ポイント(100ポイント)、ユーザビリティ10ポイント(0ポイント)と低評価だが、「UNIQLOCK」はフルFlashのキャンペーンサイトであり、W3Cに準じる必要はまるで無い。ユーザビリティも同様。もし話題性という項目があれば100点に近い点数を得られるはずである。

 それでは逆に評価項目の「SEO」「W3C」「ユーザビリティ」が全て高得点であれば、それは良いサイトなのだろうか?

 僕はそう思わない。
 サイトの良し悪しは、課せられた当初の目的をいかに果たしているか、という一点に尽きる。IRサイトのようにステークホルダーに対して出来うる限り情報を開示することを課せられているサイトは、当然ユーザビリティは重要となるが、SEOは必須ではない。永続的なプロモーションをしたい場合には当然SEOは重んじるべきだが、W3Cに囚われる必要は無い。

 このように、課せられる目的が異なれば、重要視する項目も変わる。
 SEOとW3Cとユーザビリティを等価値にしている時点でこの調査は破綻しているといっていい。

 100位以下でも、良い制作会社があるのを知ってるし、このランキングに影響される人がいないことを切に願う。

#ページ下部に「Copyright (C) 2004-2007 lolipop Some Rights Reserved.」ってあるけど、ロリポップは何か関係しているだろうか?

ずさんな統計データに振り回されない

・Eストアー調査 「グーグルな人、ヤフーな人」  第1弾 “友達”何人いる? 「グーグルな人」の10人に1人は“友達いない” その数「ヤフーな人」の2倍以上!
 http://v.japan.cnet.com/news/release/story/0,2000067550,00024239p,00.htm(CNET Japan)
・主婦や事務職はYahoo! JAPANを、経営者はGoogleを使う/検索サービスの利用に関する調査
 http://web-tan.forum.impressrd.jp/e/2007/11/20/2236(Web担当者Forum)

 仕事柄、ネットでのニュースをこまめにチェックしているのですが、たまに「ん?」と首を傾げたくなるニュースに行き当たります。時期を同じくして、Yahoo!とGoogleのユーザー属性に関するニュースを目にしたのですが、Eストアーのデータの杜撰さはありえないレベルですね。Eストアーの調査では、

【Q:あなたにとって、仲良しの「友達」は何人いますか?】
上記質問について「0人」と答えた「ヤフーな人」は4.4%、「グーグルな人」は9.8%となりました。 また、「20人以上」と答えた「ヤフーな人」は2.0%だったのに対し、「グーグルな人」は0%でした。

 と言う結果になったので、「グーグルな人の10人に1人は友達いない」という結論に持っていってます。キャッチーなこと言いたいだけなんじゃないの?って邪推する気持ちを押さえて、もうちょいチマチマと突っ込んでみます。

 まず「調査対象者:全国の12歳以上の男女412名」とありますがその内訳を明らかにしていないので、「ヤフーな人」が若年層と年配者ばかりで、「グーグルな人」がビジネスマンばかり、ということだって充分に 有り得る訳です。「Web担当者Forum」の記事では、「主婦や事務職はYahoo! JAPANを、経営者はGoogleを使う」という傾向が出ているらしいですし、回答者の属性を明らかにすることなく同列で語っても仕方の無いことです。

 属性が偏っていれば違えば答えも変わってきます。「あなたにとって、仲良しの「友達」は何人いますか?」という設問に対して、ビジネスマンと小学生では「仲良しの友達」の捉え方が異なってくるはずです。回答者によって捉え方が変わってくる設問はやはり調査の信憑性に欠けます。
 ネタとしては面白いですが、釣られないように注意しましょう

・「モバゲータウン」利用者が「GREE」超える【第30回:モバイル調査】
 http://japan.internet.com/allnet/20071120/5.html(japan.internet.com)

 もいっこ、「ん?」と思った調査。「モバゲータウン利用者がGREE超える」っていまさら?って思ったら調査対象が「10代3.23%」ということでなるほどと合点がいった。モバゲータウンと言えば、ユーザーはほとんど10代、いってもまぁ20代前半までという偏った属性を持っている。なのに、10代の回答者が3%そこそこでは、モバゲーの勢いはデータに表れにくいでしょうね。

追記(11月27日)

・ヤフーユーザーはグーグルユーザーより若く、しかも既婚者が多い?
 http://japan.cnet.com/marketing/story/0,3800080523,20361860,00.htm(CNET Japan)

Yahoo! 検索ユーザーの方がグーグルユーザーよりも若く、そして既婚率が高い–このような傾向がEストアーの調査で明らかになった。同社は先週にも、ヤフーユーザーとグーグルユーザーの友達の数を比較するユニークな調査結果を発表したばかりだ。今回はその「ヤフーな人、グーグルな人」調査の第2弾となる。

 これは記事内容がおかしい。「発表したばかりだ」どころか、これは明らかに第1弾のときのデータを流用しただけでしょうよ。
 第1弾のときは、こういったユーザー属性を隠した上で、Googleユーザーは友達が少ない、って言ってたわけで、このデータを見るとたしかに、先に述べた通り偏った結果が出て然るべきのユーザー属性になっている。だって20代以下のユーザー数なんて、Yahoo!はGoogleの倍ですよ。友達の数も変わってくるわ、そりゃ。

 本来であればこういったユーザー属性を明らかにした上で、比較しなくてはいけないはずなのに、そういった必須情報は隠して、あろうことか、別データのごとく見せかけて発表しているわけです。悪質極まりない。やり方が姑息。呆れてモノが言えないですよ。

実測気温主義でお願いします

今年は近年稀に見ぬ猛暑の年です。ほんと暑過ぎ。このままいったら、12月には50度を超えるんじゃないのかなぁ、なんてベタな漫才トークを繰り広げてみました。

最高気温35度だの、40度だの言ってますが、あれってどこまで信じていいんですか?
アスファルトの照り返しなんて、半端ないですよ。

弊社ドラゴンフィールド事務所の窓からは、大手町にある気象庁が見下ろせます。気象庁のビルからちょいと離れたところに、ひろーい芝生があって、その真ん中に百葉箱が置かれています。

テレビのお天気情報で、「東京・大手町 ××度」って出るときはその百葉箱のデータが元になっているんですが、高いビルに囲まれているので、午後からは日陰になってたりして、そんな涼しげな環境の百葉箱で測られている気温って、全然現実的じゃないよなぁ、と常々思っています。

ビル群のド真ん中の焼けたアスファルトの上に置いてこそ本当の気温と言えるんじゃないのか。
本当の気温が知りたい!

© 2008 NetScrander is powered by WordPress