●江戸(出典:知恵泉161115)

  • 豊臣秀吉・徳川家康は小田原城の北条市氏を破る
  • 豊臣秀吉により徳川家康は東海地方から関東地方に鞍替え
  • 豊臣秀吉が徳川家康に対し江戸に居を構えることを指示
  • 水路を作る
  • 関ヶ原の戦いで徳川家康が勝つ
  • 日比谷入り江を埋め立て
  • 1607江戸城完成
  • 人口100万へ
  • 天海僧正:京都を上野に作る
    • 比叡山(寛永寺)(江戸城の鬼門にあたる)、大仏殿、清水寺、琵琶湖、竹生島

●「Wi-Fiミレル」(アイ・オー・データ機器)

  • スマホアプリ。無線LAN環境を計測できる電波状況確認ツール。「Wi-Fi混雑チェッカー」を機能強化し、名称を変更した。

 

■ハフモデル(Huff Model) (参考)パスコ社のHP、古田さんの話1608)

  • 消費者がある店舗で買い物をする確率
    • 大きな店舗か近い店舗か
  • お店が消費者を引っ張り込む割合=吸引率
  • 吸引率={Aの売り場面積/(居住地と店舗Aの距離)^λ}/∑(店舗iの売り場面積)/(居住地と店舗iの距離)^λ) 
    • λ:修正ハフモデル(日本の現状に合わせたもの)は2を使用
    • 売り場面積:店舗の魅力度(駐車場台数、品揃えなどでも可)
    • 距離:道路ネットワークデータ(運転時間又は道路距離がよりよい
  • 可視化例(パスコ社)
    • あるメッシュの吸引率が、店舗A=60%、店舗B=30%、店舗C=10%の場合、60%に相当する色を濃淡で表示
    • T:人により異なるのではないか→どのようなモデル又は評価指標となる?
    • T:薄いところは他の店舗に行く確率があるということ
    • T:ヒートマップに似ている
  • クラスター分析(k-means法)などで分析する方法もある
  • 図書館の分析でハフモデルの分析ができるかも

 

 

■コミケ帰りに寄れる風呂マップ

 

●使えるアプリ

  • 野外調査地図 ←フィールドワークに使う?

 

■埼玉県の推計人口 

  • 埼玉県オープンデータポータルサイトで「埼玉県推計人口」と入力

 

■国土数値情報

  • 行政区域→埼玉県
  • これで、埼玉県各市の行政界データが得られる

 

※行政界:

  • 行政区画の境。
  • 都府県界、北海道の支庁界、郡市・東京都の区界、町村・政令市の区界など。
  • ①標準地域コード(5ケタ)が割り振られている。
  • ②行政コード(都道府県コード(2ケタ)、市区町村コード(4ケタ))が割り振られている。
※メッシュデータ
  • 1次メッシュ:80km四方、4ケタ
  • 2次メッシュ:5km四方、2ケタ (8×8に分けた)
  • 3次メッシュ:1km四方、2ケタ (10×10に分けた)
  • 1/2メッシュ:500mメッシュ
  • 1/4メッシュ:250mメッシュ
  • 1/8メッシュ:125mメッシュ

 

 

 

 

 

 

 

 

■オープンデータ

  • オープンデータチャレンジ(LODチャレンジ)2011年度~(慶応・情報環境・荻野研究室)
  • アーバンデータチャレンジ東京(東京大学・生産技術研究所・関本義秀)
  • オープン・ナレッジ・ファウンデーション・ジャパン(OKFJ)(2012~)
  • Code for Japan (2013~)「ITコミュニティの形成・運営を通じて、地域課題を解決する」
  • 「税金はどこへ行った?」
  • 「ちばレポ」
  • 「鯖江の消火栓」
  • 「福岡市交通危険個所マップ」(住む場所の危険度を知る)
  • 「5374.jp」(いつ、どのゴミが収集されているか)

 

 

 

■行動履歴

  • 広義:購買履歴(どのサイトで何を買ったかのデータ)
  • 狭義:歩行軌跡

■ビッグデータ

  • データが多いといろいろなことがわかる
  • アンケートよりデータの精度が高い(対照:自己申告、アンケート)

 

■データ分析のポイント

  • データの個票、パネルデータであると、相関分析等が行いやすい。 
  • excel file の検索: filetype:xls

■広島県の水害(2014秋)

(2014.12.7 報道ステーション:検証・広島土砂災害 見落とされた警告)

  • 市街化区域の指定:住宅の建設を制限できる、防災という視点はなかった、区域は年々拡大
  • 土砂災害防止法:警戒区域を指定、土砂災害危険個所50万個所
  • 広島県の土砂災害計画区域指定 年間1200個所、3万個所の指定は時間がかかる
  • 土砂災害防止法改正で、指定前でも公開できるようにした
  • (個人の財産に影響を与えるもの=住民の方の理解が必要)

 

■先行研究のチェック

  • (例)日本地域政策学会
  • ・ツイッターのピークは22時~23時30分

■Pontaカードによる分析

  • 年齢、性別、地域別の分析
  • リピート率が高い商品=そのために来店している
    • 例:あんこやのたい焼き、ブランパン(カロリーが低いパン)
    • 男性やシニアの人は同じものを買い続ける(女性は移り気)
  • 全体の2割の客が8割の売上をもたらしている

 

■各時間帯、各曜日で売れるものは何か?

  • 早朝:おにぎり(シーチキンマヨネーズ)、缶コーヒー
  • 朝:レギュラーコーヒー
  • 午前:肉まん、からあげ、ブレンドコーヒー
  • 昼前:から揚げ
  • 昼:おにぎり、からあげ、
  • 昼過ぎ:から揚げ
  • 15時:ブレンドコーヒー、シュークリーム
  • 16時~19時:から揚げ
  • 20時:から揚げ、ツインシュー
  • 0時:タバコ、おやつカルパス
  • 深夜:おにぎり、缶コーヒー(ジョージアエメラルドマウンテン)

■ヤフーの検索データの分析

  • どの県で検察が多いか
  • どの日に検索が多いか(事件が起きた日、テレビに出た日)
    • 夏休みはに検索が多い用語:自由研究、金魚すくい、金魚の買い方、水着、花火大会、読書感想文
    • 休日:公園などの検察が多い ← 検索結果から動向を知る
  • T:気温と売上の関係を見ればよい(気温データを使う)
    • カレーは夏に食べたくなる
    • カレーは週末に食べたくなる
  • 第2検索ワードは? カレー ⇒ ひき肉、残り、リメイク
  • T:補完物に相関はあるか? 代替物に負の相関があるか?
  • 県による検索ワードの違い:ものもらい=めばちこ=めいぼ

■tsutayaのデータから

  • AのDVDを借りた人は、どんなDVDを借りたか?

・埼玉県はinternaviの急ブレーキデータからの対策を行った

・買い物客の動きを分析(株式会社ミディー)→品物棚の並べ方(手に取って戻らされたもの)

・インフルエンザの予測

  • インフルエンザの発生件数とインフルエンザ、解熱剤、高熱という用語の検索数から相関を見る

・遺伝子情報から病気の可能性を探る

 

 

 

【想定される分析(例)】

 

 

■消費増税前後で女子大生の購買行動に変化はあったか?

 

  • 仮説:変化があった
  • 理由:増税前に次のような変化があった。
    • 買う量や金額が増えた
    • コンビニではなくスーパーで買った
    • 高価なものを買った
    • 日持ちするものを買った
  • 一人暮らしほど(日頃の購買額が大きい人ほど)、以上の傾向が強い?
  • 増税前なら安いからと1ランク上の化粧品を買った?

 

 

■買いだめをした人はどんな人?

 

  • 仮説:高年齢層ほど買いだめをした
  • 理由:高年齢層は可処分所得が大きいためそのように行動する余力がある

 

  • 毎日の購買額のグラフを年代別に作る
  •  (20代、30代・・・・のグラフを1枚のグラフにする)
  •  
  • 3月1日の購買額
  • 3月2日の購買額
  • ・・
  • 4月30日の購買額