■忘備録

  • 数量化 I 類による分析の例

    http://www.weblio.jp/content/%E6%95%B0%E9%87%8F%E5%8C%96+I+%E9%A1%9E%E3%81%AB%E3%82%88%E3%82%8B%E5%88%86%E6%9E%90%E3%81%AE%E4%BE%8B
  • 単相関と偏相関
  • ある事例
    • (x1、x2に与えられたカテゴリースコアに基づいて計算された)相関係数数行列
      •       単相関  偏相関
      • y~x1   0.89  0.92
      • y~x2    0.34      0.56
      • x1~x2           0.11
    • 重相関係数=0.93
    • 決定係数=寄与率=重相関係数^2 =0.86
      • 決定係数とは、モデルの当てはまりの良さを表す指標
  • アイスクリーム店の売上と気温(向後先生の例)
    •             単相関   偏相関
    • 売上と最高気温     0.87    0.97
    • 売上と最低気温     0.30    -0.89※  
    • 最高気温と最低気温   0.7
    • ※気温が低いと晴れているからマイナス
  • 類似性の分析方法
    • 量的×量的: 単相関係数=ピアソンの相関係数(いわゆる相関係数)
    • 量的×質的: 相関比 
      • 方法1
        • 相関比が0.3以上なら説明変数として採用 cf.目的変数に対し
        • 0.3以下であっても無相関検定で有意であればOK
      • 方法2
        • 平均値の差の検定を行い有意であればOK
      • 方法3
        • 分散分析を行う
    • 質的×質的: 独立係数=クラメールの独立係数=クラメールの関連係数
      • 説明変数同士の相関については、独立性の検定(χ2検定)を行う
    • (参考)分散分析とは?
      • 音楽を聴きながら試験勉強した群(A群)
      • 何も聞かずに試験勉強した群(B群)
      • 仮説:A群の方が試験の得点が大きい
      • F統計量=要因によって生じる差/要因では説明できない差(誤差)
  • 論文に何を書くか
    • 目的変数~各説明変数 単相関係数、偏相関係数の大きさ
    • 各説明変数の相関比の大きさ 無相関検定、平均値の差の検定
    • 各説明変数間の 単相関係数、偏相関係数の大きさ
    • 各説明変数間の独立性の検定

 

 

  • 常に追いかけ続けるチャレンジ精神
  • 「ある雨の日の情景」
    • みんなわかっているけどしかたないからカサをさしているのかも
    • そのようなことが世の中には多いかも
  • Excelで表示しているままコピーしたい
    • 範囲を選択 →alt + ;  →(右クリック)→コピー→(貼り付け先セルの選択)→貼り付け
  • Excelのピボットテーブルの更新
    1. ピボットテーブル(クロス集計表)ないのセル(どれでもよい)を1つ選択
    2. リボンの「ピボットテーブルツール」→オプション→データ→更新
    • ※1を行って→(右クリック)→更新 でもよい
  • Excelでの呼び名l  △直接入力 → ○セル参照
  • Excelで経過時間を計算する
    • 日単位での表示となる
      • 時間単位にするには 24 をかける
      • 分単位にするには 24×60= 1,440 をかける
      • 秒単位にするには 1440×60= 86,400 をかける

■論文の構成

  • ヒートマップも示す(歩く経路の可視化)
  • GPSでの分析の可能性について探る
  • 鳥かごと速度や分散の関係: 2番と 数~10番あたりを比べる= 道の広さ等の影響
  •  (※2番は他のルートからの合流もあるが)
  •  (スーパーの前は速度が遅い?)
  • (交差点手前のブロックでは速度調整がある(方向をふまえて計算)=手前では平均は速いはず、分散は大きいはず)
  • 人により環境条件の違いを見る(往路復路、雨の有無、人数、目標到着時刻の有無)
  • ※表に整理する
  • 雨だからゆっくり歩くという訳ではなさそう
  • 雨の日は早く行こうとする人と、ゆっくり行こうとする人が交差するので混雑要因となる
  • 3人だと遅れ1m/s程度となる(いずれの人についても)
  • ※他のクロスが考えられるのか?
  • 向きと同行者数のクロス 行きは同行者の有無で大きく速度が違うが、帰りはそれほどの差はない(No4はそうなっている)

 

■主に使うファイル

  • 150000歩行分析>151225通学路地図(OSM,2451).shp
  • 150000歩行分析>151231鳥かご(完成版).shp  =2451

 

■仮説と結果

  • (どの要因が大きいかを分析する)どうやる?
    • 例えば、自分だけ急ぎと友人がいるとどうなるのか? →これは出てこない
    • 例えば、飴で急ぎだとどうなる?
  • 人による違いを観察する
    • 人ごとに、どの要因による違いが顕在化したかを表にまとめる
  • No19 の結果(「分析」シート)から
  • ・行きの歩行速度は速い 
    • そうとは限らない(あまり差はない)No19
      • むしろ何人で歩いているのかによる?
    • その通り
      • No13
    • 人により行きの方が速い=程度の違いを描写しておく
  • ・多人数で歩く方が遅い
    • No19 → その通り。ただし、2人の方が3人よりも遅い場合もある
    • No13 → 1と2人はあまり変わらないが3人は遅い
  • ・雨の方が遅い  → その通り。雨はフランス庭園付近はより遅くなる?(仮説)
  •  目標がある方が速い(No13)

■手順

  ①鳥かご(ポリゴン)を作る

 

  • 道の上に等間隔の点を打つ (2点打ち→csvで保存→間の点を計算→描画)
  • ポリゴンレイヤーを作成し、等間隔の点を利用して長方形のポリゴンを描画する
  • ポリゴンにidをつける(正門を1番~ハックドラッグを13番)
  • 出力ファイル=鳥かご(完成版)2451,shp

 

②軌跡→2451,CSV

 

  • x、y座標付きcsv

        ③デリミテッドテキストファイルの読み込み

 

   ④名前を付けて保存 すなわち、CSV,2451→shp,2451

 

×②軌跡を2451に変換 ←× 時刻が日付レベルに下がってしまう

 

  • (通学路付近のデータだけを選択(地図上で選択しておく))
  • 2451(平面直角)座標系
  • 出力結果=shpファイル

 

×③軌跡を鳥かごで切り取る

  • ベクター→空間演算ツール→交差(=両方の属性が保存される)
  • 出力結果=shpファイル

 

        ⑤行軌跡(ポイント)がどの鳥かご(ポリゴン)に属するかを記録する

 

  • 参考:町丁字と小学校区の空間的な統合
    • ベクター→データマネジメントツール→場所で属性を統合する
    • 対象ベクタレイヤ: ポイント(軌跡)       町丁字重心
    • ベクターレイヤを結合する: ポリゴン(鳥かご)    小学校区
    • 出力shpファイル名を指定

   ⑥CSVファイルを出力(お疲れ様でした)  2451-csv-鳥かご-shp    →   2451-csv-鳥かご-csv

     

        ⑥Excel上で以下の操作を行う

  • timeのフィールをコピーし(time2)、時刻の書式で、秒単位までの時刻を表示
  • timeフィールドをtime1とし、日付を表示
  • 速度のフィールドを追加

  (○標識点からの各ポイントまでの距離を出す)

 

  ベクター→調査ツール→場所による選択

 

  • 中の建物を選択する = ポイントを指定
  • 交差する地物が中にある = ポリゴンを指定
  • それをshpファイルで保存する

 

 

  • ⑤鳥かご別の速度の平均、標準偏差を出す
    • (たしかに広い道では平均速度が大きい)→広さと平均速度の関係を求める

⑤歩行軌跡の方向を規定する

④の結果から、属性テーブル

 

 

 

 

■標準時から日本時間に変換する(UTC to JST)

  • GPSロガーの時刻はUTCとなっている
  • Excelで時差9時間を入れるフィールドを作り、9:00:00を各セルに入れる
  • 書式はユーザ定義でh:mmを選択
    • 時差
    • 9:00
    • 9:00
    • 9:00
    • ・・・
  • JST=UTC+時差

 

■歩行の方向を検出

  • 速度ベクトル(x、y)を考える
  • =ATAN2(x,y)*180/PI()
  • で-180~180が出る(+なら北、絶対値が90°より大きいなら西ということ)

■研究の目的

  • 歩行の様子の可視化 → 道幅による効果、混雑度による効果
  • 女子大通りの2つの信号の間の歩道区間は、人々の合流・分流が少ないので、傾向が出やすい

 

■速度の様子

  • 行の方が速い(○)
  • 晴れの日の方が速い(△)→交差点では、飴の日の方が速くなるかもしれない(仮説)
  • 単独の方が速い(○)

 

■加速度/速度の標準偏差

  • 2秒毎に記録したので、2秒間の変化の記録となる
  • 絶対値を使って変化の度合を調べることができる
  • ただし、GPSは、データの誤差があるので、それを拾っている可能性がある
  • 分散も加速度と似た指標になっているはず。
  • (仮説)行きの方が急ぎがちなので、速度の変化も大きいであろう 
    →たしかにそうだけど、あまり変わらなかった?

 

 

 

 

 

 

 

■ヒートマップの作成

  • 単バンド議事カラー、YIOrRd の色指定は以外と解りやすい 分類数は5でよい

 

 

■主な空間参照システム

  • 3857=WGS84/Pseudo Mercator:グーグルマップなど
  • 4326=WGS84=GPSロガーなど
  • 4612=JGD2000
  • 2451=平面直角座標系第ⅠX系

 

■グリニッジ時刻との差

  • 日本の時刻=グリニッジ時刻+9時間

 

■時刻の表示方法

  • date time型 →Excelでは、ユーザ設定、時刻、標準など切り替えて処理をしてみよう

■等距離線を描く

  • ベクター→空間演算ツール→バッファ

■標識点(大学真、ハック)からの距離をとり、速度を求める → 距離と速度の関係を表してみる