■忘備録
-
数量化 I 類による分析の例
http://www.weblio.jp/content/%E6%95%B0%E9%87%8F%E5%8C%96+I+%E9%A1%9E%E3%81%AB%E3%82%88%E3%82%8B%E5%88%86%E6%9E%90%E3%81%AE%E4%BE%8B
- 単相関と偏相関
- ある事例
-
- (x1、x2に与えられたカテゴリースコアに基づいて計算された)相関係数数行列
-
- 単相関 偏相関
- y~x1 0.89 0.92
- y~x2 0.34 0.56
- x1~x2 0.11
- 重相関係数=0.93
- 決定係数=寄与率=重相関係数^2 =0.86
-
- アイスクリーム店の売上と気温(向後先生の例)
-
- 単相関 偏相関
- 売上と最高気温 0.87 0.97
- 売上と最低気温 0.30 -0.89※
- 最高気温と最低気温 0.7
- ※気温が低いと晴れているからマイナス
- 類似性の分析方法
-
-
量的×量的: 単相関係数=ピアソンの相関係数(いわゆる相関係数)
-
量的×質的: 相関比
-
-
方法1
-
-
相関比が0.3以上なら説明変数として採用 cf.目的変数に対し
-
0.3以下であっても無相関検定で有意であればOK
-
方法2
-
-
方法3
-
-
質的×質的: 独立係数=クラメールの独立係数=クラメールの関連係数
-
-
説明変数同士の相関については、独立性の検定(χ2検定)を行う
-
(参考)分散分析とは?
-
- 音楽を聴きながら試験勉強した群(A群)
- 何も聞かずに試験勉強した群(B群)
- 仮説:A群の方が試験の得点が大きい
- F統計量=要因によって生じる差/要因では説明できない差(誤差)
-
論文に何を書くか
-
-
目的変数~各説明変数 単相関係数、偏相関係数の大きさ
-
各説明変数の相関比の大きさ 無相関検定、平均値の差の検定
-
各説明変数間の 単相関係数、偏相関係数の大きさ
- 各説明変数間の独立性の検定
-
常に追いかけ続けるチャレンジ精神
-
「ある雨の日の情景」
-
-
みんなわかっているけどしかたないからカサをさしているのかも
-
そのようなことが世の中には多いかも
-
Excelで表示しているままコピーしたい
-
-
範囲を選択 →alt + ; →(右クリック)→コピー→(貼り付け先セルの選択)→貼り付け
-
Excelのピボットテーブルの更新
-
-
ピボットテーブル(クロス集計表)ないのセル(どれでもよい)を1つ選択
-
リボンの「ピボットテーブルツール」→オプション→データ→更新
- Excelでの呼び名l △直接入力 → ○セル参照
- Excelで経過時間を計算する
-
- 日単位での表示となる
-
- 時間単位にするには 24 をかける
- 分単位にするには 24×60= 1,440 をかける
- 秒単位にするには 1440×60= 86,400 をかける
■論文の構成
-
ヒートマップも示す(歩く経路の可視化)
-
GPSでの分析の可能性について探る
- 鳥かごと速度や分散の関係: 2番と 数~10番あたりを比べる= 道の広さ等の影響
- (※2番は他のルートからの合流もあるが)
- (スーパーの前は速度が遅い?)
- (交差点手前のブロックでは速度調整がある(方向をふまえて計算)=手前では平均は速いはず、分散は大きいはず)
- 人により環境条件の違いを見る(往路復路、雨の有無、人数、目標到着時刻の有無)
- ※表に整理する
- 雨だからゆっくり歩くという訳ではなさそう
- 雨の日は早く行こうとする人と、ゆっくり行こうとする人が交差するので混雑要因となる
- 3人だと遅れ1m/s程度となる(いずれの人についても)
- ※他のクロスが考えられるのか?
-
向きと同行者数のクロス 行きは同行者の有無で大きく速度が違うが、帰りはそれほどの差はない(No4はそうなっている)
■主に使うファイル
-
150000歩行分析>151225通学路地図(OSM,2451).shp
-
150000歩行分析>151231鳥かご(完成版).shp =2451
■仮説と結果
-
(どの要因が大きいかを分析する)どうやる?
-
-
例えば、自分だけ急ぎと友人がいるとどうなるのか? →これは出てこない
-
例えば、飴で急ぎだとどうなる?
-
人による違いを観察する
-
-
人ごとに、どの要因による違いが顕在化したかを表にまとめる
-
No19 の結果(「分析」シート)から
-
・行きの歩行速度は速い
-
-
そうとは限らない(あまり差はない)No19
-
- その通り
-
- 人により行きの方が速い=程度の違いを描写しておく
- ・多人数で歩く方が遅い
-
- No19 → その通り。ただし、2人の方が3人よりも遅い場合もある
- No13 → 1と2人はあまり変わらないが3人は遅い
-
・雨の方が遅い → その通り。雨はフランス庭園付近はより遅くなる?(仮説)
-
目標がある方が速い(No13)
■手順
①鳥かご(ポリゴン)を作る
- 道の上に等間隔の点を打つ (2点打ち→csvで保存→間の点を計算→描画)
- ポリゴンレイヤーを作成し、等間隔の点を利用して長方形のポリゴンを描画する
- ポリゴンにidをつける(正門を1番~ハックドラッグを13番)
- 出力ファイル=鳥かご(完成版)2451,shp
②軌跡→2451,CSV
③デリミテッドテキストファイルの読み込み
④名前を付けて保存 すなわち、CSV,2451→shp,2451
×②軌跡を2451に変換 ←× 時刻が日付レベルに下がってしまう
-
(通学路付近のデータだけを選択(地図上で選択しておく))
-
2451(平面直角)座標系
-
出力結果=shpファイル
×③軌跡を鳥かごで切り取る
-
ベクター→空間演算ツール→交差(=両方の属性が保存される)
-
出力結果=shpファイル
⑤歩行軌跡(ポイント)がどの鳥かご(ポリゴン)に属するかを記録する
-
参考:町丁字と小学校区の空間的な統合
-
-
ベクター→データマネジメントツール→場所で属性を統合する
-
対象ベクタレイヤ: ポイント(軌跡) 町丁字重心
-
ベクターレイヤを結合する: ポリゴン(鳥かご) 小学校区
-
出力shpファイル名を指定
⑥CSVファイルを出力(お疲れ様でした) 2451-csv-鳥かご-shp → 2451-csv-鳥かご-csv
⑥Excel上で以下の操作を行う
-
timeのフィールをコピーし(time2)、時刻の書式で、秒単位までの時刻を表示
- timeフィールドをtime1とし、日付を表示
-
速度のフィールドを追加
(○標識点からの各ポイントまでの距離を出す)
ベクター→調査ツール→場所による選択
-
中の建物を選択する = ポイントを指定
-
交差する地物が中にある = ポリゴンを指定
-
それをshpファイルで保存する
-
⑤鳥かご別の速度の平均、標準偏差を出す
-
- (たしかに広い道では平均速度が大きい)→広さと平均速度の関係を求める
⑤歩行軌跡の方向を規定する
④の結果から、属性テーブル
■標準時から日本時間に変換する(UTC to JST)
-
GPSロガーの時刻はUTCとなっている
-
Excelで時差9時間を入れるフィールドを作り、9:00:00を各セルに入れる
-
書式はユーザ定義でh:mmを選択
-
-
JST=UTC+時差
■歩行の方向を検出
-
速度ベクトル(x、y)を考える
-
=ATAN2(x,y)*180/PI()
-
で-180~180が出る(+なら北、絶対値が90°より大きいなら西ということ)
■研究の目的
-
歩行の様子の可視化 → 道幅による効果、混雑度による効果
-
女子大通りの2つの信号の間の歩道区間は、人々の合流・分流が少ないので、傾向が出やすい
■速度の様子
-
行の方が速い(○)
-
晴れの日の方が速い(△)→交差点では、飴の日の方が速くなるかもしれない(仮説)
-
単独の方が速い(○)
■加速度/速度の標準偏差
-
2秒毎に記録したので、2秒間の変化の記録となる
-
絶対値を使って変化の度合を調べることができる
-
ただし、GPSは、データの誤差があるので、それを拾っている可能性がある
-
分散も加速度と似た指標になっているはず。
-
(仮説)行きの方が急ぎがちなので、速度の変化も大きいであろう
→たしかにそうだけど、あまり変わらなかった?
■ヒートマップの作成
-
単バンド議事カラー、YIOrRd の色指定は以外と解りやすい 分類数は5でよい
■主な空間参照システム
-
3857=WGS84/Pseudo Mercator:グーグルマップなど
-
4326=WGS84=GPSロガーなど
-
4612=JGD2000
-
2451=平面直角座標系第ⅠX系
■グリニッジ時刻との差
■時刻の表示方法
-
date time型 →Excelでは、ユーザ設定、時刻、標準など切り替えて処理をしてみよう
■等距離線を描く
■標識点(大学真、ハック)からの距離をとり、速度を求める → 距離と速度の関係を表してみる