データ:

  • 町丁目別、年齢階級別の貸出冊数(1年間)(①)
  • 上のデータは3年分ある、また、本館・分館別にある
  • 町丁目別、利用者登録数(本館・分館は一緒)

分析方法(方法1)

  • 町丁目の重心~図書館(本館)までの距離(②)を算出。
  • 年齢階級別に、①を縦軸、②を横軸にとった散布図(③)を作成。
  • 年齢階級により③がどのように異なるのかを整理。
  • 具体的には、線形回帰した場合の傾き、決定係数(ばらつき度合)から、年齢階級の特徴を表現。
  • ※この分析方法の欠点は、集合値(町丁目での貸出冊数)のバラツキを見ている点。また、個々の町丁目の貸出数のデータは、人口で按分した比率データであるから、1つ1つの点は少ない人口から構成されているものと、大きい人口から構成されているものがあり、それらの間でバラツキをとるという面から難がある。しかしながら、間接的であるとはいえ、その階級の人々にバラツキが反映されているということは言える。
  • ※もちろん個票データがあれば、利用者の住所、冊数でバラツキを出すことができる。

分析方法(方法2)

  • 町丁目の重心~図書館(本館)までの距離(②)を算出。
  • 図書館(本館)からの距離(0~500m, 500~1000m, 1000~1500m, ・・・)毎の貸出冊数を算出。(バッファを作成し、町丁目を面積按分し、それを用いて貸出冊数を按分する)
  • 横軸に距離階級、縦軸に貸出冊数としたヒストグラムを描く。
  • ある面、分散はわからないが、ヒストグラムはほぼ正確と思われる。バファの領域でまとめているということ。
  • しかし、この際、分散は、手袋でものをさわる感じが否めない。でも、意味はあるような気もする。
  • よって、ここで大切となるのは、各町丁目がどのゾーンに属するのか(複数のゾーンに属する場合は、それぞれの面積割合を計算しておくこと)である。
  • 分析方法

 

※実際には、距離に強く影響するのは図書館から2000m程度までと想定されるので、その間で回帰することも考えられる。

 

 

 

 

用語

  • 11桁コード
    • 1~2ケタ(2) 都道府県コード ここまで2ケタ
    • 3~5ケタ(3) 市区町村コード ここまで5ケタ
    • 6~8ケタ(3) 大字(〇○町) ここまで8ケタ
    • 9~11ケタ(3) 町丁目     ここまで11ケタ

EXCEL

  • =vlookup((検索値, 範囲, 列番号, 検索の型))
    • 検索値(必須)
      • 検索するセル参照を指定。(又は単語を""を付けて直接入力)
      • 例:ネギはいくら?のネギ
    • 範囲(必須)
      • 2 列以上のセル範囲を指定。左端の列で検索値を検索。
      • 参照表を項目行を除き指定
      • 例:ネギ、野菜、800円などのレコード全てを選択
    • 列番号(必須)
      • 目的データが入力されている列番号を指定。
      • 例:金額は3列目であれば3を入力
    • 検索の型(省略可)
      • 検索値の検索方法を TRUE(近似値)か FALSE(完全一致)で指定します。省略するとTRUE。
  • =CONCATENATE(A2,B2)
    • 文字列の結合

QGIS

  • コードが細切れ(例:市区町村の列、大字の列)という形で格納されている場合は、フィールド計算機で||を使ってカラムを結合すればよい。
  • estatの境界データとcsvデータは、境界データ + csv をkeycodeを使って結合できる
  • よくわからにのは、境界データに同じkeycodeであるものがあること
  • 結合すると、同じキーコードのポリゴンに、同じデータが結合されてしまうこと

 

 

1 進め方

  • まず、全年齢について、貸出冊数の分布をみる。ここにおいては、登録者数と同じように、「全館の冊数/町丁目の人口」で表現してみる。
  • これにより、館に近いエリアにおいては、貸出冊数が多く、それは登録率よりも顕著であることがわかるはずである。
  • 次に、本館について、年齢層別の実数で距離分布を出し、その傾きの違いを計算する。
  • 高齢者の方が、移動が億劫であることが考えられ、傾きは大きいのではないかと想定される。
    • 町丁目別・年齢別の人口との比率を用いることも方法であるが、その統計が得られないことを想定した。

2 データクリーニング

 

  • 図書館の統計について、町名までで数値化されているものは、町丁目の数で按分する。ただし、〇○町△△番地という意味の場合があり得る場合には、人口比で町名までの数値を残しておくこととする。
  • 当該町丁目の人口により指数化する必要がある。町丁目により年齢別の人口割合は異なるはずであるが、ここでは、どの町丁目もそれが同じであるとして。

 

 

 

 

 

属性データの結合方法

  • 結合されるデータを準備する
    • e-Statの町丁目データ(境界データ、人口データ等)(shp)
    • KEYフィールドは町丁目コード
  • 結合するデータを準備する
    • 図書館関係の統計データ(csv)
    • KEYフィールドをつける
  • 両方のデータをレイヤに読み込む
  • 結合されるデータのプロパティ→ +ボタン → 結合するファイルとKEYフィールドの指定