SuL Data Science #2

This topic contains 0件の返信, has 1件の返信, and was last updated by nobuhito.hasegawa のプロフィール写真 nobuhito.hasegawa 1 年 6 ヶ月前.

179 Views
LICENSE GNU GPL
  • by nobuhito.hasegawa のプロフィール写真 nobuhito.hasegawa #6999

    GISのソフトウエアの中でデータを活用するためには、緯度・経度の情報が重要になってきます。
    国土地理院/基盤地図情報サイト( http://www.gsi.go.jp/kiban/)や、国土数値情報 ダウンロードサービス( http://nlftp.mlit.go.jp/ksj/)にある情報は、GISのソフトウエアで利用する代表的なフォーマットの形で提供されており、容易に利用することができますが、その他、世の中に多く存在する多種多様な情報はそのままではGISソフトウエアの中で活用することができません。

    GISで利用可能な代表的フォーマット
    ・XML
    ・Shapefile
    ・TIFF

    上記以外の多くはGISのソフトウエアに取り込めるように加工する必要があります。
    加工方法はファイル形式やデータの中味によって異なります。
    その中で、代表的であると思われる2つの方法をまずトライアルしました。

    1. 住所情報をもとに、地図へポイントをプロットする

    住所データだけでは、GISのソフトウエアでは利用ができません。したがって、「住所情報→緯度・経度情報」への変換が必要となります。そのため、ジオコーディング(住所を緯度経度に変換する)を使用します。
    ジオコーディングとは、住所(たとえば「東京都港区六本木 6-10-1」)を地理的座標(たとえば、緯度 35.6604282、経度 139.7269877)に変換するプロセスです。変換した座標は、マップ上に場所の目印を付ける場合や、位置指定を行う場合に使用できます
    引用元:https://developers.google.com/maps/documentation/javascript/geocoding?hl=ja

    GoogleMapのAPIをはじめweb上のサービスとして利用可能なものがありますが、今回は、GISのソフトウエアー上でシンプルに活用するため、下記のサービスを利用することとします。

    CSVアドレスマッチングサービス

    http://newspat.csis.u-tokyo.ac.jp/geocode-cgi/geocode.cgi?action=start

    上記サービスを利用して、コンビニエンスストアーの場所をプロットします。
    情報は下記のデータを利用しました。
    コンビニまっぷ
    忙しいwebデザイナーさんのためのWeb用素材データ保管・無料ダウンロードサイト

    コンビニエンスストア位置プロット図

    2. 地図の行政区画コードをもとに人口の統計データを結びつけ人口の密度を可視化する

    地図情報を持っているShapefileとExcelの人口の統計データを結びつけることにより人口の密度を可視化することが出来ます。

    Shapefileには位置を特定する為の行政区画コード(都道府県コードと市区町村コードからなる行政区を特定するためのコード)が含まれていますが、ExcelにはShapefileが持っている行政区画コードが含まれていないことが大半であり、そのままの状態では人口の統計データをGISのソフトウエアーで地図上にプロットすることは出来ません。
    そのためShapefileが持っている行政区画コードを利用し、Excelと結びつける必要があります。
    また、GISのソフトウエアーでは読み込めるファイル形式が限られているため、読み込めるファイル形式に変換する必要があります。

    下記の手順で行政区画コードを利用し、ShapefileとExcelを結びつけを行いました。

    1.行政区画コードの追記
    Shapefileが持っている行政区画コードを調べ、Excelに行政区画コードを追記します。

    2.CSVへ変換
    GISのソフトウエアーではExcel読み込めない為、ExcelをCSVにファイル形式を変換します。

    3.CSVTの作成
    Excelに追記した行政区画コードはそのままGISのソフトウエアーに取り込もうとすると、文字ではなく整数として認識されてしまい、Shapefileの行政区画コードとうまく結びつけることが出来ない為、文字として認識させる必要があります。そのため文字列として取り込むためのファイル(.csvt)を作成しました。

    4.データの結合
    Shapefileの行政区画コードとCSVの行政区画コードを、GISのソフトウエアー内で結合し、2つのデータの結びつけを行いました。


    統計データを地図に結びつけ可視化

    次回は、WEB上に点在するデータに関して、どのようなアプローチで利用可能になるか、アプローチ別にデータを整理していく予定です。

このトピックに返信するにはログインしてください。

openDDLにログイン

or    

ログイン出来ない場合

パスワードをお忘れですか?