30日間の無料評価版をお試しいただけます。

概要

新しいジオパックを作成するためには、Yellowfinにデータを送付しなくてはいけません。こちらのページでは、ジオパック作成に必要なファイルについて説明します。

ジオパック作成には、以下のファイルが必要です。

  1. パック内の地理階層ごとに、ジオメトリーと表示名を含むCSVファイル。
  2. 地理階層の最下層のデモグラフィック名と値を含むCSVファイル。(上位層が使用されている場合は、Yellowfinが自動的に使用されている他階層の値を集約するため、最下層だけあれば問題ありません)
  3. CSVファイルのリンク方法を指定したメタデータファイル。

すべてのジオパックには、出典元と免責事項の情報が必要です。使用されるすべてのソースデータが適切な方法で取得され、この形式で再配布されることを保証しなくてはいけません。

今回はジオパック作成の例として、3つの地理階層を持つ、オーストラリアのジオパックを作成します。

  1. 郵便番号
  2. 市町村区

こちらのパックには、以下の5つのファイルが必要です。

  1. 」のジオメトリーと表示名を含むCSVファイル
  2. 郵便番号」のジオメトリーと表示名を含むCSVファイル
  3. 市町村区」のジオメトリーと表示名を含むCSVファイル
  4. 市町村区」のデモグラフィック名と値を含むCSVファイル
  5. CSVファイルのリンク方法を指定したメタデータファイル

ジオメトリと表示名のCSVファイル

命名規則

ジオメトリーと表示名を含むCSVは、ファイル名の末尾に下線と、パック階層内でのCSVの順序を示す数字を付加しなくてはいけません。

今回作成しているオーストラリアのジオパックでは、ジオメトリーと表示名のCSVファイルは、以下のような名称になります。

  1. auspack_1.csv - 階層の 「」情報が含まれます。
  2. auspack_2.csv - 階層の 「郵便番号」情報が含まれます。
  3. auspack_3.csv - 階層の 「市町村区」情報が含まれます。

 

ファイルの書式

CSVファイルには、以下の構造のデータが含まれていなくてはいけません。

  1. 一行目は、階層のラベルです。
  2. 二行目は、各表示名カラム(列)のラベルです。ポイントやポリゴンカラム(列)のラベルを含めてはいけません。
  3. 残りのロウ(行)は、以下のようになります。
    1. 表示名を含むカラム(列)(必要に応じて、特定の階層に多数の表示名を持たせることができます。表示名の数が、階層によって異なっても構いません)。
    2. CSVが階層の最上位ではない場合は、リンクをするためにそのロウ(行)が属しているすぐ上位の階層の表示名の値を含むカラム(列)が必要です。

      注意:各階層はひとつ以上の表示名を持つ可能性があるため、後ほど説明するメタデータファイルで表示名のリンク方法を定義しなくてはいけません。
    3. 中心点を含むカラム(列)がひとつ。
    4. ポリゴンを含むカラム(列)がひとつ(対象の階層にポリゴンが必要なかったり、利用不可能な場合は、空欄にすることもできます。このカラム(列)を使用する場合は、すべてのロウ(行)にポリゴンが含まれている必要があり、空欄を残すことができません)。

階層1の例

こちらの例では、最上位の「」のCSVを作成するために、2つの表示名を使用します。「州名」と「州コード」です。ファイルの内容は、以下のようになります。

"State"
"State Name","State Code"
"New South Wales","NSW","<WKT Point>","<WKT Polygon>"
"Victoria","VIC","<WKT Point>","<WKT Polygon>"
...
etc ...

注意:<WKT Point> と <WKT Polygon> と表示されている箇所はプレースホルダ―であり、実際にはポイントやポリゴンデータを含めなくてはいけません。座標は緯度、経度の順でWKTに列挙する必要があります。

階層2の例

二番目の階層である「郵便番号」のCSVには、ひとつの表示名を含め、「州コード」フィールドの「」階層とリンクを作成します。ファイルの内容は、以下のようになります。

"Postcode"
"Postcode"
"2000","NSW","<WKT Point>","<WKT Polygon>"
"2009","NSW","<WKT Point>","<WKT Polygon>"
...
"3000","VIC","<WKT Point>","<WKT Polygon>"
"3008","VIC","<WKT Point>","<WKT Polygon>"
...
etc ...

階層3の例

三番目の階層である「市町村区」のCSVには、再びひとつの表示名を含み、「郵便番号」階層で唯一使用可能な表示名である、「郵便番号」とリンクを作成します。ファイルの内容は、以下のようになります。

"Suburb"
"Suburb Name"
"Sydney CBD","2000","<WKT Point>","<WKT Polygon>"
"Darling Harbour","2000","<WKT Point>","<WKT Polygon>"
"Haymarket","2000","<WKT Point>","<WKT Polygon>"
"Darling Island","2009","<WKT Point>","<WKT Polygon>"
...
"Melbourne CBD","3000","<WKT Point>","<WKT Polygon>"
"Docklands","3008","<WKT Point>","<WKT Polygon>"
...
etc ...

CSV形式のデモグラフィックファイル

命名規則

最下層のデモグラフィック値を含むこのCSVファイルは、ファイル名の末尾に下線と「demo」と付いた、階層CSVで使用されている名称と、同一の名称を使用しなくてはいけません。

今回作成しているオーストラリアのジオパックでは、CSV形式のデモグラフィックのファイルは、以下の名称になります。

  1. auspack_demo.csv - 「市町村区」のデモグラフィック値が含まれます。

ファイルの書式

パックに含まれるデモグラフィックデータは、地理エリアで使用可能な国勢情報に関連する、様々な値を表示します。このCSVには、以下の構造のデータを含めなくてはいけません。

  1. 一行目は、デモグラフィックラベルの一覧です。
  2. その他のロウ(行)には、各デモグラフィック値と、最下層のどの値に属しているのかを指定するカラム(列)を含みます。

こちらの例では、デモグラフィック情報を、最下層である「市町村区」階層とリンクしなくてはいけません。最下層はひとつの表示名しか持たないため、これを使用して各ロウ(行)を識別します。複数の表示名がある場合は、全体を通して使用するひとつを選択しなくてはいけません。いずれの場合でも、このリンク方法を、後述するメタデータファイルで指定する必要があります。

"Population","Median Income"
14308,75000,"Sydney CBD"
28371,60000,"Melbourne CBD"
...
etc ...

 

メタデータファイル

命名規則

CSVファイルのリンク情報を含むこちらのファイルでは、各CSVと同じ名称を、接頭辞や拡張子無しで使用しなくてはいけません。

今回作成しているオーストラリアのジオパックでは、CSVメタデータファイルは以下の名称になります。

  1. auspack -  各CSVファイルのリンク方法に関する情報が含まれます。

 

ファイルの書式

こちらのファイルに含まれるメタデータでは、パックを正確に生成するために、各階層およびデモグラフィックCSVのリンク方法を定義しなくてはいけません。

  1. 一行目には、階層のCSV間のリンクが含まれます。子階層ごとに一行あります。2つの数字をカンマで区切ります。
    1. 最初の数字は、親階層ファイルのどのカラム(列)が、リンクフィールドであるかを示します。
    2. 二つ目の数字は、子階層ファイルのどのカラム(列)が、リンクフィールドであるかを示します。
  2. 最後から二行目には、最下層とデモグラフィックCSV間のリンクが含まれます。
  3. 最終行には、各デモグラフィックメトリック(数値)の集約方法が含まれます。使用可能な値は、「平均」、「合計」、「最大」、「最小」です。これらの値は、デモグラフィックCSV内のフィールドと同様の順序になっていなくてはいけません。

注意:ファイル階層がひとつだけであったり、ファイル内にデモグラフィック情報が含まれない場合は、データをリンク付けするためのメタデータのロウ(行)を省きます。

こちらの例では、3つの階層があり、デモグラフィック情報も含まれています。そのため、メタデータファイル内に、以下の情報が必要です。

  1. 一行目は、「」と「郵便番号」の階層をリンクします。

    郵便番号」ファイルは、フィールドをリンクするために、「州コード」を使用します。「州コード」は、「」ファイル内の「二番目」のカラム(列)であり、「郵便番号」ファイルの「二番目」のカラム(列)とリンクします。そのため、この行は2,2になります。
  2. 二行目は、「郵便番号」と「市町村区」の階層をリンクします。

    市町村区」ファイルは、フィールドをリンクするために、「郵便番号」フィールドを使用します。「郵便番号」ファイルの「一番目」のカラム(列)は「郵便番号」であり、「市町村区」ファイルの「二番目」のカラム(列)がリンクフィールドです。そのため、この行は1,2になります。
  3. 三行目は、「市町村区」階層と「デモグラフィック」データをリンクしなくてはいけません。

    デモグラフィック」ファイルは、フィールドをリンクするために、「市町村区名」フィールドを使用します。「市町村区名」は、「市町村区」ファイルの「一番目」のカラム(列)であり、「デモグラフィック」ファイルの「三番目」のカラム(列)がリンクフィールドです。そのため、この行は1,3になります。
  4. 四行目は、「デモグラフィック」ファイル内の各メトリック(数値)の集約方法を指定しなくてはいけません。「人口」は合計し、「平均収入」は平均をとらなくてはいけません。そのため、この行は合計,平均になります。
2,2
1,2
1,3
SUM,AVG

出典元と免責事項

すべてのジオパックには、出典元と免責事項の情報が含まれており、ユーザーがフィールドにパックを添付した際に表示されます。サンプル情報は、以下の通りです。

 

このジオパックは、世界各国のジオメトリーを提供します。また、各国の2005年の人口推計を含みます。

なお、パック内の国境のいくつかは、異なる可能性があることに注意をしてください。

出典元:

  • すべてのデータは、世界国境データセットの情報を使用しています。

 

世界国境データセット

 

免責事項:

このジオパック内のデータは、信頼できるソースに基づき生成、処理されていますが、情報の正確性、妥当性、完全性、合法性、信頼性、有用性について、明示、または暗示をしていません。この免責事項は、情報の個別使用、集約使用の両方に適用されます。情報は、「現状のまま」提供されます。特定の目的への適合性、コンピューターウィルスによる汚染の防止、および所有権の非侵害を含まない、あらゆる種類の明示的、または黙示的な保証は、一切否認されます。情報は定期的に変更される場合があります。これらの変更は、新しく発行されたバージョンに含まれる場合もあれば、含まれない場合もあります。

データはすぐに現状と乖離する可能性があります。ファイルに関連するすべてのデータのコンテンツに注意を払い、適切な使用に関して質問がある場合は、データや情報の出典元に問い合わせをすることが推奨されます。エラーや欠損を見つけた場合は、情報提供元に報告をしてください。

 

ご確認いただいているように、このパックでは以下の情報を提供します。

  1. パックのコンテンツと、欠損している可能性のあるデータに関連する情報
  2. ウェブサイト自体のリンクを含む、データのソース上の情報
  3. 免責情報

 

 

  • No labels