政府統計 e-stat の人口推計値を読みこむ-python

政府統計 e-stat にはいろいろなデータがありますが、人口の推計値も揃っています。Excel形式でダウンロードできます。

- 目次 -

スポンサーリンク

人口推計

人口推計は5年ごとの国勢調査がもとになっています。調査で得られた人口を基準人口とし、その後の人口動向を加味して推計値が算出されます。各月 で公表される数値と 各年 で公表される数値の2種類があり,それぞれ以下の通りです。

各月 1日時点の人口

各月 1日時点の 全国の人口 が該当月の下旬に公表されます。

各年 10月 1日時点の人口

各年 10月 1日時点の 全国 および 都道府県の人口 が翌年 4月に公表されます。

両者の詳しい説明は こちら に記載されています。

データ読み込み

2016年 10月 1日時点の推計値 から、都道府県毎の人口をダウンロードし、python の DataFrame に読み込んでみます。

上記リンク先の上から 4番目『都道府県,男女別人口及び人口性比-総人口,日本人人口(平成28年10月1日現在)』をダウンロードします。ファイル名は a00400.xls です。

DataFrame への読み込みは pandasread_excel で行います。read_excel にはオプション skiprows、skip_footer、parse_cols があり、先頭の読み飛ばし、末尾の読み飛ばし、読み込み対象の列を指定できます。

以下の行は読み飛ばします。

先頭から 18行
19行目
末尾3行
見出し、タイトル
全国の人口
コメント

列は以下を対象とします。

J列
M列-T列
都道府県名
人口

実行

結果

DataFrame df の中身はこうなります。(総) は総人口、(日) は日本人人口です。

人口の多い都道府県トップ5を調べてみます。

東京、神奈川、大阪、愛知、埼玉の順でした。

人口性比という項目がありますが、これは、女性100人に対する男性の数です。この数値が高いと男性比率が高い(女性比率が低い)ことを意味します。

愛知、埼玉、神奈川、茨城、栃木の順で男性比率が高いようです。

人口最多の東京と最小の鳥取で人口比をとってみます。

東京が約 24倍でした。

スポンサーリンク
その他の記事

コメントはお気軽に