政府統計 e-stat にはいろいろなデータがありますが、人口の推計値も揃っています。Excel形式でダウンロードできます。
人口推計
人口推計は5年ごとの国勢調査がもとになっています。調査で得られた人口を基準人口とし、その後の人口動向を加味して推計値が算出されます。各月 で公表される数値と 各年 で公表される数値の2種類があり,それぞれ以下の通りです。
各月 1日時点の人口
各月 1日時点の 全国の人口 が該当月の下旬に公表されます。
各年 10月 1日時点の人口
各年 10月 1日時点の 全国 および 都道府県の人口 が翌年 4月に公表されます。
両者の詳しい説明は こちら に記載されています。
データ読み込み
2016年 10月 1日時点の推計値 から、都道府県毎の人口をダウンロードし、python の DataFrame に読み込んでみます。
上記リンク先の上から 4番目『都道府県,男女別人口及び人口性比-総人口,日本人人口(平成28年10月1日現在)』をダウンロードします。ファイル名は a00400.xls です。
DataFrame への読み込みは pandas の read_excel で行います。read_excel にはオプション skiprows、skip_footer、parse_cols があり、先頭の読み飛ばし、末尾の読み飛ばし、読み込み対象の列を指定できます。
以下の行は読み飛ばします。
19行目
末尾3行
全国の人口
コメント
列は以下を対象とします。
M列-T列
人口
実行
1 2 3 4 5 6 7 8 9 10 |
import pandas as pd df = pd.read_excel(u'C:/Desktop/a00400.xls',header=None, skiprows=19, skip_footer=3, parse_cols='J,M:T') # 都道府県名をインデックスにする df.set_index(0, inplace=True) df.index.names = [u'都道府県'] # カラム df.columns=[u'男女計(総)', u'男(総)', u'女(総)', u'人口性比(総)', u'男女計(日)', u'男(日)', u'女(日)', u'人口性比(日)'] |
結果
DataFrame df の中身はこうなります。(総) は総人口、(日) は日本人人口です。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 |
男女計(総) 男(総) 女(総) 人口性比(総) 男女計(日) 男(日) 女(日) 人口性比(日) 都道府県 北海道 5352 2521 2830 89.1 5327 2511 2816 89.2 青森県 1293 608 686 88.6 1290 606 683 88.7 岩手県 1268 610 658 92.8 1263 609 654 93.0 宮城県 2330 1139 1191 95.6 2314 1131 1182 95.7 秋田県 1010 474 536 88.5 1007 473 533 88.8 山形県 1113 536 578 92.7 1107 534 573 93.1 福島県 1901 941 960 97.9 1891 937 954 98.2 茨城県 2905 1448 1457 99.4 2861 1427 1435 99.4 栃木県 1966 978 988 98.9 1939 965 973 99.2 群馬県 1967 971 996 97.5 1926 950 975 97.4 埼玉県 7289 3639 3651 99.7 7169 3581 3587 99.8 千葉県 6236 3099 3136 98.8 6137 3056 3081 99.2 東京都 13624 6717 6907 97.2 13207 6514 6693 97.3 神奈川県 9145 4565 4580 99.7 8986 4489 4497 99.8 新潟県 2286 1107 1179 93.9 2273 1102 1171 94.1 富山県 1061 513 548 93.7 1049 508 541 93.9 石川県 1151 557 594 93.9 1140 552 588 93.9 福井県 782 380 403 94.2 772 376 397 94.6 山梨県 830 406 424 95.8 818 401 417 96.1 長野県 2088 1017 1071 95.0 2060 1005 1055 95.3 岐阜県 2022 979 1043 93.9 1985 963 1022 94.2 静岡県 3688 1815 1872 96.9 3623 1785 1838 97.1 愛知県 7507 3755 3752 100.1 7324 3667 3657 100.3 三重県 1808 880 928 94.9 1775 864 911 94.9 滋賀県 1413 697 716 97.3 1392 686 706 97.3 京都府 2605 1246 1359 91.7 2559 1224 1335 91.7 大阪府 8833 4249 4583 92.7 8672 4174 4498 92.8 兵庫県 5520 2633 2887 91.2 5438 2594 2844 91.2 奈良県 1356 640 717 89.2 1347 635 712 89.3 和歌山県 954 449 505 88.8 949 447 502 89.0 鳥取県 570 272 298 91.3 566 271 295 91.7 島根県 690 331 358 92.5 684 329 355 92.6 岡山県 1915 919 996 92.3 1896 911 985 92.5 広島県 2837 1375 1462 94.0 2799 1356 1443 94.0 山口県 1394 660 734 90.0 1381 655 727 90.1 徳島県 750 357 393 91.0 746 356 390 91.3 香川県 972 471 502 93.8 964 467 497 93.8 愛媛県 1375 650 725 89.6 1366 645 721 89.5 高知県 721 339 382 88.9 718 337 380 88.8 福岡県 5104 2413 2692 89.6 5054 2387 2667 89.5 佐賀県 828 391 437 89.5 824 389 435 89.6 長崎県 1367 642 725 88.6 1358 637 721 88.4 熊本県 1774 836 938 89.1 1765 832 933 89.3 大分県 1160 549 611 89.9 1150 545 606 90.0 宮崎県 1096 516 581 88.8 1092 514 578 89.0 鹿児島県 1637 768 869 88.4 1630 766 864 88.7 沖縄県 1439 708 732 96.7 1427 701 726 96.4 |
人口の多い都道府県トップ5を調べてみます。
1 2 3 4 5 6 7 8 9 10 |
df.sort_values(by=(u'男女計(総)'), ascending=False)[:5] #-------------------------------------------------------------------------------------- # 男女計(総) 男(総) 女(総) 人口性比(総) 男女計(日) 男(日) 女(日) 人口性比(日) # 都道府県 # 東京都 13624 6717 6907 97.2 13207 6514 6693 97.3 # 神奈川県 9145 4565 4580 99.7 8986 4489 4497 99.8 # 大阪府 8833 4249 4583 92.7 8672 4174 4498 92.8 # 愛知県 7507 3755 3752 100.1 7324 3667 3657 100.3 # 埼玉県 7289 3639 3651 99.7 7169 3581 3587 99.8 #-------------------------------------------------------------------------------------- |
東京、神奈川、大阪、愛知、埼玉の順でした。
人口性比という項目がありますが、これは、女性100人に対する男性の数です。この数値が高いと男性比率が高い(女性比率が低い)ことを意味します。
1 2 3 4 5 6 7 8 9 10 |
df.sort_values(by=(u'人口性比(総)'), ascending=False)[:5] #-------------------------------------------------------------------------------------- # 男女計(総) 男(総) 女(総) 人口性比(総) 男女計(日) 男(日) 女(日) 人口性比(日) # 都道府県 # 愛知県 7507 3755 3752 100.1 7324 3667 3657 100.3 # 埼玉県 7289 3639 3651 99.7 7169 3581 3587 99.8 # 神奈川県 9145 4565 4580 99.7 8986 4489 4497 99.8 # 茨城県 2905 1448 1457 99.4 2861 1427 1435 99.4 # 栃木県 1966 978 988 98.9 1939 965 973 99.2 #-------------------------------------------------------------------------------------- |
愛知、埼玉、神奈川、茨城、栃木の順で男性比率が高いようです。
人口最多の東京と最小の鳥取で人口比をとってみます。
1 2 3 4 |
df.loc[u'東京都'][u'男女計(総)'] / df.loc[u'鳥取県'][u'男女計(総)'] #-------------------- # 23.901754385964914 #-------------------- |
東京が約 24倍でした。