日本語でできるかな?
疑似個人情報データ生成サービスでダミーデータを30件作りました。
import re
dStr="連番,氏名,氏名(カタカナ),氏名(ローマ字),性別,郵便番号,住所1,住所2,生年月日,年齢,1,鳥居 紫,トリイ ユカリ,Torii Yukari,F,849-1206,佐賀県,杵島郡白石町,1986/7/4,35,2,池谷 優,イケタニ マサル,Iketani Masaru,M,634-0043,奈良県,橿原市,1967/3/31,54,3,及川 孝男,オイカワ タカオ,Oikawa Takao,M,639-2162,奈良県,葛城市,1978/2/2,43,4,笠井 敏幸,カサイ トシユキ,Kasai Toshiyuki,M,039-1525,青森県,三戸郡五戸町,1969/4/17,52,5,西原 柚子,ニシハラ ユズ,Nishihara Yuzu,F,299-4321,千葉県,長生郡長生村,1989/1/9,32,6,本田 安奈,ホンダ アンナ,Honda Amna,F,106-0045,東京都,港区,1962/9/23,59,7,岸田 美姫,キシダ ミキ,Kishida Miki,F,563-0031,大阪府,池田市,1985/7/5,36,8,永瀬 堂下,ナガセ ドウシタ,Nagase Doushita,F,206-0041,東京都,多摩市,1998/8/20,23,9,野沢 永二,ノザワ エイジ,Nozawa Eiji,M,919-1525,福井県,三方上中郡若狭町,2000/7/24,21,10,横溝 美南,ヨコミゾ ミナミ,Yokomizo Minami,F,071-0714,北海道,空知郡中富良野町,1971/3/19,50,11,堀越 和之,ホリコシ カズユキ,Horikoshi Kazuyuki,M,893-0057,鹿児島県,鹿屋市,1969/10/2,52,12,藤村 一司,フジムラ カズシ,Fujimura Kazushi,M,904-1203,沖縄県,国頭郡金武町,1999/11/5,21,13,小坂 文香,オサカ フミカ,Osaka Fumika,F,699-3672,島根県,益田市,1993/11/23,27,14,平林 瑞穂,ヒラバヤシ ミズホ,Hirabayashi Mizuho,F,872-0862,大分県,宇佐市,1991/11/20,29,15,前田 和弘,マエダ カズヒロ,Maeda Kazuhiro,M,889-0504,宮崎県,延岡市,1968/7/26,53,16,堀越 彩葉,ホリコシ イロハ,Horikoshi Iroha,F,963-7763,福島県,田村郡三春町,1977/12/24,43,17,八木 優依,ヤギ ユイ,Yagi Yui,F,885-0041,宮崎県,都城市,1991/11/30,29,18,吉川 利恵,ヨシカワ リエ,Yoshikawa Rie,F,942-0206,新潟県,上越市,1962/10/13,58,19,芳賀 勇吉,ハガ ユウキチ,Haga Yuukichi,M,927-0054,石川県,鳳珠郡穴水町,1964/11/7,56,20,竹村 深雪,タケムラ ミユキ,Takemura Miyuki,F,639-3804,奈良県,吉野郡下北山村,1971/3/24,50,21,熊田 香凛,クマダ カリン,Kumada Karin,F,412-0028,静岡県,御殿場市,1971/11/16,49,22,菅谷 洋,スガヤ ヒロシ,Sugaya Hiroshi,M,135-0053,東京都,江東区,1988/12/25,32,23,村松 花梨,ムラマツ カリン,Muramatsu Karin,F,636-0012,奈良県,北葛城郡王寺町,1964/5/30,57,24,五味 瑞姫,ゴミ ミズキ,Gomi Mizuki,F,922-0005,石川県,加賀市,1980/7/13,41,25,梅本 竹雄,ウメモト タケオ,Umemoto Takeo,M,709-2135,岡山県,岡山市北区,1965/5/19,56,26,塚越 花梨,ツカゴシ カリン,Tsukagoshi Karin,F,606-0013,京都府,京都市左京区,1999/3/9,22,27,甲斐 寿,カイ ヒサシ,Kai Hisashi,M,739-1106,広島県,安芸高田市,1997/9/18,24,28,佐野 茂男,サノ シゲオ,Sano Shigeo,M,537-0012,大阪府,大阪市東成区,1964/3/2,57,29,山形 和恵,ヤマガタ カズエ,Yamagata Kazue,F,942-0154,新潟県,上越市,1961/11/14,59,30,西村 慶治,ニシムラ ケイジ,Nishimura Keiji,M,701-1464,岡山県,岡山市北区,1978/10/2,43"
tdfk=',[^,]+[都道府県],'
t=',[^,]+都,'
d=',[^,]+道,'
f=',[^,]+府,'
k=',[^,]+県,'
result0 = re.findall(tdfk, dStr)
result1 = re.findall(t, dStr)
result2 = re.findall(d, dStr)
result3 = re.findall(f, dStr)
result4 = re.findall(k, dStr)
print("{0}件の情報があり、そのうち".format(len(result0)))
print("{0}件が都民".format(len(result1)))
print("{0}件が道民".format(len(result2)))
print("{0}件府民".format(len(result3)))
print("{0}件県民です。".format(len(result4)))
結果は
c:\python>chkaddress.py
SyntaxError: Non-UTF-8 code starting with '\xe6' in file C:\python\chkaddress.py on line 2, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
ファイルをBOM付きのUTF-8で上書き保存して(;^_^A
おけ!