320 likes | 636 Vues
戸籍の電子化にあたっての名前表記問題. 富士ゼロックスシステムサービス ( 株 ) ‘ 08.5.15. 本日の議題 1.富士ゼロックスシステムサービス ( 株 ) のご紹介 2.戸籍電算化事業とは何か 3.戸籍セットアップにおける個人特定の諸問題 4.戸籍・住基のマッチングに於ける諸問題 5.まとめ 6.中長期での今後の課題. 1.富士ゼロックスシステムサービス ( 株 ) のご紹介. 富士ゼロックスシステムサービス ( 株 ) と戸籍電算化事業. 富士ゼロックス株式会社 100 %出資 関連会社 民間市場向け プリントソリューション
E N D
戸籍の電子化にあたっての名前表記問題 富士ゼロックスシステムサービス(株) ‘08.5.15
本日の議題 1.富士ゼロックスシステムサービス(株)のご紹介 2.戸籍電算化事業とは何か 3.戸籍セットアップにおける個人特定の諸問題 4.戸籍・住基のマッチングに於ける諸問題 5.まとめ 6.中長期での今後の課題
1.富士ゼロックスシステムサービス(株)のご紹介1.富士ゼロックスシステムサービス(株)のご紹介
富士ゼロックスシステムサービス(株)と戸籍電算化事業富士ゼロックスシステムサービス(株)と戸籍電算化事業 • 富士ゼロックス株式会社 100%出資 関連会社 • 民間市場向け プリントソリューション • 公共向け 戸籍を中心とした行政システムソリューション • 昭和47年 ~ 除籍・改製原戸籍再製作業・・・・・・・・・・・・・約2,170自治体 • 昭和50年 除籍・改製原戸籍の見出し帳作成・・・・・・・・・約1,350自治体 • 昭和63年 戸籍一部処理システムの稼動・・・・・・・・・・・・・約380自治体 • 平成元年 法務省戸籍情報システム研究会に参加 • 平成4年 法務省「セットアップ分科会」に参加 • 平成6年 戸籍法改正 • 平成6年 戸籍電算化事業を開始 戸籍電子化データ作成 全国 1,564自治体 戸籍総合システム稼働 全国1,464自治体
戸籍と住民基本台帳の違い 住民票と戸籍は良く似ていると思われますが、実は全く違うものです。 本籍・筆頭者欄 戸籍事項欄 名欄・身分事項欄
電算化戸籍と従来の戸籍の違い • 電算化後の戸籍原本とは 原本は磁気媒体となり、システムから出力される書類は、証明書となる。 和紙原本 磁気原本 証明書 • 証明書の形式は 和紙に縦書きされた、本籍・氏名・生年月日・身分事項が項目化され横書きされる。 電算化前 電算化後
戸籍電算化事業の推移 • 昨年度までに約2600の自治体で事業を実施。 • 合併前の自治体数を元にした導入率は約80%弱まで来ている。 自治体合併により導入数が一気に増加 注)自治体数は単純に稼働した自治体数であり、自治体合併については考慮していません。
3.戸籍セットアップにおける個人特定の諸問題3.戸籍セットアップにおける個人特定の諸問題
戸籍セットアップの問題点 戸籍データセットアップにおいては、7つの専門的な判断が必要となる。 その中でも特に文字の判断はもっとも困難な問題である。 7つの判断業務 ・・・文章を項目化する上での判断 旧記載1500種 → 新記載440種へ集約 1.項目化の判断 ・・・文章を項目化する上で新戸籍へ記載するかしないかの判断 2.移記・不移記の判断 3.文字の判断 ・・・正字・誤字・俗字の判断と正字への引き直し 4.最小行政区の判断 ・・・文章中から最小の行政区を抜き出す(外国・旧行政区も含む) 過去の自治体合併を考慮した本籍の判断をする ・・・筆頭者が死んでいて配偶者が残っている場合の姻族関係 判断 5.生存配偶者の判断 ・・・前戸主だけでなく身分事項欄まで読み込んで筆頭者の前の 戸籍を遡るリンケージを作成する 6.前筆頭者判断 ・・・戸籍訂正んの必要性、構成内容の判断 7.戸籍訂正・更正の指摘 1戸籍全判断工程 約40分中 文字判断で15分を費やす
戸籍電算化における氏名表記の変更について 入力する文字は、平成2年10月20日付け法務省民二第5200号通達に基づき、誤字を正字に引き直すことが必要です。また、俗字は、平成6年11月16日付け法務省民事第7006号、7007号に基づき、漢和辞典に載っているものは入力する事になります。ただし、本人の異議があった場合は、事故簿として紙で管理する事になります。 正字 約51,000文字 そのまま(漢和辞典に載っている文字) 磁気化 俗字 約2,000文字 正字 本人の同意を得る 誤字 事故簿 本人が異議 正字:常用漢字表などに記載される文字。漢和字典などで正しいとされる文字 俗字:習慣上用いられる俗用の文字。正字ではないが手書き用の文字として一 般に使われている文字など 誤字:字典に搭載されていない若しくは字典に誤字とある文字 ただし、正字、俗字であってもコンピュータに無い文字は相当数ある。
戸籍文字の搭載について 戸籍総合システムへ搭載文字の考え方 • 基本としている辞書、および解釈 • 辞典:「新大字典(講談社)、康煕字典(講談社)、大漢和辞典(大修館) • 通達:法務省通達1500号通達、5200号通達、7006号通達、7007号通達の俗字 • 【その他主な参照例】 • ・新字源(角川書店) ・大字典(講談社) ・漢語新辞典(大修館書店) ・漢字典(旺文社) • ・漢和辞典(三省堂) ・角川大字源(角川書店) ・岩波新漢語辞典(岩波書店) など • 追加文字の搭載 • 過去、1,000万戸籍をセットアップした中で発生(作成)した文字 • システム運用上で発生した文字(各自治体様からの連絡により随時追加) • 辞書上になくとも、戸籍上にあり、法務局により認められた文字 (「漢和辞典に記載されていない文字」) 弊社の住民総合システムは、約43,000文字を標準搭載しております。
補足・戸籍システムの単漢字辞書 字種により、文字を色分け 文字の出典根拠を表示 備考欄に取り扱い方法等の設定が可能
戸籍記載文字判読の問題 • 判読困難な手書き文字 戸籍に記載された文字には判読が困難なものがある • 類似文字 • 罫線にかかっている文字 • OCRなどによる自動化が困難 • 熟練者による判読が必要
戸籍における正字・誤字の判断 正字 戸籍に記載された文字には誤字が含まれる 集 約 誤字 • 正字への引き直しの判断が必要 • 但し法務局よってはそのまま使用できる誤字もあるため地域による差の把握も必要
補足・戸籍における正字・誤字の判断 セットアップ時に出現する誤字集約の実際
戸籍セットアップ時の個人の特定 戸籍には戸籍欄・個人欄・身分事項欄があり、重複した記載がされています。 これを相互に参照することで記載内容のチェックが出来ます。 身分事項欄 本籍欄 個人欄 筆頭者欄
戸籍セットアップ時の個人の特定 戸籍記載される構成員は1つの戸籍だけに記載されているわけでありません。 一般に言われる戸籍には次の「戸籍」・「除籍」・「改製原戸籍」の3種類があります。 これを相互にチェックすることで精度を高めることが出来ます。 除 籍 戸籍 改製原戸籍
戸籍セットアップ時の氏名に関するエラー率と解決方法戸籍セットアップ時の氏名に関するエラー率と解決方法 一般的自治体でのエラーの発生数 【個人特定自体に何らかのエラーが合ったもの】 自治体問い合わせ件数 ⇒ 弊社では判断がつかず、自治体側へ問い合わせた件数 弊社側で判断した件数 ⇒ 弊社では判断がついたエラーの件数 【個人特定で文字自体に何らかのエラーが合ったもの】 法務局判断が必要な不明文字 ⇒ 文字そのものが漢和辞典に無く使用可否判断を法務局へ仰いだエラー件数 氏名文字変更の告知対象者 ⇒ 氏名文字変更に伴い告知される対象者数 【個人特定自体に何らかのエラーが合ったもの】 実際にエラーを何処まで潰すか、その様に解消するかは各自治体での判断となるため、弊社側では何とも申し上げることは出来ません。 但し、単純な比較ではなく対象となる個人が不利益にならないよう、細心の注意を払ってデータの決定がされているようです。
戸籍・住基のマッチングの必要性 戸籍と住基のマッチングの必要性 戸籍システムの運用に当たっては、住基システムとの連携が生じます。これは、双方のシステムで管理する重複する項目について連携を行うことで、整合性の維持・再入力負荷の低減が図れるからです。 ただし、住民票は管内に居住する市民のデータであるのに対して、その市民が必ずしも当該自治体に戸籍を置いているとか限りません。よって、マッチングが可能になるのは本籍人かつ管内住所人ということになります。 連携項目 戸籍sys 住基sys 戸籍 本籍・筆頭者・氏名・生年月日 住基 本籍人 住所人 附票 住所・住定日 附票:本籍人の住所履歴を記録したもの。 住民票と違って管外の住所も記録される。 戸籍と一緒に管理される。 マッチング可能
文字コードの同定について 文字変換テーブルの作成 • 住民記録システムにて運用されている文字と戸籍システム文字との同定を行います。 • 文字同定は、住民記録文字1文字に対して戸籍システム文字1文字になるように行います。 • 戸籍システムに存在しない文字は、戸籍システムに新規搭載します。 戸籍システム文字 (約40,000文字) 住民記録システム 戸籍システム 同定 住民記録システム文字 (?????文字) 作字 ? 作字の範囲
文字コードの同定の工程 文字変換テーブルの作成方法 • データ移行や別システム間で連携を行なう場合に一番注意を要する作業の一つは、文字の同定作業です。 • 既存システムから印字した文字とコードの一覧をお預かりし、印字した文字1文字1文字を目視で確認し、戸籍システムのどの文字に該当するかを確認していきます。 ①外字資料のお預かり 住記コード イメージ 80A1 亜 80A2 芦 80A3 鯵 80A4 飴 JEFやJIS等の規格コードやユーザー外字文字パターンの一覧をいただきます。また、デザインの差などの判断基準をお客様と確認します。 ②同定作業(1.5~2ヶ月) 規格範囲内の文字についてはFXSSで既に保有しているコード対象表にもとづき、ユーザー外字については目視による同定作業を行い、対照表の作成を行います。
文字コードの同定の工程 お客様確認作業としては、同定先に間違いがないかの確認になります。特に、ユーザー外字に対して重点的に注意をいただきます。 ③お客様確認(1.0ヶ月) 住記コード イメージ 80A1 亜 80A2 芦 80A3 鯵 80A4 飴 お客様検証作業で発生した不足文字(FXSSシステム内に存在しない文字)の作成を行います。 ④不足文字の作成 ⑤文字変換テーブルの完成 お客様検証作業で問題がなければ、正式な対照表とします。
文字コードの同定時の問題点について 住民記録システムは、戸籍のように文字の基準がなく、戸籍の基準では誤字であった場合でも、住民票は編成されてしまいます。 住民の届出文字が住民記録システムに存在しない場合、文字作成が行われますが、既に存在している文字を探しきれず、同じ文字を新たに作成してしまう場合もあります。 お客様へ報告 使用されている住民票の確認などを行っていただく必要があります。
戸籍・住基マッチング処理 住基 SORT 本籍順 SORT 生年月日 初期チェック 文字コード変換 <完全一致> 筆頭者氏名 本籍 氏名 生年月日 戸籍 マッチング 照合・修正 OK 1項目 エラー エラー3~4% アンマッチリスト エラー:0.02~0.05% 住基データ修正 <完全一致> 筆頭者氏名 本籍 氏名 生年月日 マッチングの回数はデータ修正を繰り返しながら3回程度実施する。 この処理によりマッチングエラー率は0.02%程度まで低下する。 但し、氏名に関するエラーは0にまで持って行くものと思われます。 マッチング 複数項目 エラー
戸籍・住基マッチングエラー率 代表的な自治体でのエラーの発生率は下記の通りです。 最もエラーの発生率が低いのは生年月日で、個人氏名は文字の問題等もあり、高めの数字です。 筆頭者氏名でエラー率が高いのは住民票側で筆頭者が精緻には記載されていないためです。
5.まとめ • 【戸籍の個人特定】 • 戸籍のセットアップに於いて手書き文字から正確に氏名文字を特定するには経験とノウハウが必要である。 • 本人の氏名に関しては、文字の誤りと内容の誤りなどが存在する。 • 文字の誤りは誤字は正字に引き直す工程で、ほとんどが解決される。 • (文字の修正は氏変更・名の変更届と審査が必要。) • 内容の誤りを正し最終的に個人を特定するために、除籍・改製原戸籍など前後の戸籍・身分事項との照合などが必要になる。 • 最終的な判断は届書に記載された届出人の記載内容までさかのぼる。 • 【住民票の個人特定】 • 住民票には文字の規程が無く、厳密な使い分けがされていない。 • 本来は住民票の氏名表記も戸籍に合わせるべき。 • 事務処理の連携上、戸籍の電算化に合わせて住基との同期をとるケースが多い。 • ・戸籍との相違については職権訂正がおこなわれる。 • 本人特定には、純粋に技術的に対応できる部分は少なく、他の情報とのマッチングを繰り返して、解消する。
6.中長期での今後の課題 • 【法改正・施行規則変更への対応】 • ・日本の戸籍に子の名として記載できる文字は原則として常用漢字と人名用漢字、カタカナおよびひらがなのみである。(戸籍法施行規則) • ・このうち人名用漢字は徐々に追加されてきていおり、都度文字属性変更対応が必要になっている。 • 1951年5月25日、92字を人名用漢字として新たに指定。 • 1976年7月30日、28字を追加し合計120字となる。 • 1981年10月1日、常用漢字に取り入れられた8字を削除し、54字を追加して合計166字となる。 • 1990年4月1日、118字を追加し合計284字となる。 • 1997年12月3日、1字(「琉」)を追加し合計285字となる。 • 2004年2月23日、1字(「曽」)を追加し合計286字となる。 • 同6月7日、1字(「獅」)を追加し合計287字となる。 • 同7月12日、3字(「毘」「瀧」「駕」)を追加し合計290字となる。 • 同9月27日、許容字体からの205字と追加された488字を加え合計983字となる。 • 【広域ネットワークへの対応】 • 広域行政サービスとして各自治体間でサービスを共有する場合の文字コードの問題 • 複数自治体(複数ベンダー)間の文字同定の困難さ • 住基ネットの証明書と戸籍証明書の文字不一致の問題 • 戸籍→住基ネットでは文字を集約(n→1)