本人確認書類 OCR スキャナー
あらゆる政府発行 ID から MRZ、バーコード、視認ゾーンのデータを 1 秒未満で抽出します。オンボーディングフローにそのまま組み込める構造化された JSON を提供します。
本人確認書類 OCR とは?
本人確認書類 OCR(光学文字認識)は、パスポート、運転免許証、各国の ID カードなどの本人確認書類からテキストを、構造化された機械可読データに変換する技術です。ID Analyzer の OCR エンジンは、高度な AI とディープラーニングを使用して、190 か国以上、10,000 を超える書類タイプから氏名、日付、書類番号、住所、その他の項目を抽出します。当社の多言語 OCR は、ラテン文字、中国語、日本語、韓国語、アラビア語、キリル文字など多くの文字体系に対応し、業界をリードする精度を実現しています。
OCR による視認データのスキャン
ID Analyzer ID Verification API は、高度なコンピュータービジョン技術と人工知能を活用し、世界中の本人確認書類から包括的なデータを自動的にスキャン・抽出します。これには、書類番号、姓、名、生年月日、発行日、有効期限、住所、性別など、そうした書類に通常見られる重要な情報が含まれます。当社の最先端の光学文字認識(OCR)技術は、機械可読ゾーン(MRZ)やバーコードがない場合でも効率的に機能するように設計されており、シームレスで正確なデータ取得プロセスを保証します。
ID Analyzer では、当社のデータ抽出結果を市場で利用可能な他のあらゆるサービスと綿密に比較しており、当社製品が競合他社の中で最高の精度を誇ることを自信を持ってお客様に保証します。当社の最先端技術は、他のどの競合も克服できない、ピントの合っていない、トリミングされた、または非常に低解像度の不鮮明な書類でさえも認識することに成功し、当社を際立たせています。この卓越した精度のレベルにより、お客様は最も正確で信頼できるデータ抽出サービスとして ID Analyzer を信頼できます。
当社は、業界で際立つ多言語 OCR 精度を誇りに思っています。当社の技術はさまざまな言語と書類タイプにわたって厳格にテストされており、以下の印象的な統計データをもたらしています。
- 英語 — 文字認識とデータ抽出で 99.8% の精度。
- 中国語(簡体字・繁体字) — 98.5% の精度。最も難しい文字体系の 1 つでも信頼性の高いパフォーマンス。
- スペイン語 — ラテン文字ベースの書類全体で 99.7% の精度。
- アラビア語 — 右から左に書く文字で 99.2% の精度。
- その他の言語 — 日本語、韓国語、キリル文字、タイ語、ヒンディー語を含む 20 を超える言語で 99% を超える精度を維持。
これらの統計は、最高水準の多言語 OCR 機能を提供するという当社の取り組みを裏付けており、グローバルな本人確認書類からのデータ抽出において比類のない精度を求めるお客様にとって、ID Analyzer を最適な選択肢にしています。
MRZ スキャン
機械可読ゾーン(MRZ)は、すべてのパスポートの個人情報ページと一部の ID カードに見られる標準化された領域です。このゾーンには、機械が容易に読み取り、処理できるエンコードされた情報が含まれています。書類に MRZ コードが存在する場合、ID Analyzer の API は、このコード内にエンコードされたすべてのデータを自動的に検出・取得するように特別に設計されています。これには、書類所持者の氏名、パスポートまたは ID 番号、国籍、生年月日、書類の有効期限などの重要な情報が含まれます。当社の API は、このデータの迅速かつ正確な抽出を保証し、お客様の本人確認プロセスを効率化します。
バーコードスキャナー
特に北米では、相当数の本人確認書類に 1D または 2D PDF417 バーコードが採用されています。これらのバーコードは、米国自動車管理者協会(AAMVA)の規格に準拠し、さまざまな ID や運転免許証の裏面に一般的に見られます。ID Analyzer には高度なスキャン機能が備わっており、これらのバーコードを効率的に読み取り、その中にエンコードされた個人データを抽出できます。このデータには通常、個人の氏名、住所、生年月日、その他の関連情報が含まれ、効率的で正確な本人確認プロセスを実現します。
本人確認書類 OCR の仕組み
1. 書類画像のアップロード
API または DocuPass のインターフェースを介して、カメラ、スキャナー、またはファイルアップロードを使用して本人確認書類の画像をアップロードまたは撮影します。
2. 書類の識別
AI が、レイアウト、デザインパターン、セキュリティ機能を当社の 10,000 を超えるテンプレートのデータベースと照合して分析し、書類のタイプと発行国を識別します。
3. テキストの抽出
OCR エンジンが視認ゾーンと機械可読ゾーン(MRZ)からテキストを抽出し、複数の言語と文字体系にわたって印刷文字や手書き文字を読み取ります。
4. データの構造化
抽出されたデータは、容易に統合できるよう、氏名、生年月日、書類番号、有効期限、住所、国籍などの標準化された項目に構造化されます。
5. API による結果の返却
結果はフィールドレベルの信頼度スコアとともに API を介して返され、アプリケーションが抽出された ID データをプログラムで処理・検証できるようになります。
よくある質問
本人確認書類 OCR スキャンは、人工知能と光学文字認識を使用して、パスポート、運転免許証、ID カードなどの本人確認書類からテキストデータを読み取り、抽出する技術です。印刷または手書きのテキストを、自動処理用の構造化された機械可読データに変換します。
ID Analyzer の OCR エンジンは、ラテン文字、中国語(簡体字・繁体字)、日本語、韓国語、アラビア語、キリル文字、タイ語、ヒンディー語など、幅広い言語と文字体系に対応しています。当社の多言語 OCR は、20 を超える言語で 99% を超える精度を維持しています。
ID Analyzer は、標準的な本人確認書類で 98% を超える精度を達成しており、英語の書類では 99.8% の精度に達します。機械可読ゾーン(MRZ)の抽出は、MRZ コードの標準化された形式により、ほぼ 100% の精度を達成します。
OCR エンジンは、氏名、生年月日、書類番号、有効期限、発行日、住所、国籍、性別、機械可読ゾーン(MRZ)データ、世界中の本人確認書類のバーコードにエンコードされた情報など、包括的なデータ項目を抽出できます。
はい。ID Analyzer は、パスポート、渡航書類、各国の ID カードに見られる ICAO 9303 機械可読ゾーン(MRZ)に完全対応しています。システムは、書類番号、氏名、国籍、生年月日、有効期限を含む MRZ データを自動的に検出・デコードし、ほぼ完璧な精度を実現します。
はい。ID Analyzer は、本人確認書類に一般的に見られる PDF417、QR コード、その他のバーコード形式に対応しています。これには、氏名、住所、生年月日、免許証の詳細などの個人データをエンコードする、北米の運転免許証の AAMVA 規格バーコードが含まれます。


