Проверка машиночитаемой зоны паспорта: как MRZ помогает выявлять подделки в KYC

Машиночитаемая зона паспорта — единственный элемент документа, где персональные данные владельца защищены не только полиграфией, но и математикой: пять контрольных цифр, рассчитанных по алгоритму ICAO, фиксируют любое изменение хотя бы одного символа. В этой статье разбираем, что такое MRZ, как устроена ее структура в формате TD3, какие поля и контрольные цифры проверять и по каким признакам MRZ позволяет отличить подлинный паспорт от подделки — вручную или с помощью автоматизированных систем верификации.

Что такое MRZ в паспорте и какие данные она подтверждает

MRZ (Machine Readable Zone) — машиночитаемая зона в нижней части страницы с персональными данными паспорта. Это стандартизированный блок текста с ключевой информацией о владельце и документе в формате, пригодном для автоматического считывания сканерами, камерами и OCR-системами.

Формат и требования к MRZ определяет документ ICAO Doc 9303 — международный стандарт Международной организации гражданской авиации, одобренный как ISO/IEC 7501-1. Стандарт описывает три формата машиночитаемых зон: TD1 (три строки по 30 символов, используется в ID-картах), TD2 (две строки по 36 символов) и TD3 (две строки по 44 символа). Паспорта — как заграничные, так и большинство национальных — используют формат TD3.

MRZ печатается моноширинным шрифтом OCR-B (ISO 1073-2:1976), Size I — приблизительно 14 пунктов. Каждый символ занимает фиксированную ширину 2,54 мм, что позволяет сканеру разбить строку на равные позиции и уверенно считать каждый знак. Допустимы только 37 символов: заглавные латинские буквы от A до Z, арабские цифры от 0 до 9 и символ-заполнитель <. Пробелы, дефисы, апострофы и диакритические знаки в MRZ не используются — имена транслитерируются по правилам Doc 9303 (часть 3, раздел 6), а пробелы и дефисы заменяются символом <.

Размер эффективной зоны считывания (ERZ) строго регламентирован: 17,0 × 118,0 мм. Эта зона одинакова для паспортов всех 193 государств — членов ICAO, что обеспечивает совместимость со считывающим оборудованием по всему миру. С 24 ноября 2015 года паспорта без машиночитаемой зоны считаются недействительными для международных поездок.

MRZ выполняет две задачи при проверке подлинности. Первая — дублирование ключевых данных из визуальной зоны (VIZ) в стандартизированном формате, что позволяет сопоставить напечатанную и считанную информацию. Вторая — математическая верификация через контрольные цифры, рассчитанные по алгоритму Doc 9303. Расхождение между VIZ и MRZ или несовпадение контрольных цифр — сигнал возможной подделки или повреждения документа.

Какие поля дублируются в машиночитаемой зоне

Первая строка MRZ в формате TD3 содержит три элемента: тип документа, код государства-эмитента и имя владельца.

Тип документа обозначается одним или двумя символами в позициях 1–2. Для паспорта первый символ — буква P. Второй символ может уточнять подтип (например, D для дипломатического) или быть заполнен символом <. С 1 января 2026 года, согласно обновленной редакции Doc 9303, страны, уже использующие второй символ, обязаны перейти на стандартизированные двухбуквенные коды: PP — обычный паспорт, PD — дипломатический, PE — экстренный и т. д. К 1 января 2028 года все государства — члены ICAO обязаны выпускать паспорта с двухбуквенными кодами, а к 2038 году документы без стандартизированного второго символа должны полностью выйти из обращения. Паспорта, выпущенные до этих дат с однобуквенным кодом P<, остаются действительными до истечения срока.

Код государства занимает позиции 3–5 и представляет собой трехбуквенный код по стандарту ISO 3166-1 alpha-3 с рядом исключений, оговоренных в Doc 9303. Для России код — RUS, для Германии — D<< (одна буква с двумя заполнителями).

Оставшиеся 39 позиций первой строки (6–44) отведены под фамилию и имя владельца. Фамилия отделяется от имени двойным символом <<. Если ФИО не помещается в отведенное пространство, имя сокращается по правилам Doc 9303, при этом последний символ должен быть буквой — индикатор того, что имя усечено.

Вторая строка концентрирует данные, критичные для верификации:

— Номер документа (позиции 1–9) и его контрольная цифра (позиция 10). — Гражданство владельца (позиции 11–13), трехбуквенный код по ISO 3166-1 alpha-3. — Дата рождения (позиции 14–19) в формате ГГММДД и контрольная цифра (позиция 20). — Пол (позиция 21): M — мужской, F — женский, < — не указан. В ряде стран (например, в США и Аргентине) допускается X для обозначения небинарного пола. — Дата истечения срока действия (позиции 22–27) в формате ГГММДД и контрольная цифра (позиция 28). — Персональный номер или опциональные данные (позиции 29–42) на усмотрение государства-эмитента, и контрольная цифра этого поля (позиция 43). — Составная контрольная цифра (позиция 44), рассчитанная по совокупности нескольких полей второй строки.

MRZ дублирует номер паспорта, гражданство, дату рождения, пол и срок действия — те самые данные, которые напечатаны в визуальной зоне документа. Сопоставление VIZ и MRZ служит первым рубежом проверки: если данные расходятся, документ требует углубленного анализа.

Автоматическая сверка MRZ и визуальной зоны паспорта

Кросс-валидация визуальной зоны и машиночитаемой зоны — одна из задач, где ручная проверка уступает автоматизированной: оператору нужно посимвольно сопоставить транслитерацию имени, номер документа, даты и гражданство, а при потоке заявок неизбежны пропуски. Мы подключим AI-OCR-модуль NeuroVision, который извлекает данные из обеих зон документа, сверяет их между собой и пересчитывает контрольные цифры по алгоритму ICAO — всё это менее чем за секунду на документ.

Модуль распознаёт 10 000+ типов документов из 200+ стран с точностью 99,85% для печатных полей. Вы получите структурированный ответ с извлечёнными данными и флагами расхождений, готовый к обработке в вашей системе. Интеграция — через REST API или SDK для Web, iOS и Android.

Оставить заявку на тестирование

Какие контрольные цифры есть в MRZ

Контрольные цифры — однозначные числа, вычисляемые по алгоритму из Doc 9303 (часть 3, приложение A). Их назначение — подтвердить целостность данных: если хотя бы один символ в защищенном поле изменен, пересчитанная контрольная цифра не совпадет с указанной в документе.

В формате TD3 предусмотрено пять контрольных цифр:

  1. Контрольная цифра номера документа (позиция 10 второй строки) — рассчитывается по символам позиций 1–9.
  2. Контрольная цифра даты рождения (позиция 20) — рассчитывается по символам позиций 14–19.
  3. Контрольная цифра даты истечения срока действия (позиция 28) — рассчитывается по символам позиций 22–27.
  4. Контрольная цифра персонального номера (позиция 43) — рассчитывается по символам позиций 29–42. Если поле пустое (заполнено символами <), вместо контрольной цифры также может стоять < — это допустимое исключение в формате TD3.
  5. Составная (композитная) контрольная цифра (позиция 44) — охватывает номер документа с его контрольной цифрой (позиции 1–10), дату рождения с контрольной цифрой (14–20), дату истечения с контрольной цифрой (22–28) и персональный номер с контрольной цифрой (29–43). Она выступает финальной проверкой целостности всех числовых данных строки.

Алгоритм расчета един для всех пяти цифр. Каждому символу присваивается числовое значение: цифры 0–9 сохраняют свое значение, буквы A–Z получают значения 10–35, символ < равен 0. Значения умножаются на циклически повторяющиеся весовые коэффициенты 7, 3, 1 (первая позиция × 7, вторая × 3, третья × 1, четвертая снова × 7 и далее по кругу). Произведения суммируются, и остаток от деления суммы на 10 дает контрольную цифру.

Такая схема надежно выявляет типичные ошибки OCR-распознавания — замену одного символа, перестановку соседних знаков — и фиксирует любое ручное изменение данных в MRZ. Пересчет контрольных цифр — обязательный шаг при автоматизированной проверке MRZ паспорта, будь то на пограничном контроле, при удаленной идентификации клиента или в антифрод-процедурах.

Проверка MRZ в составе антифрод-цепочки

Пересчёт контрольных цифр выявляет изменения в номере документа, датах и персональном номере, но сам по себе не отвечает на вопрос, подлинный ли паспорт в целом. Мы встроим валидацию MRZ в полный контур антифрод-проверки: AI-OCR-модуль извлечёт поля и пересчитает все пять контрольных цифр, а 40+ алгоритмов антифрода дополнительно оценят целостность документа, качество изображения и признаки подмены.

Подключение через REST API или SDK занимает от 24 часов — вы сможете протестировать распознавание и валидацию MRZ на реальных документах в тестовом окружении сроком до одного месяца. По итогам вы получите оценку точности и скорости на вашем потоке, чтобы принять решение о масштабировании.

Запросить тестовый доступ

Как проверить машиночитаемую зону паспорта

Проверка MRZ складывается из трех шагов: сопоставление данных MRZ с визуальной зоной паспорта, математическая валидация контрольных цифр и контроль формата строки. Процедура не требует специального оборудования — достаточно понимания структуры машиночитаемой зоны и алгоритма расчета из ICAO Doc 9303.

Какие поля сравнивать между MRZ и паспортом

При проверке каждое поле MRZ сопоставляется с соответствующей записью в визуальной зоне (VIZ). Значение в MRZ должно точно соответствовать тому, что напечатано в основной части страницы.

Image

Для паспортов формата TD3 сверяются:

  • Фамилия и имя — в MRZ записываются латиницей, фамилия отделяется от имени двумя символами-заполнителями <<, пробелы и дефисы заменяются одинарным <. Транслитерация в MRZ должна совпадать с латинской записью в визуальной зоне.
  • Код страны выдачи — трехбуквенный код по классификатору ICAO (например, RUS для Российской Федерации).
  • Номер документа — серия и номер паспорта без пробелов; если номер короче девяти символов, оставшиеся позиции заполняются символом <.
  • Гражданство — трехбуквенный код ICAO. Для большинства паспортов совпадает с кодом страны выдачи, но это не обязательно.
  • Дата рождения — формат YYMMDD (две последние цифры года, месяц и день — по две цифры с ведущим нулем).
  • Пол — M, F или < (если не указан).
  • Дата окончания срока действия — формат YYMMDD.

Любое расхождение — лишний символ, другая буква в имени, несовпадение даты — сигнализирует об ошибке или возможной подделке. При автоматизированной проверке система выполняет кросс-валидацию: данные, извлеченные из MRZ через OCR, сравниваются с данными, распознанными в визуальной зоне. Если паспорт содержит электронный чип (формат eMRTD), к сравнению добавляется третий источник — данные из чипа (Data Group 1), которые должны полностью совпадать с MRZ.

Как пересчитать контрольные цифры

В разделе о структуре MRZ описан алгоритм расчета контрольных цифр: преобразование символов в числовые значения, умножение на веса 7, 3, 1 и взятие остатка от деления суммы на 10. Здесь покажем, как применить его на практике.

Допустим, дата рождения в MRZ записана как 880504 (4 мая 1988 года). Расчет: 8×7 + 8×3 + 0×1 + 5×7 + 0×3 + 4×1 = 56 + 24 + 0 + 35 + 0 + 4 = 119. Остаток от деления 119 на 10 равен 9. Контрольная цифра — 9. Если в MRZ после этой даты стоит любая другая цифра, поле не прошло проверку.

Image

Аналогичный расчет выполняется для номера документа (позиции 1–9), даты окончания срока действия (позиции 22–27) и персонального номера (позиции 29–42). Пол и гражданство контрольными цифрами не защищены.

Составная контрольная цифра (позиция 44) рассчитывается по конкатенации нескольких блоков: номер документа с его контрольной цифрой (позиции 1–10), дата рождения с контрольной цифрой (14–20), дата истечения с контрольной цифрой (22–28), персональный номер с контрольной цифрой (29–43). Весовая схема та же — 7, 3, 1 по кругу, модуль 10. Составная цифра обеспечивает перекрестную валидацию: даже если злоумышленник корректно пересчитал одну индивидуальную контрольную цифру, ошибка проявится на уровне составной контрольной суммы, если не были пересчитаны все остальные.

Замена одного символа в номере или дате приводит к другому остатку, и несовпадение сразу выявляется — именно это делает контрольные цифры одним из базовых инструментов обнаружения подделок и ошибок считывания.

Как проверить формат строки, символы заполнения и шрифт

Помимо содержания полей и контрольных цифр, стандарт ICAO Doc 9303 жестко регламентирует физическую и логическую структуру строки MRZ.

КатегорияОписание
Допустимые символыРазрешены только 37 знаков: заглавные латинские буквы A–Z, цифры 0–9 и символ-заполнитель <. Строчные буквы, кириллица, пробелы, дефисы, точки — все это в MRZ присутствовать не может. Появление любого постороннего знака — прямой признак нарушения стандарта.
Длина и количество строкДля паспортов (TD3) MRZ состоит ровно из двух строк по 44 символа. Для ID-карт формата TD1 — три строки по 30 символов, для документов TD2 — две строки по 36 символов. Отклонение от этих параметров указывает на нестандартный или поврежденный документ.
Символы-заполнителиНезанятые позиции заполняются символом <. Фамилия отделяется от имени двойным <<, а остаток строки после имени также заполняется до конца отведенного пространства. Если заполнители стоят не на своих местах — например, в середине номера документа или в поле даты — это аномалия, требующая внимания.
ШрифтMRZ печатается моноширинным шрифтом OCR-B, разработанным специально для оптического распознавания: каждый символ занимает одинаковую ширину, а начертание букв и цифр минимизирует путаницу между похожими знаками (например, 0 и O, 1 и I). Если шрифт MRZ визуально отличается от OCR-B — имеет засечки, разную ширину символов или нестандартное начертание — это весомый повод усомниться в подлинности документа.

На практике ручная проверка формата оправдана при единичных случаях. В промышленных сценариях — онбординге клиентов, пограничном контроле, удаленной верификации — все эти проверки выполняются автоматически. Системы AI-OCR распознают MRZ, извлекают поля, пересчитывают контрольные цифры и сопоставляют данные с визуальной зоной за доли секунды. Платформа NeuroVision включает проверку MRZ как один из шагов в цепочке верификации документов: от классификации и распознавания до контроля целостности и сопоставления с биометрическими данными.

Как выявить подделку по MRZ

Машиночитаемая зона закодирована по жесткому международному стандарту с математической защитой. Любое вмешательство в данные нарушает внутреннюю логику зоны и оставляет следы, которые можно обнаружить программно или при ручной проверке.

Несовпадение MRZ с данными паспорта

Стандарт ICAO Doc 9303 требует, чтобы ключевые поля дублировались в MRZ и визуальной зоне: фамилия и имя, номер документа, гражданство, дата рождения, пол, срок действия. При подделке мошенник чаще всего изменяет один из слоев — визуальный или машиночитаемый — и не синхронизирует второй.

На практике расхождения принимают характерные формы. Фамилия в VIZ может быть записана кириллицей или с диакритическими знаками, а в MRZ — транслитерирована в латиницу по правилам ICAO. Если транслитерация не соответствует этим правилам или содержит символы, не входящие в допустимый набор (A–Z, 0–9, <), это указывает на ручное вмешательство. С датами ситуация аналогична: если дата рождения в VIZ отличается от значения в MRZ хотя бы на одну цифру, документ требует углубленной проверки.

Для автоматических систем верификации сравнение VIZ и MRZ — базовый этап. AI-OCR извлекает данные из обеих зон и сопоставляет их посимвольно. Расхождение хотя бы в одном поле генерирует флаг риска, после чего документ направляется на ручную проверку или отклоняется.

Неверные контрольные цифры

Если фальсификатор изменил хотя бы один символ в защищенном поле — например, скорректировал год рождения или подставил другой номер паспорта, — пересчет контрольной цифры даст результат, не совпадающий с записанным в MRZ. Составная контрольная цифра усиливает защиту: она охватывает все четыре индивидуальных поля и их контрольные цифры, поэтому даже при корректном пересчете одной из них ошибка проявится на уровне составной контрольной суммы.

На практике неверная контрольная цифра — один из наиболее надежных автоматических индикаторов подделки. Программная верификация выполняет пересчет за доли секунды и мгновенно фиксирует несоответствие, что делает контрольные цифры первым рубежом защиты при обработке документов через API или SDK систем распознавания.

Расчёт стоимости верификации документов для вашего объёма

Автоматическая проверка контрольных цифр через API исключает ручной пересчёт по весовой схеме 7‑3‑1 и моментально фиксирует подмену данных, но итоговая стоимость зависит от типа документов и масштаба. 

Мы подберём оптимальную комбинацию модулей и формат развёртывания — облако или контур вашей инфраструктуры — и подготовим расчёт с учётом ваших объёмов и требований к безопасности данных.

Запросить расчёт стоимости

Нестандартная структура машиночитаемой зоны

Помимо содержания данных, MRZ имеет строго регламентированную физическую и логическую структуру: ровно две строки по 44 символа в TD3, допустимый набор из 37 знаков, фиксированное закрепление каждой позиции за определенным полем.

Отклонения от этой структуры с высокой вероятностью указывают на подделку. Типичные аномалии: неверное количество символов в строке, присутствие строчных букв или кириллицы, пробелы вместо заполнителей <, нарушение порядка полей, нестандартные символы в позициях, предназначенных только для цифр (например, буква на месте контрольной цифры).

Отдельный маркер — шрифт. Подлинная MRZ печатается шрифтом OCR-B, который визуально отличается от большинства бытовых гарнитур. Фальсификаторы нередко используют похожие, но не идентичные шрифты — различия проявляются в пропорциях отдельных символов, толщине штрихов, межсимвольных интервалах. Нейросетевые классификаторы, используемые в современных системах верификации документов, способны обнаруживать подмену шрифта MRZ, анализируя морфологию отдельных знаков на изображении.

Image

Автоматизированные системы проверки валидируют структуру MRZ еще до анализа содержания: сначала подтверждают формат (количество строк, длину, набор символов), затем переходят к разбору полей и пересчету контрольных цифр. Если документ не проходит структурную валидацию, дальнейшая обработка прекращается с соответствующим флагом.

Когда ошибка MRZ требует дополнительной проверки

Не каждое несоответствие в MRZ однозначно свидетельствует о подделке. Ряд стран допускали отступления от стандарта ICAO при выпуске паспортов — например, использовали нестандартный шрифт в MRZ или заполняли отдельные поля с отклонением от спецификации. Официальное руководство Великобритании по проверке документов прямо указывает: некоторые государства выпускали подлинные паспорта с несоответствующим шрифтом в машиночитаемой зоне. Ошибки транслитерации имен — особенно для языков с нелатинской письменностью — также могут возникать на этапе выдачи документа и не быть признаком фальсификации.

Грамотно настроенная система верификации разделяет критичные и некритичные аномалии. Неверная контрольная цифра — сигнал высокой степени риска, который требует немедленного внимания. Расхождение в транслитерации имени при совпадении всех остальных полей и корректных контрольных цифрах — менее весомый фактор, который может быть разрешен сверкой с дополнительными источниками.

Оптимальный подход — многоуровневая верификация, при которой MRZ выступает одним из слоев проверки, а не единственным. Данные MRZ сопоставляются с визуальной зоной, а при наличии NFC-чипа (в биометрических паспортах) — еще и с криптографически защищенной информацией на чипе. Совокупность этих проверок позволяет уверенно различать производственные дефекты и целенаправленную фальсификацию, сокращая и ложные срабатывания, и пропуск реальных подделок.

Многоуровневая верификация: от MRZ до биометрии

Разделение аномалий на критичные и некритичные требует не только проверки машиночитаемой зоны, но и сопоставления с другими слоями данных — визуальной зоной, чипом, биометрией владельца. Мы настроим полный KYC-пайплайн NeuroVision, где валидация MRZ станет одним из шагов цепочки: AI-OCR распознает документ и проверит структуру, поля и контрольные цифры, модуль NeuroVision сравнит селфи с фотографией из документа с точностью верификации 99,74%, а liveness-проверка с точностью 99,9% подтвердит, что перед камерой живой человек, а не фото, видео или маска.

Развёртывание полного контура занимает от 3 до 7 дней в зависимости от инфраструктуры и требований информационной безопасности. Оставьте заявку — мы вместе определим набор модулей и сценарий проверки, подходящий вашим процессам и регуляторным требованиям.

Оставить заявку на консультацию
Вывод
MRZ как математический барьер против подделки паспорта

Машиночитаемая зона превращает бумажный документ в объект с встроенной цифровой защитой: жесткая структура TD3, ограниченный набор символов, пять контрольных цифр по алгоритму ICAO и обязательное дублирование данных визуальной зоны создают систему, где любое вмешательство нарушает внутреннюю логику и становится обнаружимым.

Сопоставление VIZ и MRZ, пересчет контрольных цифр, проверка формата строки и шрифта OCR-B формируют многоуровневый контроль, который работает и при ручной инспекции, и в автоматизированных системах верификации. Грамотная проверка MRZ при этом учитывает контекст: не каждая аномалия означает фальсификацию, а единичное расхождение требует сопоставления с другими слоями данных — от визуальной зоны до криптографически защищенной информации на NFC-чипе биометрического паспорта. Сочетание математической валидации, кросс-проверки источников и разделения критичных и некритичных отклонений позволяет сократить и ложные срабатывания, и пропуск реальных подделок, делая MRZ надежным элементом в цепочке документарного антифрода.

Оставьте заявку, чтобы внедрить топ-1 KYC от NeuroVision

С нами уже работают
OZON
Почта Банк
CSVT
БКС
Svargo
Материк
Озон банк
Arvix