Пролог: В котором ваш багаж исчезаетЧемодан медленно уезжает за резиновую шторку и на некоторое время перестаёт быть вашим.Где-то по ту сторону экрана его уже нПролог: В котором ваш багаж исчезаетЧемодан медленно уезжает за резиновую шторку и на некоторое время перестаёт быть вашим.Где-то по ту сторону экрана его уже н

Рентген может не отличить опасное от безобидного: как работает досмотр багажа и зачем там ИИ

Пролог: В котором ваш багаж исчезает

3e66789058643e3165dc581b7324477b.png

Каждый день через такие системы проходят миллионы сумок. И почти никто не задумывается, насколько это сложная задача. Здесь мы поговорим не про конкретные модели и железо. Мы узнаем,

  • почему человеку трудно разбираться в содержимом чемоданов,

  • почему нейросети здесь не всесильны

  • и почему безопасность всегда остаётся компромиссом.

Для начала разберёмся с базой. Что такое интроскоп и почему он хоть что-то видит?

Глава 1: Как интроскоп видит багаж

Проще всего представить интроскоп (ту самую холодную металлическую коробку) как устройство, которое считает, как рентгеновский луч проходит через содержимое чемодана. Луч проходит сквозь вещи и постепенно ослабевает. В плотных материалах сигнал падает сильнее, в более лёгких слабее. В итоге каждая точка изображения это просто число, которое показывает, насколько именно ослаб сигнал в этом месте. Цвет появляется уже после измерений и добавляют его не для красоты, а потому что с картинкой человеку проще работать, чем с набором чисел.

Сам рентген не различает опасное и разрешённое. Он реагирует только на физические свойства материалов. Из-за этого на экране обычные вещи иногда выглядят странно и вполне могут отправиться на дополнительный досмотр.

20e1bd41748f10e83817e4637c81ab42.png

Чтобы оператор мог хоть как-то ориентироваться в этих данных, изображение раскрашивают. Обычно используется простая логика:

  • 🟠 оранжевый (органика)

  • 🔵 синий (металл)

  • 🟢 зелёный (пластик и композиты)

С помощью цветов оператор может лишь примерно понимать из какого материала сделаны предметы в чемодане. И смотря на эту картинку за несколько секунд решить что перед ним: обычный багаж с хаотичной укладкой или ситуация, которая требует внимания.

Изображение отражает только измеренные параметры ослабления излучения. Ошибки возникают на этапе интерпретации этих данных человеком.

Глава 2: Чемодан как головоломка

Внутри чемодана царит настоящий хаос: вещи беспорядочно разбросаны и накладываются друг на друга, скрывая свою истинную форму.

923a24382d0cd71893419ffa5d6bc200.png

Для человека это просто неудобно. Для анализа изображений это серьёзная проблема. Когда предметы перекрывают друг друга, ни один из них не виден полностью. В компьютерном зрении это называют перекрытием объектов, и с этим плохо справляются и алгоритмы, и люди. Но даже без перекрытий остаётся другая сложность. Один и тот же предмет выглядит по-разному в зависимости от ракурса. То, что сбоку легко узнаётся, сверху может превратиться в обычный кусок металла.

К этому добавляется то, что оттенки на дисплее отражают лишь физическую сущность объектов, никак не раскрывая их потенциальное применение. Один и тот же сигнал может соответствовать самым разным вещам, в том числе опасным. Поэтому оператор смотрит не на отдельный признак, а на всё сразу. Он оценивает форму, плотность, взаимное расположение предметов и общую картину.

20e058f12c871f1e9904363d2dbfe756.png

Человек это не бесконечный ресурс. За смену оператор просматривает сотни, а иногда и тысячи чемоданов. Картинки повторяются, внимание притупляется, и со временем становится сложнее замечать детали.

Ошибки здесь возникают не из-за некомпетентности, а потому что сама задача плохо подходит для человеческого восприятия. Автоматизированный поиск угроз представляет собой сложную научно-техническую проблему, выходящую далеко за пределы обычных улучшений пользовательского интерфейса. Компьютерное зрение выступает важным дополнением к работе операторов, снижая утомляемость и повышая эффективность выявления потенциальных рисков.

Глава 3: Нейросети как помощник, а не панацея

Представление о том, что нейронные сети работают подобно человеческому зрению, весьма распространено, однако механизм их работы гораздо глубже и сложнее, чем простое сопоставление образов.

Модели нейросетей оперируют цифровыми массивами данных, представляющими изображения в виде набора чисел, где реальные объекты (чемоданы, ножи и прочее) теряют свою очевидную форму и превращаются в сложный цифровой ландшафт. Чтобы в этом появилось хоть какое-то понимание, нейросеть обучают на тысячах или даже десятках тысяч размеченных снимков. Поэтому без большого объёма размеченных данных такая система работать не будет.

8c408048b5ea81e96a7366768e8bc0f0.png

И тут возникает простой, но неприятный вопрос: где взять тысячи рентгеновских снимков чемоданов с оружием легально и без последствий? На практике такие данные почти недоступны.

Поэтому обучение ведётся на ограниченном наборе специализированных датасетов. Существуют наборы данных, содержащие изображения запрещённых или опасных объектов, разрешённых к использованию исключительно в научных исследованиях. Также можно найти редкие наборы, которые разрешено использовать в коммерческих целях. Но большинство таких датасетов закрыты лицензиями «только для исследований». Ниже представлены некоторые из них.

Датасет

Количество изображений

Типы объектов

Лицензия / ограничения

GDXray

20 966

Оружие, лезвия, обычный багаж (аэропортовский досмотр)

Только для исследований и обучения; коммерческое использование и распространение запрещены

SIXray

1 059 231

Пистолет, нож, гаечный ключ, плоскогубцы, ножницы, молоток

Только академическое использование; права принадлежат CAS

OPIXray

8 885

Складной нож, прямой нож, ножницы, хозяйственный нож, мультитул

Только академическое использование; коммерческое использование запрещено

PIDray

47 677

12 категорий запрещённых предметов (ножи, пистолеты, батарейки, зажигалки и др.)

Apache-2.0, но фактически только академическое использование

X-ray Contraband Detection Dataset

13 728

12 категорий контрабандных предметов (сбалансированный набор)

CC BY 4.0 — разрешено коммерческое использование с указанием авторства

В этот момент у бизнеса обычно наступает пауза, потому что выясняется, что обучить модель на красивых данных можно, а вот использовать её в реальной системе уже нет. Причины понятные: данные из аэропортов, требования безопасности, ограничения на распространение и юристы, которые сразу говорят «нет».

Поэтому компании идут обходными путями. Кто-то годами собирает собственные данные, кто-то договаривается с производителями оборудования, а кто-то уходит в синтетику.

Рентгеновские чемоданы действительно «фотошопят». Берут реальный снимок багажа. Берут 3D-модель ножа или другого предмета. И аккуратно встраивают одно в другое так, будто опасный объект действительно лежал внутри. Этот подход называется Threat Image Projection, или просто TIP.

В целом это работает. Модель начинает находить ножи быстрее. Количество примеров растёт без необходимости таскать настоящие опасные предметы по лабораториям. Но побочный эффект заключается в том, что нейросеть очень быстро привыкает к тому, как именно выглядят эти синтетические объекты.

Если в обучающем наборе нож почти всегда по центру изображения, хорошо виден и лежит отдельно, модель запоминает именно это. В реальности же нож может оказаться под ноутбуком, под курткой, под углом и ещё наполовину перекрыт зарядкой. Формально это тот же самый предмет, но для модели он уже выглядит «неправильно».

В какой-то момент она начинает уверенно говорить: «такого я раньше не видела». Это известная проблема разрыва между обучающими данными и реальным миром — то, что в машинном обучении называют domain gap.

0b664add702b6c41d096e25c55f45759.png

Дальше модель могут поставить на другой интроскоп, и результаты снова меняются. Отличается уровень шума, контраст, цветовая схема, энергия излучения. Для нас это выглядит как немного другая картинка, но для нейросети это уже другие данные, к которым она не готова. В машинном обучении это называют domain shift, и для рентгеновских изображений это одна из основных проблем.

Поэтому в реальных системах искусственный интеллект почти никогда не принимает окончательных решений. Он просматривает поток изображений и отмечает участки, которые выглядят нетипично или требуют особого внимания, а дальше уже человек это интерпретирует. Искусственный интеллект остается вспомогательным инструментом, нуждающимся в постоянном совершенствовании и новых данных.

Также необходимо научится решать еще одну задачу, а именно находить опасные предметы у которых формы нет вовсе.

Глава 4: Задача без формы

Оружие распознавать проще, потому что у него есть форма и геометрия, за которые можно зацепиться и человеку, и алгоритму. Взрывчатые вещества обладают крайне вариативной морфологией. Их внешний облик может варьироваться бесконечно, поскольку они способны принимать любую форму, смешиваться с различными материалами и успешно мимикрировать под повседневные предметы.

Интроскоп в этой ситуации делает ровно то, что умеет. Он показывает материал, но не даёт ответа о безопасности. Компьютерное зрение здесь тоже ограничено. Оно хорошо работает с формой и границами, а у взрывчатки их обычно нет. В результате данных недостаточно, чтобы уверенно отличить опасное от обычного.

d5ccb6e08c8d27b06e63da5615563c08.png

Поэтому в реальных системах не ограничиваются одной картинкой. Помимо обычного рентгеновского изображения используют двухэнергетический анализ, который позволяет грубо оценить состав материала. В некоторых системах дополнительно пытаются вычислить эффективный атомный номер вещества.

Более продвинутый вариант это компьютерная томография. КТ-сканер не даёт одну проекцию, а строит объёмную модель содержимого чемодана. Это упрощает анализ плотностей и уменьшает влияние перекрытий. По этой причине КТ постепенно становится стандартом досмотра в аэропортах. Но даже при этом проблема не исчезает.

Важно помнить, что особенность взрывчатых веществ заключается в том, что они представляют собой субстанции, способные изменять свою конфигурацию и интегрироваться в самые разнообразные среды, теряя индивидуальные геометрические черты. Система может сказать, что материал похож на опасный, но не может утверждать это наверняка.

С данными для обучения ИИ ситуация ещё сложнее. Реальных изображений с настоящими взрывчатыми веществами почти нет. Работа с ними опасна и жёстко регулируется. Поэтому модели обучают на лабораторных образцах, имитациях и синтетических данных. Любые подозрения в итоге всё равно проверяет человек. На практике досмотр работает как оценка риска. Если вероятность превышает заданный порог, багаж отправляют на дополнительную проверку. Окончательное решение снова остаётся за человеком.

Эффективность поиска оружия обусловлена наличием специфичных контуров и геометрии, тогда как выявление взрывчатых веществ осложняется отсутствием уникальных визуальных маркеров и возможностью интеграции в окружающие материалы.

Эпилог: В котором багаж возвращается владельцу

Современные интеллектуальные системы выполняют больше вспомогательную функцию, оперативно отмечая аномалии и подозрительные зоны на изображениях, оставляя право окончательного выбора за квалифицированным специалистом. Совместная деятельность человека и искусственного интеллекта демонстрирует синергию, позволяющую достичь лучших результатов благодаря объединению сильных сторон обеих сторон.

fcd3e20eb2f67621827ad7ae440bf3f2.png

Система будет развиваться и дальше. КТ-сканеры постепенно становятся стандартом, данные становятся разнообразнее, синтетические примеры ближе к реальности. При этом оператор становится больше аналитиком изображений, чем просто сторонним наблюдателем.

Но у этого процесса нет финальной точки. Методы досмотра меняются, злоумышленники тоже адаптируются, а физика по-прежнему не даёт однозначных ответов. В таких системах безопасность всегда остаётся оценкой риска.

Источник

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

VeBetter от VeChain обеспечивает миллионы экологичных действий благодаря партнерству с 4ocean

VeBetter от VeChain обеспечивает миллионы экологичных действий благодаря партнерству с 4ocean

VeChain и 4ocean запускают глобальную платформу очистки с использованием блокчейна для проверки и вознаграждения местных экологических действий. Экосистема VeBetter достигла 43 миллионов действий
Поделиться
Crypto News Flash2026/01/26 17:44
Как мы собрали среду для AI-ассистированной разработки приложений Битрикс24

Как мы собрали среду для AI-ассистированной разработки приложений Битрикс24

Привет, меня зовут Владимир Верхотуров, я занимаюсь DevRel в Битрикс24, а именно обеспечиваю связь внешних разработчиков (партнёры/клиенты) и внутренних команд,
Поделиться
ProBlockChain2026/01/26 13:00
Цена серебра достигает $108, поскольку акции горнодобывающих компаний входят в период бума денежных потоков

Цена серебра достигает $108, поскольку акции горнодобывающих компаний входят в период бума денежных потоков

Цена серебра сейчас выглядит практически неудержимой. Спотовая цена серебра в США взлетела до $108 за унцию, в то время как цены в Шанхае торгуются около рекордной отметки
Поделиться
Captainaltcoin2026/01/26 17:30