Разработчик Анатолий Лушников обучил нейросеть определять раковые опухоли по медицинским снимкам. То же решение позволяет за трое суток посчитать все деревья в СМОЛЕНСКОЙ области или выявить самострой. Антон Резниченко узнал, как это работает
Окончив физико-математический институт БФУ им. И. Канта по специальности «математик, системный программист», перешёл в международную компанию, где разрабатывал корпоративное программное обеспечение для анализа финансовых потоков, контроля деятельности предприятий.
На фоне технологического бума в 2012 году заинтересовался машинным обучением и нейронными сетями. В 2015 году начал работать над своим первым проектом в области искусственного интеллекта FutureMed, постепенно собирать коллектив программистов. К 2017 году нейронная сеть была обучена обрабатывать рентгеновские снимки и диагностировать онкологию с точностью в 90%. Проект пришлось заморозить из-за трудностей с нормативным регулированием технологий искусственного интеллекта и машинного обучения в медицине.
Сегодня команда Лушникова занимается анализом дистанционного зондирования Земли, проект называется ScanGeo. Разработчики используют те же технологии искусственного интеллекта, что и при диагностике медицинских снимков. Нейросеть позволяет находить незарегистрированные строения, выявить факты самозахвата территорий, незаконной вырубки леса. Например, программа может сравнить снимки, сделанные в 2020 и 2021 году, и найти отличия. После обучения нейросети скорость анализа составляет 20 секунд на 1 квадратный километр.
В ЧЕМ СУТЬ
— Есть множество технологий искусственного интеллекта: одни алгоритмы для работы с текстом, другие — для обработки аудио. Ты же выбрал компьютерное зрение, распознавание объектов. Почему?
— Скорее я выбрал не компьютерное зрение, а медицину: мне всегда казалось, что эта область требует совершенствования, а здоровье людей – то, во что следует вкладываться. Долгое время пробовал найти себя именно в этом: обучался в аспирантуре БФУ, занимался проектами, связанными с медициной. Технологии распознавания двумерных изображений можно эффективно использовать для поиска новообразований на снимках: рентген, флюорография. Внедрить разработки нашей команды, к сожалению, не получилось, но интерес к медицине сохранился.
— Объясни, что ты продаёшь. Это программа, код, аппарат?
— Часть, разрабатываемая нами, – это, условно говоря, структура мозга, которую будем наполнять данными. Эту структуру можно обучить различным задачам. Впоследствии обученная структура, способная анализировать данные и принимать решения, встраивается в программу, которой пользуется человек, – это финальный продукт.
— Грубо говоря, есть основа, её предназначение — распознавать. А потом вы уже прописываете, что именно ей нужно распознавать, — опухоли на снимках или самострой на картах, так?
— По сути, да. Но это не священная корова, которую один раз сделали и повсюду пихаем, нет. Структура [программы] может целиком меняться в зависимости от того, какую задачу ей предстоит решать.
— Сколько времени уходит на то, чтобы создать основу?
— В первую очередь мы проводим анализ, чтобы понимать, какую структуру нужно использовать для конкретной задачи. Довольно часто бывает, что лучше сделать свою собственную структуру — архитектуру нейронных сетей. На разработку может уйти один-два месяца. Естественно, это всегда поиск. Пробуем какое-нибудь стандартное решение, которое в общих случаях неплохо себя проявляет, сравниваем с ним получающуюся сеть, понимаем, есть ли необходимость её дорабатывать.
— Как происходит обучение нейросети?
— Довольно долго показываем программе большое количество данных, объясняем, что вот на этом снимке есть опухоль, а на другом её нет. Постепенно структура формирует для себя понимание, что такое опухоль. Наконец, показываем ей новый снимок, который она никогда не видела, и спрашиваем, есть ли на нём опухоль. Нейросеть выдаёт ответ.
— У тебя в команде пять человек. Кто за что отвечает?
— Мы все разработчики, способные анализировать результаты обучения, продумывать архитектуру нейросетей. Практически никогда не бывает такого, что вся команда сидит над одной архитектурой и знает, что она обязательно сработает. Обычно мы ищем решения в разных направлениях, можем параллельно работать над двумя совершенно непохожими архитектурами — ту, что окажется лучше, и будем использовать. Не попробовав два варианта, нельзя на сто процентов быть уверенным в своём решении.
НЕЙРОСЕТЬ И ОНКОЛОГИЯ
— В 2018 году на мероприятии фонда «Сколково» ты презентовал стартап FutureMed. Затем предложил решение по диагностике онкологических заболеваний региональному минздраву. Сейчас проект заморожен. Что не так?
— Мы два года пробовали запустить проект, но безуспешно. Основные проблемы были связаны не с технологиями, а с административными препятствиями, например медицинской сертификацией. Кроме этого, все смотрели на нашу разработку как на что-то опасное, неподходящее под регламенты. До конца не было понятно, как программа станет работать с существующим регулированием; неизвестно, как контролирующие органы отнесутся к тому, что эта система установлена на рабочие компьютеры и используется врачами.
— У тебя нет медицинского образования, но, допустим, вы работаете при какой-то больнице. Врачи дают определённый срок на тестирование вашей системы и в итоге убеждаются, что она работает. Такой вариант возможен?
— К сожалению, нет. Медицинская сертификация — очень сложная процедура с огромным количеством документации для того, чтобы описать, как система работает, может ли она каким-либо образом навредить пациенту. Это длительный и дорогостоящий процесс. Кроме этого, он плохо прописан для систем, использующих искусственный интеллект.
— В других странах иначе?
— За рубежом подобные технологии быстро признали системой поддержки принятия решений. Ответственность по-прежнему лежит на враче, но это сильно упрощает сертификацию технологий искусственного интеллекта. По крайней мере, их можно довольно быстро внедрять как сопроводительный инструмент в работе врача.
— Есть критика по поводу непрозрачности использования технологий искусственного интеллекта в медицине. Нейросеть выдает результат — даже правильный, — но никто не знает, почему она пришла к нему. В вашем случае так же было?
— Да, конечно, это общая проблема. Пока ещё не разработаны математический аппарат или подходы, дающие ответы на эти вопросы. Огромное количество людей сейчас трудится над тем, чтобы все решения нейронной системы стали прозрачными.
ДЕНЬГИ
— Вы начинали с решений для медицины, сколько на это ушло денег?
— По большей степени всё уходит на оплату труда, работа программиста стоит дорого. Из оборудования требуются специализированные компьютеры.
— Вы закупали их сами. Сколько потратили?
— Около 1,5 миллиона рублей.
— Решение крутое, но доступно ли оно для большинства? Допустим, я хочу проанализировать участок, выявить незаконную рубку или самострой. Сколько это будет стоить?
— Математику мы будем просчитывать, когда увидим, сколько ресурсов на это требуется. Скорее всего, ценник будет привязан к километрам.
— А приблизительно? Чтобы понимать, о чём идёт речь, в каких границах. Это 1 000 рублей или 500 000 рублей?
— Определённо ближе к тысяче. Но опять же, пока об этом рано говорить.
— На что сейчас существует команда?
—У части сотрудников есть другие проекты и источники дохода. Но уже сейчас получаем заказы, позволяющие компании зарабатывать. Мы также занимаемся консультированием и разработкой систем под отдельные заказы. Есть стартапы, к примеру, веб-платформа, для которой нужна аналитика. Мы предоставляем модули, готовые решения, их просто можно встроить, и это будет работать.
Развиваем систему в двух направлениях. Первое – это аналитика, чтобы можно было загрузить снимки и получить локальный результат. Кроме того, хотим интегрироваться с софтом для картографии
С РЕНТГЕНА НА СПУТНИК
— Как вышло, что от медицины команда перешла на анализ дистанционного зондирования Земли?
— Когда в 2019 году мы поняли, что в медицине с точки зрения внедрения будет сложно, переключились на другие сферы. Вначале занялись консультированием, увидели, что есть интерес к решениям с искусственным интеллектом, способным быстро анализировать большое количество спутниковых снимков. Первый прототип смогли собрать за полтора-два месяца. В первую очередь взяли объекты капитального строительства. Поиск, анализ, оценка, сопоставление с публичной кадастровой картой.
— Много заказчиков в этой сфере?
— Пока немного. Сейчас мы находимся на стадии разработки, готовим продукт к запуску. Сопоставляем данные с публичной кадастровой картой, может быть, подключим ещё дополнительные источники [данных], чтобы получить полноценный анализ. Когда соберём весь необходимый функционал, можно говорить о продажах.
— Вы сотрудничали с «Региональным градостроительным центром». Или это не в счёт?
— Скажем так, это было разовое мероприятие, тестовое. Одному из госучреждений было интересно посмотреть, какую аналитику можно получить по ряду снимков. Заказчик остался доволен: он увидел, что можно автоматизировать огромное количество ручной работы. Параллельно мы общаемся с другими компаниями, разрабатывающими программное обеспечение для картографии, и они тоже говорят, что потребность в таком инструменте есть.
Мы развиваем систему в двух направлениях. Первое – это аналитика, чтобы можно было загрузить снимки и получить локальный результат. Кроме того, хотим интегрироваться с софтом для картографии. В таком случае человек, работая с программным обеспечением, в любой момент сможет нажать кнопку и моментально получить всю информацию о том земельном участке, на который смотрит.
— Насколько эти решения новые для России?
— Они только-только начали появляться. Знаю, что есть конкуренты в Москве, они занимаются разработкой
похожих решений и находятся примерно на той же стадии, что и мы. Но нужно смотреть на детали полноценной системы на базе искусственного интеллекта — это достаточно новая тема. Если мы говорим про землепользование, то наверняка какие-то разработки в этом направлении велись, просто я не слышал о готовых системах, где всё реализовано.
— В каких ещё отраслях может быть полезна нейросеть ScanGeo?
— Землепользование, сельское хозяйство. Можно находить незаконные вырубки, вести наблюдение за полями: что растёт, как производится обработка, есть ли какие-то проблемы.
— Можешь оценить, сколько компаний в России открыты к таким новшествам?
— В землепользовании и сельском хозяйстве их гораздо больше, чем в медицине. Там реакция практически всегда была одинаковой: «Что это за ерунда, ваша машина никогда не будет так же хорошо ставить диагноз, как врач». За последние два-три года отношение к технологиям искусственного интеллекта полностью поменялось.