Новая нефть, кровь или глина? Чем пахнут медицинские данные.
0
Потенциал у медицинских данных и построенных на их обработке сервисах огромен, по этому поводу спикеры Х Телемедфорума не спорили. Однако взгляды на то, как именно будет выглядеть инфраструктура для использования медданных в научных и коммерческих целях, у участников рынка разные. Добавляет остроты в этот спор существенная разница в точках зрения между Минцифры и Минздравом. Споры могут длиться долго, а лечить нужно сегодня, поэтому уже есть кейсы, в которых медданные становятся базой для появления принципиально новых методов диагностики и лечения.
Станут ли медицинские данные новой нефтью или ценным парфюмом, или останутся глиноземом (разные определения звучали на форуме), в первую очередь зависит от того, как будут проработаны существующие барьеры. Главной целью сессии Телемедфорума «Data Policy в России — лабиринт непринятых решений: нормативные, организационные, технологические ограничения рынка медицинских данных» было систематизировать барьеры, проанализировать существующий опыт их преодоления и найти точки сотрудничества между разными стейкхолдерами, которые заинтересованы в развитии темы. В основу внутриотраслевого диалога легло исследование по Data Policy в здравоохранении, проведенное отраслевой ассоциацией НБМЗ, компаниями Verba Legal и «Цифровая медицина» при поддержке представителя фармацевтического бизнеса компании «Рош-Москва». Презентуя исследование, модератор сессии старший юрист Verba Legal Карина Колобова отметила ценность широкой представленности экспертов, заинтересованных обсуждать тему исследования: «Мы собрали очень большую панель спикеров — это говорит о том, что она действительно волнует самые разные категории участников. Попробуем вместе определить реперные точки и будущий порядок действий, чтобы достичь одной большой общей цели».
И действительно, большинство спикеров сессии откровенно делилось многолетним опытом развития своих организаций, соглашаясь, что только совместные усилия позволят выйти на работоспособные механики взаимодействия между регуляторами и участниками рынка, выбрать лучшие и безопасные практики работы с данными, превратив часть из них впоследствии в отраслевой стандарт.
Кому и в каких целях нужны данные?
Фармацевтические компании очень заинтересованы в упорядочивании вопросов доступа к данным и их обезличивания. «Это критически важно и прописано в наших глобальных и локальных стратегиях», — отметил руководитель рабочей группы по цифровизации АМФП, лидер по развитию политик в сфере цифрового здравоохранения и доступа к данным в АО «Рош-Москва» Василий Светлов. «Чтобы планировать производство и прогнозировать доступность препаратов, мы используем данные МДЛП (мониторинг движения лекарственных препаратов). Это отличный пример того, как агрегированные данные помогают управлять производственными мощностями», — поддержала коллегу менеджер по аналитике и ведению инновационных проектов AstraZeneca Ирина Мельникова.
Известно, что все фармкомпании реализуют RWE-исследования (Real World Evidence), многоцентровые, с участием тысяч пациентов, направленные на улучшение качества жизни, особенно при хронических заболеваниях. Это хорошо проработанный сегмент рынка, в котором цифровизация сильно изменила процессы. Однако чтобы двигаться быстрее корректировать объемы производства, а также ускорить выход новых лекарств, у фармпроизводителей есть потребности в других группах агрегированных данных.
«Например, внедрение СППВР для пациентов с хроническими воспалительными заболеваниями позволило выявить большое количество пациентов с маркерами ХВЗ», — говорит Мельникова, подчеркивая, что своевременный доступ к таким данным позволяет производителю оперативно скорректировать выпускаемые объемы препаратов.
«На основе данных мы можем сократить путь от постановки диагноза к назначению терапии. Без Big Data это просто невозможно», — согласен с коллегой Василий Светлов.
Но пока данные из ЕГИСЗ практически не доставаемы, сделать работу с ними системной у представителей фармотрасли не получится. Поэтому, не дожидаясь изменений на верхнем уровне, фармкомпании идут в проектное сотрудничество с отдельными производителями данных и получают результаты. По информации Ирины Мельниковой, в одном из таких проектов их компании в Санкт-Петербурге и Нижнем Новгороде ИИ-инструменты помогли повысить эффективность диагностики онкозаболеваний на 10%.
Есть готовые к таким проектам и среди производителей медицинских данных. О разработке авторской методологии для сбора данных в офтальмологии рассказал советник по цифровой медицине ИСП РАН, главный специалист по ИИ НИИГБ им. М.М. Краснова Андрей Бурсов, по мнению которого большинство медицинских учреждений «не может жить в ретроспективной парадигме», потому что:
базы часто устарели морально;
нет согласия пациентов;
многие системы не позволяют выгрузить данные автоматически;
приходится корректировать данные вручную.
Но главная проблема, по мнению Андрея Бурсова, заключается в том, что сами по себе «медицинские данные без экспертизы — ничего не стоят». Именно разметка экспертами НИИГБ наделяет дата-сеты ценностью, формируя, таким образом, медицинский цифровой продукт, состоящий из результатов исследований и реального опыта специалистов. С 2025 года планируется расширение проекта на другие патологии и форматы. Как отметил Бурсов, интерес к тиражированию у НИИГБ максимальный, но в первую очередь необходимо отработать методику внутри института на разных типах данных и нозологиях, после этого можно будет уже делиться именно методикой.
Многие профильные НИИ, НМИЦ и крупные частные медицинские центры уже двигаются по этому пути: создают методики, размечают данные, обучают ИИ-инструменты, идут в коллаборации друг с другом. «Пациенты, государство и индустрия заинтересованы в одном и том же», — резюмирует Ирина Мельникова, теперь вопрос в том, как обустроить организационно и технически использование накопленных или собираемых в настоящее время данных. Тем более, что разный, в том числе и позитивный, мировой опыт на эту тему есть, что позволяет выбрать максимально подходящую к российскому ландшафту конфигурацию практик и правил.
Среди страновых кейсов, выбранных АМФП для изучения, — опыт Южной Кореи и Европейского союза.
Они признаны наиболее релевантными и успешными с точки зрения:
обезличивания,
регулирования,
удобства доступа к данным.
Южная Корея
В 2009 году принят ряд нормативных актов, таких как закон PIPA, регулирующий обработку данных. Создана государственная структура — HIRA (Health Insurance Review and Assessment Service), в неё загружено порядка 98% данных по системе ОМС — это около 50 миллионов человек. В результате у регулятора есть возможность:
корректно рассчитать потребности системы здравоохранения (включая лекарственные);
предоставлять доступ к этим данным фармкомпаниям.
Вторая инициатива — Humanscape — это частная платформа для пациентов с редкими заболеваниями (уже 46 000 пользователей). «Пациенты сами загружают данные, сами решают, кому и в каком объёме их передавать. Всё работает в легальном правовом поле», — поясняет цифры Василий Светлов.
Европейский союз
Проект EHDS (европейское пространство медицинских данных) реализацуется уже порядка 10 лет. В рамках проекта:
происходит сбор, упорядочивание и безопасный доступ ко всем медицинским данным ЕС;
прописываются чёткие правила: кто, когда, в каком объёме имеет доступ;
создаются контролирующие структуры в каждой стране ЕС.
«Тем самым повышается автономия граждан в управлении своими данными, а также появляется инфраструктура для научных исследований и новых решений», — считает Василий Светлов.
Психологических ограничений на использование медицинских данных нет. Но есть масса других.
В рамках отраслевого исследования по Data Policy не ставился вопрос о психологических аспектах использования данных теми целевыми группами, кто сегодня вправе ими распоряжаться (правда тоже с некоторыми ограничениями). Но ряд спикеров опирались на исследования, из которых следует, что и врачи, и пациенты выступают за полноценный обмен данными между разными участниками системы здравоохранения.
В 2023 году АМФП провела исследование совместно с «Право на здоровье». В нём приняли участие:
1 500 пациентов
3 000 врачей
«Более половины врачей относятся к вторичному использованию данных фармкомпаниями абсолютно нормально. Они видят в нас одного из ключевых игроков в экосистеме и ожидают участия в цифровой трансформации», — комментирует результаты опроса Василий Светлов.
Весьма убедительно выглядит еще одно исследование, представленное заместителем председателя Координационного совета МОД «Движение против рака» Галиной Маргевич, которая настаивает, что единственным легитимным владельцем данных является сам пациент. И вот что сами пациенты думают об этом.
Выводы, которые сделали в фонде на основании опросов, однозначны: «Пациенты готовы делиться данными, если понимают, зачем и кому они отдаются, а также при гарантированной защите персданных. Если пациент информирован — он с большей вероятностью согласится», — комментирует результаты исследования Галина Маргевич.
В ситуации, когда при выполнении определенных условий все стороны процесса заинтересованы, казалось бы, должно быть быстрое развитие. Но пока Россия отстает от приведенных в пример западных и восточных стран. Из 39 зарегистрированных ИИ-медизделий — 30 “сидят” в радиологии, и большинство продуктов сформировалось благодаря одному крупному заказчику — Департаменту здравоохранения Москвы. В массе других сегментов, включая маршрутизацию пациентов, лекарственное обеспечение, нет обученных моделей и зарегистрированных сервисов. Кроме того, скорость появления перспективных проектов в этих сегментах низкая. А потребность в изменениях, в первую очередь, для решения проблемы дефицита медицинских кадров, наоборот, высокая.
Нормативные, организационные и технические причины, которые лежат в основе этого тренда, исследованы и описаны. С выдержкой из исследования можно ознакомиться здесь.
Обсуждение этих причин на сессии Телемедфорума подсветило тему недостаточности внутриотраслевого диалога с владельцами данных, с Минздравом и Минцифрой. Высказано предложение, что помимо обсуждений темы на конференциях, должны постоянно действовать рабочие группы с участием органов власти.
И, чтобы взаимопонимание между участниками процесса было достигнуто на раннем этапе, в отрасли появилась еще одна интерпретация понятия «медицинские данные». «Мы договорились с коллегами называть данные новой кровью. Это, мне кажется, более логично и правильно. Обмен данными — это как донорство: обмен даёт возможность спасать жизни», — отметил Василий Светлов в завершении своего выступления.
Как устроен сегодня обмен медицинскими данными в государственном сегменте здравоохранения
«Круговорот данных в природе», по информации генерального директора ассоциации «Национальная база медицинских знаний» и научного руководителя компании «АйПат» Бориса Зингермана, выглядит следующим образом: Пациент → Медорганизация → Интеграторы и «шины» → Региональный уровень → СЭМД → ЕГИСЗ. «Единственный заявленный результат работы ЕГИСЗ сегодня — это то, что через портал Госуслуг эти данные будут доступны пациенту. Круг замкнулся», — сетует Борис Зингерман. Он рассматривает возможность донации данных самими пациентами как максимально легитимную сегодня. «Более 10 лет назад я получил выговор за то, что по заявке самого пациента мы передали ему его же данные. В 2013 году это считалось нарушением. Мы тогда обсуждали: стоит ли врачам отдавать пациентам их данные? Врачи считали, что отдавать нельзя», — поделился историей глава НБМЗ.
Сегодня ситуация принципиально иная — требуется согласие пациента для передачи данных в другую медорганизацию. Однако, как его получить — непонятно, поэтому до сих пор во многих странах, включая Россию, пришли к модели: хочешь передать данные — отдай пациенту, пусть сам отнесёт, только теперь это можно сделать в электронной форме.
Сейчас появился новый класс данных — данные дистанционного мониторинга здоровья человека. Их и сейчас очень много, а станет кратно больше — в соответствии с нацпроектом «Продолжительная и активная жизнь» к 2030 году 100% хронических пациентов должны быть на дистанционном мониторинге, а это десятки миллионов человек, и они будут генерить данные 24/7: давление, глюкоза, пульс, вес, активность, питание, сон и др. И пока нет даже намека на то, как именно будут обрабатываться эти данные, попадать к врачу и самому пациенту и каковы сценарии их обработки.
По мнению Зингермана, термин "донация" данных должен стать важным понятием ближайших лет. И под эту процедуру должна быть выстроена определенная инфраструктура.
Что от неё нужно пациенту:
удобный интерфейс управления данными;
юридические основания для прозрачной передачи;
понимание: кому, зачем, в каком виде он отдаёт данные.
Что она должна предлагать людям:
программы лояльности;
доступ к сервисам;
участие в исследованиях.
Экспертам очевидно, что задача не из простых. «Google Health, Microsoft HealthVault, наш Медархив — в 2010-е годы не выжили», — отмечает Борис Зингерман.
«Но может тогда было рано? Может у пациентов не было достаточного объема цифровых медицинских документов. Сейчас их очень много, но инструментов их хранения и использования — нет. Может быть, пора вернуться? Только не как интернет-сервис, а на базе пациентской организации. Например, Всероссийский союз пациентов может стать провайдером такого сервиса. Данные — это не нефть. Это кровь здравоохранения. Как мы сдаём кровь — в рамках донации, — так же мы можем организовать донацию данных. С этическими, юридическими, технологическими и мотивационными основаниями», — резюмировал он, обращаясь к коллегам и призывая участников форума подключиться к этой задаче.
Альтернатива: данные — не нефть, не кровь, а парфюм
«На самом деле, данные — это не нефть. Данные — это как в парфюмерии: надо три тонны цветов переработать, чтобы каплю парфюма выдавить. И потом наслаждаться этим ароматом», — считает директор по развитию Webiomed (К-Скай), компании, разрабатывающей сервисы прогнозной и управленческой аналитики на основе больших медицинских данных Александр Гусев. «В России 100% государственных медорганизаций используют медицинские информационные системы. Мы входим в десятку стран мира по объёму и охвату таких данных», — утверждает Гусев. Однако, по его словам, их потенциал пока не реализован: «У нас есть ощущение, что мы как собака на сене — данные накоплены, но используются минимально. Лишь малая доля идёт на принятие решений или аналитику. А возможностей — масса. Вопрос: как с этим работать? Мы тоже у себя накапливаем огромное количество данных. Сегодня это больше 50 миллионов пациентов, несколько терабайт архивов».
Уже сегодня с данными активно работают научные центры, подведомственные организации Минздрава и фармацевтические компании, есть действительно интересные, прорывные идеи, но нормальные исследования невозможны без популяционных наборов.
В стратегии цифровой трансформации здравоохранения официально заложены два ключевых показателя — по наборам данных и по медизделиям с ИИ. Их не выполнить, если не научиться с этими данными работать, считает Гусев.
Три ключевых барьера, с которыми сталкиваются все игроки рынка, по мнению эксперта.
Доступ к архивам. «Мы накапливаем обезличенные данные в рамках СППВР. Но любая юридическая служба говорит: эти данные можно использовать только для целей самой СППВР. Только для оказания медицинской помощи. Провести научное исследование на этом архиве — уже юридически непросто, формально нужно спрашивать на это согласие пациента. А собрать новые данные после получения согласия — это значит ждать 10 лет. Таким образом, архив ретроспективных данных есть, а использовать его нельзя. На наш взгляд, единственный выход — запуск экспериментального правового режима»
Технический и организационный тупик при получении данных. «Даже если архив есть и юридическое разрешение получено, мы, как дата-провайдер, технически не можем забрать данные. Мы можем только их получить. А для этого нужно, чтобы какая-то информационная система нам их отправила. То есть, кто-то должен осуществить выгрузку из МИС, и есть только два способа это сделать: административное давление или коммерческая мотивация. Второй барьер — информбезопасность, чтобы принять хотя бы один байт информации — нужен год-два подготовки и миллионы затрат на сертификацию, аттестацию, разрешения.»
Обезличивание данных. «Казалось бы: что сложного в обезличивании электронной медкарты? Убрали ФИО, полис, адрес, дату рождения — и всё. Есть курьезные случаи, но настоящая проблема — текстовые поля, врачи часто пишут: “Гражданка Петрова Мария Ивановна обратилась ко мне с жалобами…” — и в сводном тексте, в истории болезни, огромное количество персональных данных. Просто найти и удалить эти данные технически очень сложно. Мы больше года инвестировали в NLP-модель, которая умеет это находить и удалять. ФИО, СНИЛС, полисы, номера паспортов — что угодно может попасть в текст. Если мы работаем с ЕГИСЗ — там данные уже обезличены. Но если с региональными МИС — инструмент обезличивания должен быть, и он должен быть проверен».
Анализируя миллионы записей, в компании К-Скай пришли к выводу, что первичные данные медицинских осмотров — это не нефть, а «глина и чернозём». ЭМК — это источник с низкой плотностью ценной информации. Да, в ней есть структурированные и неструктурированные поля: чтобы нормально заполнить первичный осмотр даже у обычного пациента — нужно 30–40 минут, у врачей их нет на львиной доле приёмов, поэтому есть масса текстовых записей.
Осознав проблему, разработчики пришли к выводу, что оценка качества ЭМК — необходимый шаг. «Мы создали алгоритм оценки качества и встроили его в платформу. Если качество приемлемое — запускаем алгоритмы. Если на входе мусор — выдать осмысленный результат невозможно», — рассказывает о новом продукте Гусев.
Оценка качества показала, что почти половина ЭМК — это просто регистрация приема: метаданные, сведения об обращаемости, но без жалоб, анамнеза, объективного осмотра и прочих клинических данных. Таким образом, если нужна выборка на миллион пациентов, где есть клинически валидные данные, то нужно прогнать десятки миллионов записей. Но даже корректно заполненные поля — неоднородны и неполны.
«ЭМК — это в основном врачебные осмотры. Но для серьёзных исследований нужны подтверждающие данные, например, лабораторная диагностика. А их часто нет. Вам придётся использовать суррогатные точки, субъективные предикторы, интерпретировать косвенные признаки. Это делает задачу ещё сложнее. Создание data-driven компании — это как добыча нефти и производство бензина. Есть этапы: доступ, сбор, обезличивание, линковка, извлечение, формирование профилей, и только потом — аналитика» , — говорит Александр Гусев.
Юридические барьеры доступа к большим медицинским данным
Но если организационные и технологические барьеры участники рынка не быстро, но способны преодолеть, то юридические барьеры могут поставить на стоп практически любой проект, в основе которого лежат большие медицинские данные.
Старший юрист Verba Legal Карина Колобова призвала участников конференции не забывать, что «медицинские данные во всех случаях — это персональные данные, это специальная категория, к которой предъявляются гораздо более строгие требования».
Основания для обработки медицинских данных
«Если задать вопрос — на каком основании мы можем использовать медицинские данные, например, для аналитики или научных исследований — ответ не слишком утешительный», — говорит Карина Колобова. По её мнению, оснований сегодня только два:
Согласие пациента
Экспериментальные правовые режимы (ЭПР)
Чтобы использовать данные с согласия пациента, нужно:
получить согласие от каждого пациента на использование именно его данных;
зафиксировать, в рамках какого конкретного исследования и с какой целью они будут использованы.
«Если мы говорим о ретроспективных исследованиях, получить такие согласия физически невозможно. Люди могли переехать, не наблюдаться или не дожить до момента использования их данных», — поддерживает выводы разработчиков Карина Колобова.
Формальные сложности:
Требуется письменная форма согласия: либо бумажный документ, либо усиленная квалифицированная электронная подпись.
Использование простой электронной подписи возможно только при отдельном соглашении с субъектом данных.
«Очевидно, что сделать это с миллионами пациентов — невозможно», — считает Карина Колобова.
Содержательные сложности
Закон требует указания:
конкретных целей обработки;
всех операторов;
перечня всех данных;
сроков хранения и др.
Также существует проблема отзыва согласия самим пациентом. «Пациент может отозвать согласие в любой момент. А что делать, если данные уже обезличены или переданы? Какие именно данные удалять — непонятно», — описывает коллизию представитель Verba Legal.
Обезличивание медицинских данных пока не выход
Очень глубоким получилось обсуждение обезличенных данных. «Казалось бы, простой путь: обезличим данные — и всё. Но тут тоже всё непросто — получается замкнутый круг», — задала тон Карина Колобова. Эксперт описала юридическую коллизию:
обезличенные данные всё ещё считаются персональными;
сам процесс обезличивания — это тоже обработка, и требует согласия.
Кроме этого есть техническая неопределённость:
нет ответа, какие поля можно оставить, сколько атрибутов удалить;
нет универсального порядка обезличивания для частного сектора, действующие порядки касаются госорганов и ЕГИСЗ;
в России нет различия между анонимизацией (невозможно восстановить личность) и псевдонимизацией (есть ключ для восстановления) данных.
«Поэтому все обезличенные данные на всякий случай считаются персональными, — говорит Карина Колобова. — Во всех проанализированных нами юрисдикциях возможность такой обработки предусмотрена. Это тот шаг, который, возможно, нам тоже предстоит сделать, чтобы работа с данными наконец вышла за рамки “всё запрещено, кроме согласия” и превратилась в реально работающую экосистему». Эксперт сформулировала, какие именно нужны изменения в законодательстве.
Предложения по снятию барьеров при обезличивании данных Verba Legal c комментариями Карины Колобовой
Добавить основание для обработки обезличенных медданных в исследовательских целях — без согласия. «Как во многих юрисдикциях — если данные обезличены и используются для исследований, согласие не требуется.»
Уточнить, что обезличивание не требует согласия. «Иначе новый механизм будет парализован — ведь сначала нужно будет получить согласие на саму процедуру обезличивания.»
Разрешить изменение цели обработки данных. «Сейчас цель должна быть изначально зафиксирована. Это ограничивает повторное использование, даже во благо пациента.»
Создать единый порядок обезличивания — и для госорганов, и для частного сектора. «Сейчас 96-й приказ Роскомнадзора формально применяется только к государственным структурам. Это создаёт правовую неуверенность для частных компаний.»
Ввести риск-ориентированный подход вместо универсального обезличивания. «Один и тот же набор полей может быть безопасным в одном дата-сете и небезопасным — в другом. Поэтому нужен риск-ориентированный подход.»
Кто бенефициар создания новых правил обращения с медицинскими данными
Опасения высказываются самыми разными участниками процесса, и у каждой группы свой резон. Врачи боятся, что станут не нужны, государство, что скомпрометированные медицинские данные станут основой мошеннических схем, пациенты того, что с ними перестанут работать живые врачи, бизнес, что будут неконкурентные условия и т.д.К счастью, ни одна из влиятельных социальных групп не табуирует тему и открыта к сотрудничеству, видя потенциальную пользу от устранения барьеров. А некоторые «продвинутые» в теме эксперты считают, что польза перевешивает потенциальные риски внедрения новых инструментов. «Большие данные и инструменты, построенные с применением искусственного интеллекта — это уже наше настоящее, очень актуальное направление. Мы знаем, что с его помощью анализируется множество снимков, и иногда он может увидеть то, что упустит человеческий глаз. Наша задача — сделать так, чтобы врачу было комфортно, чтобы он не тревожился о своем трудоустройстве. ИИ должен быть помощником: и врачу, и пациенту, и клинике», — считает главный научный сотрудник отдела патологии сетчатки и зрительного нерва ФГБНУ «НИИ ГБ им. М.М. Краснова» д.м.н. Анна Плюхова. Руководитель направления "Здравоохранение" Yandex Cloud Евгений Попов предлагает не ждать, когда условия станут тепличными, и уже сейчас инициировать изменения: «Чтобы двигаться вперёд, нужно найти юридическую коллизию, прийти к регулятору и сказать: “давайте менять”». «Сложности с данными всегда будут, но если цель благородная, находятся не причины поставить на стоп, а возможности двигаться и искать варианты», — считает Попов. Он приглашает разработчиков и стартапы в яндексовский «Центр технологий для общества» реализовывать социально-значимые проекты, для поддержки которых у компании есть четкая стратегия. Именно такие проекты и создадут прочную основу рыночных правил, в которых будет сложно, но уже возможно быстро получать прорывной результат от внедрения новых технологий и при этом минимизировать риски.
Станут ли медицинские данные новой нефтью или ценным парфюмом, или останутся глиноземом (разные определения звучали на форуме), в первую очередь зависит от того, как будут проработаны существующие барьеры. Главной целью сессии Телемедфорума «Data Policy в России — лабиринт непринятых решений: нормативные, организационные, технологические ограничения рынка медицинских данных» было систематизировать барьеры, проанализировать существующий опыт их преодоления и найти точки сотрудничества между разными стейкхолдерами, которые заинтересованы в развитии темы. В основу внутриотраслевого диалога легло исследование по Data Policy в здравоохранении, проведенное отраслевой ассоциацией НБМЗ, компаниями Verba Legal и «Цифровая медицина» при поддержке представителя фармацевтического бизнеса компании «Рош-Москва». Презентуя исследование, модератор сессии старший юрист Verba Legal Карина Колобова отметила ценность широкой представленности экспертов, заинтересованных обсуждать тему исследования: «Мы собрали очень большую панель спикеров — это говорит о том, что она действительно волнует самые разные категории участников. Попробуем вместе определить реперные точки и будущий порядок действий, чтобы достичь одной большой общей цели».
И действительно, большинство спикеров сессии откровенно делилось многолетним опытом развития своих организаций, соглашаясь, что только совместные усилия позволят выйти на работоспособные механики взаимодействия между регуляторами и участниками рынка, выбрать лучшие и безопасные практики работы с данными, превратив часть из них впоследствии в отраслевой стандарт.
Кому и в каких целях нужны данные?
Фармацевтические компании очень заинтересованы в упорядочивании вопросов доступа к данным и их обезличивания. «Это критически важно и прописано в наших глобальных и локальных стратегиях», — отметил руководитель рабочей группы по цифровизации АМФП, лидер по развитию политик в сфере цифрового здравоохранения и доступа к данным в АО «Рош-Москва» Василий Светлов. «Чтобы планировать производство и прогнозировать доступность препаратов, мы используем данные МДЛП (мониторинг движения лекарственных препаратов). Это отличный пример того, как агрегированные данные помогают управлять производственными мощностями», — поддержала коллегу менеджер по аналитике и ведению инновационных проектов AstraZeneca Ирина Мельникова.
Известно, что все фармкомпании реализуют RWE-исследования (Real World Evidence), многоцентровые, с участием тысяч пациентов, направленные на улучшение качества жизни, особенно при хронических заболеваниях. Это хорошо проработанный сегмент рынка, в котором цифровизация сильно изменила процессы. Однако чтобы двигаться быстрее корректировать объемы производства, а также ускорить выход новых лекарств, у фармпроизводителей есть потребности в других группах агрегированных данных.
«Например, внедрение СППВР для пациентов с хроническими воспалительными заболеваниями позволило выявить большое количество пациентов с маркерами ХВЗ», — говорит Мельникова, подчеркивая, что своевременный доступ к таким данным позволяет производителю оперативно скорректировать выпускаемые объемы препаратов.
«На основе данных мы можем сократить путь от постановки диагноза к назначению терапии. Без Big Data это просто невозможно», — согласен с коллегой Василий Светлов.
Но пока данные из ЕГИСЗ практически не доставаемы, сделать работу с ними системной у представителей фармотрасли не получится. Поэтому, не дожидаясь изменений на верхнем уровне, фармкомпании идут в проектное сотрудничество с отдельными производителями данных и получают результаты. По информации Ирины Мельниковой, в одном из таких проектов их компании в Санкт-Петербурге и Нижнем Новгороде ИИ-инструменты помогли повысить эффективность диагностики онкозаболеваний на 10%.
Есть готовые к таким проектам и среди производителей медицинских данных. О разработке авторской методологии для сбора данных в офтальмологии рассказал советник по цифровой медицине ИСП РАН, главный специалист по ИИ НИИГБ им. М.М. Краснова Андрей Бурсов, по мнению которого большинство медицинских учреждений «не может жить в ретроспективной парадигме», потому что:
базы часто устарели морально;
нет согласия пациентов;
многие системы не позволяют выгрузить данные автоматически;
приходится корректировать данные вручную.
Но главная проблема, по мнению Андрея Бурсова, заключается в том, что сами по себе «медицинские данные без экспертизы — ничего не стоят». Именно разметка экспертами НИИГБ наделяет дата-сеты ценностью, формируя, таким образом, медицинский цифровой продукт, состоящий из результатов исследований и реального опыта специалистов. С 2025 года планируется расширение проекта на другие патологии и форматы. Как отметил Бурсов, интерес к тиражированию у НИИГБ максимальный, но в первую очередь необходимо отработать методику внутри института на разных типах данных и нозологиях, после этого можно будет уже делиться именно методикой.
Многие профильные НИИ, НМИЦ и крупные частные медицинские центры уже двигаются по этому пути: создают методики, размечают данные, обучают ИИ-инструменты, идут в коллаборации друг с другом. «Пациенты, государство и индустрия заинтересованы в одном и том же», — резюмирует Ирина Мельникова, теперь вопрос в том, как обустроить организационно и технически использование накопленных или собираемых в настоящее время данных. Тем более, что разный, в том числе и позитивный, мировой опыт на эту тему есть, что позволяет выбрать максимально подходящую к российскому ландшафту конфигурацию практик и правил.
Среди страновых кейсов, выбранных АМФП для изучения, — опыт Южной Кореи и Европейского союза.
Они признаны наиболее релевантными и успешными с точки зрения:
обезличивания,
регулирования,
удобства доступа к данным.
Южная Корея
В 2009 году принят ряд нормативных актов, таких как закон PIPA, регулирующий обработку данных. Создана государственная структура — HIRA (Health Insurance Review and Assessment Service), в неё загружено порядка 98% данных по системе ОМС — это около 50 миллионов человек. В результате у регулятора есть возможность:
корректно рассчитать потребности системы здравоохранения (включая лекарственные);
предоставлять доступ к этим данным фармкомпаниям.
Вторая инициатива — Humanscape — это частная платформа для пациентов с редкими заболеваниями (уже 46 000 пользователей). «Пациенты сами загружают данные, сами решают, кому и в каком объёме их передавать. Всё работает в легальном правовом поле», — поясняет цифры Василий Светлов.
Европейский союз
Проект EHDS (европейское пространство медицинских данных) реализацуется уже порядка 10 лет. В рамках проекта:
происходит сбор, упорядочивание и безопасный доступ ко всем медицинским данным ЕС;
прописываются чёткие правила: кто, когда, в каком объёме имеет доступ;
создаются контролирующие структуры в каждой стране ЕС.
«Тем самым повышается автономия граждан в управлении своими данными, а также появляется инфраструктура для научных исследований и новых решений», — считает Василий Светлов.
Психологических ограничений на использование медицинских данных нет. Но есть масса других.
В рамках отраслевого исследования по Data Policy не ставился вопрос о психологических аспектах использования данных теми целевыми группами, кто сегодня вправе ими распоряжаться (правда тоже с некоторыми ограничениями). Но ряд спикеров опирались на исследования, из которых следует, что и врачи, и пациенты выступают за полноценный обмен данными между разными участниками системы здравоохранения.
В 2023 году АМФП провела исследование совместно с «Право на здоровье». В нём приняли участие:
1 500 пациентов
3 000 врачей
«Более половины врачей относятся к вторичному использованию данных фармкомпаниями абсолютно нормально. Они видят в нас одного из ключевых игроков в экосистеме и ожидают участия в цифровой трансформации», — комментирует результаты опроса Василий Светлов.
Весьма убедительно выглядит еще одно исследование, представленное заместителем председателя Координационного совета МОД «Движение против рака» Галиной Маргевич, которая настаивает, что единственным легитимным владельцем данных является сам пациент. И вот что сами пациенты думают об этом.
Выводы, которые сделали в фонде на основании опросов, однозначны: «Пациенты готовы делиться данными, если понимают, зачем и кому они отдаются, а также при гарантированной защите персданных. Если пациент информирован — он с большей вероятностью согласится», — комментирует результаты исследования Галина Маргевич.
В ситуации, когда при выполнении определенных условий все стороны процесса заинтересованы, казалось бы, должно быть быстрое развитие. Но пока Россия отстает от приведенных в пример западных и восточных стран. Из 39 зарегистрированных ИИ-медизделий — 30 “сидят” в радиологии, и большинство продуктов сформировалось благодаря одному крупному заказчику — Департаменту здравоохранения Москвы. В массе других сегментов, включая маршрутизацию пациентов, лекарственное обеспечение, нет обученных моделей и зарегистрированных сервисов. Кроме того, скорость появления перспективных проектов в этих сегментах низкая. А потребность в изменениях, в первую очередь, для решения проблемы дефицита медицинских кадров, наоборот, высокая.
Нормативные, организационные и технические причины, которые лежат в основе этого тренда, исследованы и описаны. С выдержкой из исследования можно ознакомиться здесь.
Обсуждение этих причин на сессии Телемедфорума подсветило тему недостаточности внутриотраслевого диалога с владельцами данных, с Минздравом и Минцифрой. Высказано предложение, что помимо обсуждений темы на конференциях, должны постоянно действовать рабочие группы с участием органов власти.
И, чтобы взаимопонимание между участниками процесса было достигнуто на раннем этапе, в отрасли появилась еще одна интерпретация понятия «медицинские данные». «Мы договорились с коллегами называть данные новой кровью. Это, мне кажется, более логично и правильно. Обмен данными — это как донорство: обмен даёт возможность спасать жизни», — отметил Василий Светлов в завершении своего выступления.
Как устроен сегодня обмен медицинскими данными в государственном сегменте здравоохранения
«Круговорот данных в природе», по информации генерального директора ассоциации «Национальная база медицинских знаний» и научного руководителя компании «АйПат» Бориса Зингермана, выглядит следующим образом: Пациент → Медорганизация → Интеграторы и «шины» → Региональный уровень → СЭМД → ЕГИСЗ. «Единственный заявленный результат работы ЕГИСЗ сегодня — это то, что через портал Госуслуг эти данные будут доступны пациенту. Круг замкнулся», — сетует Борис Зингерман. Он рассматривает возможность донации данных самими пациентами как максимально легитимную сегодня. «Более 10 лет назад я получил выговор за то, что по заявке самого пациента мы передали ему его же данные. В 2013 году это считалось нарушением. Мы тогда обсуждали: стоит ли врачам отдавать пациентам их данные? Врачи считали, что отдавать нельзя», — поделился историей глава НБМЗ.
Сегодня ситуация принципиально иная — требуется согласие пациента для передачи данных в другую медорганизацию. Однако, как его получить — непонятно, поэтому до сих пор во многих странах, включая Россию, пришли к модели: хочешь передать данные — отдай пациенту, пусть сам отнесёт, только теперь это можно сделать в электронной форме.
Сейчас появился новый класс данных — данные дистанционного мониторинга здоровья человека. Их и сейчас очень много, а станет кратно больше — в соответствии с нацпроектом «Продолжительная и активная жизнь» к 2030 году 100% хронических пациентов должны быть на дистанционном мониторинге, а это десятки миллионов человек, и они будут генерить данные 24/7: давление, глюкоза, пульс, вес, активность, питание, сон и др. И пока нет даже намека на то, как именно будут обрабатываться эти данные, попадать к врачу и самому пациенту и каковы сценарии их обработки.
По мнению Зингермана, термин "донация" данных должен стать важным понятием ближайших лет. И под эту процедуру должна быть выстроена определенная инфраструктура.
Что от неё нужно пациенту:
удобный интерфейс управления данными;
юридические основания для прозрачной передачи;
понимание: кому, зачем, в каком виде он отдаёт данные.
Что она должна предлагать людям:
программы лояльности;
доступ к сервисам;
участие в исследованиях.
Экспертам очевидно, что задача не из простых. «Google Health, Microsoft HealthVault, наш Медархив — в 2010-е годы не выжили», — отмечает Борис Зингерман.
«Но может тогда было рано? Может у пациентов не было достаточного объема цифровых медицинских документов. Сейчас их очень много, но инструментов их хранения и использования — нет. Может быть, пора вернуться? Только не как интернет-сервис, а на базе пациентской организации. Например, Всероссийский союз пациентов может стать провайдером такого сервиса. Данные — это не нефть. Это кровь здравоохранения. Как мы сдаём кровь — в рамках донации, — так же мы можем организовать донацию данных. С этическими, юридическими, технологическими и мотивационными основаниями», — резюмировал он, обращаясь к коллегам и призывая участников форума подключиться к этой задаче.
Альтернатива: данные — не нефть, не кровь, а парфюм
«На самом деле, данные — это не нефть. Данные — это как в парфюмерии: надо три тонны цветов переработать, чтобы каплю парфюма выдавить. И потом наслаждаться этим ароматом», — считает директор по развитию Webiomed (К-Скай), компании, разрабатывающей сервисы прогнозной и управленческой аналитики на основе больших медицинских данных Александр Гусев. «В России 100% государственных медорганизаций используют медицинские информационные системы. Мы входим в десятку стран мира по объёму и охвату таких данных», — утверждает Гусев. Однако, по его словам, их потенциал пока не реализован: «У нас есть ощущение, что мы как собака на сене — данные накоплены, но используются минимально. Лишь малая доля идёт на принятие решений или аналитику. А возможностей — масса. Вопрос: как с этим работать? Мы тоже у себя накапливаем огромное количество данных. Сегодня это больше 50 миллионов пациентов, несколько терабайт архивов».
Уже сегодня с данными активно работают научные центры, подведомственные организации Минздрава и фармацевтические компании, есть действительно интересные, прорывные идеи, но нормальные исследования невозможны без популяционных наборов.
В стратегии цифровой трансформации здравоохранения официально заложены два ключевых показателя — по наборам данных и по медизделиям с ИИ. Их не выполнить, если не научиться с этими данными работать, считает Гусев.
Три ключевых барьера, с которыми сталкиваются все игроки рынка, по мнению эксперта.
Доступ к архивам. «Мы накапливаем обезличенные данные в рамках СППВР. Но любая юридическая служба говорит: эти данные можно использовать только для целей самой СППВР. Только для оказания медицинской помощи. Провести научное исследование на этом архиве — уже юридически непросто, формально нужно спрашивать на это согласие пациента. А собрать новые данные после получения согласия — это значит ждать 10 лет. Таким образом, архив ретроспективных данных есть, а использовать его нельзя. На наш взгляд, единственный выход — запуск экспериментального правового режима»
Технический и организационный тупик при получении данных. «Даже если архив есть и юридическое разрешение получено, мы, как дата-провайдер, технически не можем забрать данные. Мы можем только их получить. А для этого нужно, чтобы какая-то информационная система нам их отправила. То есть, кто-то должен осуществить выгрузку из МИС, и есть только два способа это сделать: административное давление или коммерческая мотивация. Второй барьер — информбезопасность, чтобы принять хотя бы один байт информации — нужен год-два подготовки и миллионы затрат на сертификацию, аттестацию, разрешения.»
Обезличивание данных. «Казалось бы: что сложного в обезличивании электронной медкарты? Убрали ФИО, полис, адрес, дату рождения — и всё. Есть курьезные случаи, но настоящая проблема — текстовые поля, врачи часто пишут: “Гражданка Петрова Мария Ивановна обратилась ко мне с жалобами…” — и в сводном тексте, в истории болезни, огромное количество персональных данных. Просто найти и удалить эти данные технически очень сложно. Мы больше года инвестировали в NLP-модель, которая умеет это находить и удалять. ФИО, СНИЛС, полисы, номера паспортов — что угодно может попасть в текст. Если мы работаем с ЕГИСЗ — там данные уже обезличены. Но если с региональными МИС — инструмент обезличивания должен быть, и он должен быть проверен».
Анализируя миллионы записей, в компании К-Скай пришли к выводу, что первичные данные медицинских осмотров — это не нефть, а «глина и чернозём». ЭМК — это источник с низкой плотностью ценной информации. Да, в ней есть структурированные и неструктурированные поля: чтобы нормально заполнить первичный осмотр даже у обычного пациента — нужно 30–40 минут, у врачей их нет на львиной доле приёмов, поэтому есть масса текстовых записей.
Осознав проблему, разработчики пришли к выводу, что оценка качества ЭМК — необходимый шаг. «Мы создали алгоритм оценки качества и встроили его в платформу. Если качество приемлемое — запускаем алгоритмы. Если на входе мусор — выдать осмысленный результат невозможно», — рассказывает о новом продукте Гусев.
Оценка качества показала, что почти половина ЭМК — это просто регистрация приема: метаданные, сведения об обращаемости, но без жалоб, анамнеза, объективного осмотра и прочих клинических данных. Таким образом, если нужна выборка на миллион пациентов, где есть клинически валидные данные, то нужно прогнать десятки миллионов записей. Но даже корректно заполненные поля — неоднородны и неполны.
«ЭМК — это в основном врачебные осмотры. Но для серьёзных исследований нужны подтверждающие данные, например, лабораторная диагностика. А их часто нет. Вам придётся использовать суррогатные точки, субъективные предикторы, интерпретировать косвенные признаки. Это делает задачу ещё сложнее. Создание data-driven компании — это как добыча нефти и производство бензина. Есть этапы: доступ, сбор, обезличивание, линковка, извлечение, формирование профилей, и только потом — аналитика» , — говорит Александр Гусев.
Юридические барьеры доступа к большим медицинским данным
Но если организационные и технологические барьеры участники рынка не быстро, но способны преодолеть, то юридические барьеры могут поставить на стоп практически любой проект, в основе которого лежат большие медицинские данные.
Старший юрист Verba Legal Карина Колобова призвала участников конференции не забывать, что «медицинские данные во всех случаях — это персональные данные, это специальная категория, к которой предъявляются гораздо более строгие требования».
Основания для обработки медицинских данных
«Если задать вопрос — на каком основании мы можем использовать медицинские данные, например, для аналитики или научных исследований — ответ не слишком утешительный», — говорит Карина Колобова. По её мнению, оснований сегодня только два:
Согласие пациента
Экспериментальные правовые режимы (ЭПР)
Чтобы использовать данные с согласия пациента, нужно:
получить согласие от каждого пациента на использование именно его данных;
зафиксировать, в рамках какого конкретного исследования и с какой целью они будут использованы.
«Если мы говорим о ретроспективных исследованиях, получить такие согласия физически невозможно. Люди могли переехать, не наблюдаться или не дожить до момента использования их данных», — поддерживает выводы разработчиков Карина Колобова.
Формальные сложности:
Требуется письменная форма согласия: либо бумажный документ, либо усиленная квалифицированная электронная подпись.
Использование простой электронной подписи возможно только при отдельном соглашении с субъектом данных.
«Очевидно, что сделать это с миллионами пациентов — невозможно», — считает Карина Колобова.
Содержательные сложности
Закон требует указания:
конкретных целей обработки;
всех операторов;
перечня всех данных;
сроков хранения и др.
Также существует проблема отзыва согласия самим пациентом. «Пациент может отозвать согласие в любой момент. А что делать, если данные уже обезличены или переданы? Какие именно данные удалять — непонятно», — описывает коллизию представитель Verba Legal.
Обезличивание медицинских данных пока не выход
Очень глубоким получилось обсуждение обезличенных данных. «Казалось бы, простой путь: обезличим данные — и всё. Но тут тоже всё непросто — получается замкнутый круг», — задала тон Карина Колобова. Эксперт описала юридическую коллизию:
обезличенные данные всё ещё считаются персональными;
сам процесс обезличивания — это тоже обработка, и требует согласия.
Кроме этого есть техническая неопределённость:
нет ответа, какие поля можно оставить, сколько атрибутов удалить;
нет универсального порядка обезличивания для частного сектора, действующие порядки касаются госорганов и ЕГИСЗ;
в России нет различия между анонимизацией (невозможно восстановить личность) и псевдонимизацией (есть ключ для восстановления) данных.
«Поэтому все обезличенные данные на всякий случай считаются персональными, — говорит Карина Колобова. — Во всех проанализированных нами юрисдикциях возможность такой обработки предусмотрена. Это тот шаг, который, возможно, нам тоже предстоит сделать, чтобы работа с данными наконец вышла за рамки “всё запрещено, кроме согласия” и превратилась в реально работающую экосистему». Эксперт сформулировала, какие именно нужны изменения в законодательстве.
Предложения по снятию барьеров при обезличивании данных Verba Legal c комментариями Карины Колобовой
Добавить основание для обработки обезличенных медданных в исследовательских целях — без согласия. «Как во многих юрисдикциях — если данные обезличены и используются для исследований, согласие не требуется.»
Уточнить, что обезличивание не требует согласия. «Иначе новый механизм будет парализован — ведь сначала нужно будет получить согласие на саму процедуру обезличивания.»
Разрешить изменение цели обработки данных. «Сейчас цель должна быть изначально зафиксирована. Это ограничивает повторное использование, даже во благо пациента.»
Создать единый порядок обезличивания — и для госорганов, и для частного сектора. «Сейчас 96-й приказ Роскомнадзора формально применяется только к государственным структурам. Это создаёт правовую неуверенность для частных компаний.»
Ввести риск-ориентированный подход вместо универсального обезличивания. «Один и тот же набор полей может быть безопасным в одном дата-сете и небезопасным — в другом. Поэтому нужен риск-ориентированный подход.»
Кто бенефициар создания новых правил обращения с медицинскими данными
Опасения высказываются самыми разными участниками процесса, и у каждой группы свой резон. Врачи боятся, что станут не нужны, государство, что скомпрометированные медицинские данные станут основой мошеннических схем, пациенты того, что с ними перестанут работать живые врачи, бизнес, что будут неконкурентные условия и т.д.К счастью, ни одна из влиятельных социальных групп не табуирует тему и открыта к сотрудничеству, видя потенциальную пользу от устранения барьеров. А некоторые «продвинутые» в теме эксперты считают, что польза перевешивает потенциальные риски внедрения новых инструментов. «Большие данные и инструменты, построенные с применением искусственного интеллекта — это уже наше настоящее, очень актуальное направление. Мы знаем, что с его помощью анализируется множество снимков, и иногда он может увидеть то, что упустит человеческий глаз. Наша задача — сделать так, чтобы врачу было комфортно, чтобы он не тревожился о своем трудоустройстве. ИИ должен быть помощником: и врачу, и пациенту, и клинике», — считает главный научный сотрудник отдела патологии сетчатки и зрительного нерва ФГБНУ «НИИ ГБ им. М.М. Краснова» д.м.н. Анна Плюхова. Руководитель направления "Здравоохранение" Yandex Cloud Евгений Попов предлагает не ждать, когда условия станут тепличными, и уже сейчас инициировать изменения: «Чтобы двигаться вперёд, нужно найти юридическую коллизию, прийти к регулятору и сказать: “давайте менять”». «Сложности с данными всегда будут, но если цель благородная, находятся не причины поставить на стоп, а возможности двигаться и искать варианты», — считает Попов. Он приглашает разработчиков и стартапы в яндексовский «Центр технологий для общества» реализовывать социально-значимые проекты, для поддержки которых у компании есть четкая стратегия. Именно такие проекты и создадут прочную основу рыночных правил, в которых будет сложно, но уже возможно быстро получать прорывной результат от внедрения новых технологий и при этом минимизировать риски.