Новости
23 октября 2024 г.
Законодательство
22 ноября 2024 г.
Проект Порядка проведения экспертизы временной нетрудоспособности
Статистика
21 июля 2023 г.
Цифра недели: опрос «Работы России» показал, как россияне определили секрет успеха в профессии
Специальная оценка условий труда
19 ноября 2024 г.
Материалы обучения искусственного интеллекта охране труда: к вебинару КИОУТ
18 апреля 2024 г.
Непосредственным поводом для последующих заметок явился вебинар «Инструменты искусственного интеллекта в охране труда», организованный Клинским институтом охраны и условий труда (далее – КИОУТ) [1]. Вебинар провел генеральный директор КИОУТ Олег Александрович КОСЫРЕВ. Он доложил об основных принципах работы искусственного интеллекта (далее – ИИ) в сфере организации охраны труда на производстве.
Использование ИИ может помочь обнаружить потенциальные опасности, уменьшить количество человеческих ошибок и в целом повысить безопасность труда сотрудников. Внедрение ИИ в управление охраной труда и безопасностью дает возможность специалистам принимать более обоснованные решения, улучшать коммуникацию по вопросам безопасности сотрудников.
Кроме решения этих организационных задач, ИИ можно использовать для прогнозирования потенциальных рисков для здоровья, повышения эффективности процессов управления здоровьем. Например, основанные на ИИ предиктивные аналитические системы могут выявлять закономерности и тренды в данных о здоровье сотрудников, обеспечивая раннюю диагностику потенциальных проблем. Такой превентивный подход поможет существенно снизить заболеваемость и улучшить общее здоровье сотрудников.
Здесь мы попадаем в область медицины труда, где использование ИИ не столь обеспечено, как в организационной области.
Это обусловлено общими факторами:
– увеличением количества и повышением качества медицинской информации из-за обновления диагностической аппаратуры;
– ростом скорости и плотности информационных обменов как между отдельными исследовательскими группами, так и между медиками теоретического и практического профиля.
Рост объема медицинской информации (в мире издается около 40 000 биомедицинских журналов, публикующих примерно 2 млн статей ежегодно [2]) привел к смене представлений об этиологии, патогенезе и структуре отдельных видов заболеваний (или отдельных нозологических форм). Оказывается, что наличие одного заболевания у пациента, особенно пожилого возраста с большим стажем работы, сегодня редкое явление.
Как правило, встречается сочетание двух и более нозологических единиц у одного пациента одновременно. В конце прошлого века это явление (и соответствующий раздел медицины) получило название «полиморбидность». Его распространенность позволила некоторым авторам говорить об эпохе «полиморбидной медицины» [3]. Полиморбидными являются более 50 % пациентов с хроническими заболеваниями.
В систематическом обзоре [2] утверждается, что распространенность полиморбидности варьируется от 13 до 95 % в зависимости от изучаемой популяции и способа сбора и регистрации данных о заболеваемости. Понимание этого требует интегральных оценок состояния больного, однако современные тенденции узкой специализации в медицине (в том числе в медицине труда) привели к тому, что врачи консультируют больного об отдельных органах и системах.
Для определенности будем ниже под полиморбидностью понимать наличие двух и более заболеваний (произвольной этиологии) у одного пациента. Полиморбидность будем подразделять на мультиморбидность − наличие множественных заболеваний, не связанных между собой доказанными патогенетическими механизмами либо рассматриваемых без учета патогенеза вовсе [4; 5], и на коморбидность − сочетание заболеваний, связанных доказанными едиными патогенетическими механизмами.
Единой общепринятой классификации коморбидности не существует. В литературе встречаются данные о формировании устойчивых сочетаний (кластеров) некоторых хронических заболеваний [6].
Проблема коморбидности как результата объективного взаимодействия ведущих клинических факторов различных заболеваний обусловливает появление новых клинических симптомов и синдромов. В настоящее время бытует характеристика коморбидности как «феноменологического бульона» [7] или симптомокомплекса, совершенно новой нозологической единицы [8].
Причины возникновения сочетанной патологии, а также факторы, влияющие на ее развитие и прогрессирование, разобраны детально, также обсуждаются варианты классификации коморбидности.
Предложен ряд правил формулировки клинического диагноза при коморбидности, которые должен соблюдать практикующий врач. Основным правилом является выделение в структуре диагноза основного и фоновых заболеваний, а также их осложнений и сопутствующей патологии. Утверждается, что если больной страдает многими болезнями, то одна из них – основная. Основным предлагается считать заболевание, послужившее причиной обращения за медицинской помощью. Это та нозологическая форма, которая сама или вследствие осложнений вызывает первоочередную необходимость лечения в связи с наибольшей угрозой жизни и трудоспособности. Основное заболевание само по себе или из-за осложнений может быть причиной летального исхода.
Недостаток такого подхода – его разрыв с физиологией. Принимаются во внимание в основном социологические характеристики заболевания. Как один из результатов – по мере обследования выстраиваемая нозологическая структура полиморбидного заболевания может измениться, основным может стать диагноз наименее благоприятного (прогностически) заболевания; при этом прочие болезни рассматриваются как сопутствующие.
Другой аспект роста потока медицинской информации: в наше время организации по всему миру собрали чрезвычайно много данных, а благодаря Интернету эти данные объединяются, и их суммарный объем превосходит возможности традиционных средств работы с такой информацией. Иными словами, сколько-нибудь полноценный анализ медицинских данных, которые характеризуются большим объемом, высокой скоростью поступления и разнообразием, вызывает ряд проблем.
Появился термин «большие данные» («BIG DATA», далее – BD). Их обработка требует больших вычислительных ресурсов, специальных алгоритмов и программного обеспечения. Для действий с ними разработаны новые методы. Облачные вычисления позволяют хранить и обрабатывать информацию на удаленных серверах. Разработаны специальные способы доступа и использования информации.
Для BD можно определить, по крайней мере, три глобальных задачи:
1. Строить модели. Систематизировать данные, находить причинно-следственные связи. Это помогает понять, как работают сложные системы, делает их прозрачными.
2. Оптимизировать процессы. Автоматизировать рутинные или трудозатратные этапы, повышать точность расчетов и экономить ресурсы. Например, медицинские сервисы автоматически рассчитывают стоимость лечения.
3. Делать прогнозы. С помощью аналитики прогнозируется поведение пациентов и спрос на медицинские услуги, планируются их объемы. ИИ может способствовать более эффективному выявлению болезней на ранней стадии и оценивать ход лечения.
BD представляют собой сложную и многомерную структуру, которую не всегда легко интерпретировать и анализировать. Как работать с ней без потери нужной информации, находить в ней существенные признаки и свойства, классифицировать и группировать данные по определенным критериям?
Любые данные – это выраженные в разной форме сырые факты, которые сами по себе не несут пользы до тех пор, пока не поставлены в контекст, должным образом не организованы и не упорядочены в процессе обработки. Данные – это неорганизованные факты, которые необходимо превращать в информацию.
Информация появляется в результате анализа обработанных данных, этот анализ придает данным смысл и обеспечивает им потребительские качества. До последнего времени представления об обработке данных сводились к ограниченному кругу алгоритмических, логических или статистических операций над относительно небольшими объемами данных. Однако по мере сближения компьютерных технологий с реальным миром возросла потребность преобразовывать данные из реального мира в информацию о реальном мире, обрабатываемых данных становится больше, и требования к скорости обработки возрастают. В основе современных методов интеллектуального анализа данных лежат такие концептуальные направления, как математическая статистика, машинное обучение и ИИ.
Аналитическая деятельность по определению условий труда как причин и факторов риска профессионально обусловленных заболеваний (далее – ПОЗ), которые возникают в результате воздействия на организм вредных производственных факторов (далее – ВПФ), составляет содержание эпидемиологии ПОЗ (профэпидемиологии).
Все предположения в этой области спекулятивны, пока не существует рациональных методов, которые можно было бы использовать для количественной реконструкции ситуации с ПОЗ в трудовых коллективах. Здесь недостаточно описательных заключений – нужны доказательства и количественные характеристики причинно-следственной связи между заболеванием и воздействием ВПФ. Эти требования вносят в профэпидемиологию элементы доказательной медицины (далее – ДМ), понимаемой как интеграция лучших научных доказательств и клинических знаний при диагностике и лечении заболеваний [9].
Требования, которые предъявляются к работе ИИ в области медицины коморбидных патологий, подразумевают добросовестное, точное и осмысленное использование лучших результатов клинических исследований для выбора путей лечения конкретного пациента. Растущая потребность в критической оценке медицинской информации с целью установления ее надежности и достоверности привела к необходимости принятия концепций доказательной медицины.
Предложенная в начале 1990-х гг. концепция ДМ подразумевает критическую оценку медицинской информации с целью установления ее надежности и достоверности. Для этого ДМ должна опираться на рациональные (количественные) клинические данные, прошедшие проверку в ходе крупных рандомизированных испытаний. Несмотря на то что все эти постулаты были осознаны медицинской общественностью гораздо раньше, лишь при современном информационно-техническом уровне стал возможен широкий сбор достоверных данных о различных клинических исследованиях, обобщение этих сведений и их использование врачами-практиками.
Для того чтобы упростить сложный и противоречивый процесс включения концепций ДМ в алгоритм работы ИИ, его можно подразделить на следующие этапы:
1) определение этиологии заболевания по признакам распространения заболевания и его развития по результатам наблюдений населения (различных популяций), с помощью клинических наблюдений и лабораторных исследований;
2) формулирование теорий, описывающих, как протекает здоровый жизненный цикл и происходит возникновение и развитие заболевания;
3) выделение из теории возможного «зерна» для модернизации клинической практики с целью предотвращения, замедления или обратного развития заболевания (процесса деградации). Затем необходимо разработать виды «вмешательства» для достижения этой цели;
4) внедрение мер «вмешательства» либо в сферу общественного здравоохранения, либо в клиническую практику и оценка как терапевтического, так и ятрогенного эффекта этих мер в сравнении с существующими в настоящее время стандартными методами лечения, или плацебо, или невмешательством.
Непосредственному применению логики и методов ДМ в эпидемиологических исследованиях коморбидной патологии мешает устаревший подход к организации медицинских исследований. Здесь стоит отметить, однако, что ситуация с внедрением концепций ДМ в науку и практику российского здравоохранения, в том числе в области медицины коморбидных патологий, меняется очень медленно.
Существенная часть подготовки ИИ к работе – машинное обучение. Это методика разработки алгоритмов и статистических моделей, которые программы ИИ используют для выполнения сложных задач без четких инструкций. Алгоритмы машинного обучения полагаются на закономерности и выводы.
Проще говоря, на входе – сырые данные, а на выходе – полезная информация. Однако связь между этими двумя сущностями чрезвычайно сложна. ИИ – это комплекс методик математики, биологии, психологии, кибернетики и других наук, с помощью которого создаются технологии для написания интеллектуальных программ и обучения компьютеров самостоятельному решению интеллектуальных задач.
Фактически ИИ – это группа задач, предполагающих использование баз знаний и правил для создания экспертных систем и систем знаний. Результирующий продукт – это системы, которые могут принимать (или помогать принимать) решения, а также разрешать проблемы в конкретных областях. К ним относятся, например, системы диагностики и поддержки принятия решений.
Один из основных компонентов процесса создания ИИ – машинное обучение.
В нем можно выделить две задачи:
– сбор и подготовка обучающих данных;
– выбор уже существующей стратегии или модели машинного обучения, например, линейной регрессии или дерева решений.
В процессе машинного обучения ИИ создаются базы знаний. Для этого используются комплексы сопряженных данных «вход – выход». Эти данные определяют реальные причинно-следственные отношения, они должны удовлетворять установленным требованиям, главные из которых – рациональное описание входных и выходных (медицинских) данных и доказательность выводов. Материал для обучения ИИ должен представлять собой логически связанный контент, а не субъективно скомпилированную сумму слов, какие в изобилии появляются в сфере сочинений на темы медицины.
Вместо явного программирования машинное обучение использует специальные алгоритмы для анализа больших объемов данных, извлечения уроков из полученных знаний и принятия аргументированных решений. Другими словами, это то, что ИИ узнает в результате работы с обучающими данными. Чем точнее эти данные и чем их больше, тем лучше будет работать ИИ.
Компьютерные системы применяют алгоритмы машинного обучения для обработки больших объемов статистических данных и выявления шаблонов данных. Хотя машинное обучение – это ИИ, не все действия ИИ можно назвать машинным обучением.
Сам по себе процесс машинного обучения – довольно сложная математическая задача, решение которой включает следующие разделы математики: функциональный анализ, формальная логика, теория множеств, математический анализ, линейная алгебра, теория информации, кибернетика, теория вероятностей, математическая статистика. Специалисты по работе с данными выбирают данные и вводят их в модель обучения. Они постоянно уточняют набор данных, обновляя их и проверяя ошибки. Качество и разнообразие данных определяет точность модели машинного обучения.
Решения в области машинного обучения требуют набора из нескольких сотен входных данных для обучения, а также достаточной вычислительной мощности для работы. В зависимости от приложения и сценариев использования может быть достаточно одного сервера или небольшого кластера серверов. Но другие интеллектуальные системы могут предъявлять более высокие требования к инфраструктуре, зависящие от задачи, которую необходимо выполнить, и используемой методологии вычислительного анализа. Для некоторых вариантов высокопроизводительных вычислений с BD (см. выше п. 2) и достижения сложных целей необходима совместная работа нескольких тысяч машин.
При подготовке обучающих ИИ наборов данных целесообразно учитывать, что они должны моделировать реальную работу ИИ – содержать входные наборы данных и соответствующие им выходные результаты анализа входных данных. Эмпирически подобранные наборы представляют собой хорошо известные в эпидемиологии зависимости «доза – эффект» для вредных внешних факторов. Они кодируют причинно-следственные рассуждения и знания в предметной области (например, клинической и биологической) и при выполнении соответствующих требований обеспечивают добросовестное, точное и осмысленное приложение лучших результатов клинических исследований для выбора путей лечения конкретного пациента с мультиморбидной патологией. Основы такого подхода изложены в книге [11].
Определение «дозы» представляет самостоятельную (не медицинскую) проблему, а «эффект» предлагается описывать биометрическими функциями, отражающими скорость развития заболеваний. В рамках такого подхода доза определяет зависимость параметров (и, следовательно, поведение) биометрических функций от уровня и времени воздействия вредных внешних факторов.
В книге [11] рассмотрено несколько видов вредных производственных факторов: тяжесть труда, производственный шум, аэрозоли и пыль, опасность травмирования. Для них указаны параметры биометрических функций и их величины в зависимости от уровней вредных производственных факторов. Биометрические функции можно использовать для исчисления эпидемиологического риска ПОЗ и размера финансово-экономического ущерба предприятия от уровня заболеваемости работников. Аналогичные алгоритмы применимы и для оценки воздействия экологических факторов, возрастных изменений, явлений инициирования одних заболеваний другими.
Только алгоритмы, кодирующие причинно-следственные рассуждения и знания в предметной области (например, клинической и биологической), оказываются преобразующими. В книге [11] изложены начала гигиены, основанной на зависимости «доза – эффект» для вредных внешних факторов. Рассматриваемые как принципы идеологии совершенствования систем здравоохранения, управления качеством медицинской помощи, согласования интересов конкретного больного и общества, они полностью укладываются в концепцию доказательной медицины. Тем самым требования ДМ к переменным в зависимости «доза – эффект» определяют и качество данных для обучения ИИ.
Для решения новых проблем в области патологии ПОЗ нужны новые методы анализа материала, которых раньше не требовалось. Дело в том, что ПОЗ представляет собой элемент в комплексе процессов жизнедеятельности организма. Сложность этого комплекса определяет необходимость использования методов статистического анализа для его исследования. Важное место здесь занимает сводка единичных факторов, образующих совокупность BD наблюдения. Статистически значимое количество единичных данных об отдельных объектах наблюдения образует комплекс статистических результатов. На этом этапе проявляются общие черты и закономерности исследуемых явлений [12].
Одной из основных особенностей такого подхода является группировка объектов BD. Обычно (в эпидемиологии – в частности) статистические результаты натурного исследования группируются в таблицы сопряженности (далее – ТС), которые являются наиболее наглядным универсальным средством изучения стохастических связей [13]. Поэтому имеет смысл вернуться к причинно-следственной проблеме, которая возникает, когда одно заболевание «инициирует» другое.
Известен ряд статистических методов определения значимости причинно-следственных связей между различными компонентами ТС. Например, оценка силы ассоциации критериями χ2, Yule's Q и др. [14; 15]. Значимость не указывает на направление причинно-следственной зависимости. Тем не менее причинность весьма важна в эпидемиологии. Основной метод эпидемиологии заключается в наблюдении и количественной оценке ассоциаций [16].
Для оценок причинности часто используются критерии Бредфорда Хилла, однако их ценность неоднократно подвергалась сомнению. В некоторых работах утверждается, что причинно-следственные связи невозможно наблюдать напрямую [17]. Это не так, и ниже будет показано, как на самом деле. Информация из ТС содержит прямое указание на направление и уровень причинно-следственных зависимостей в изучаемой системе ВПФ – ПОЗ. Но для того, чтобы извлечь это указание, необходимы методики анализа сложных (вероятностных) ситуаций. Такую возможность предоставляет вероятностная логика Т. Байеса для оценки убеждений [18].
Разумеется, принципы рациональной систематизации комплекса полиморбидных патологий основаны на выявлении причинно-следственных отношений между отдельными нозологиями. И так как в общем случае причина здесь лишь частично ответственна за результат, а последний лишь частично зависит от отдельной причины, то множественность причин обусловливает случайность результата и для анализа ситуации необходимо использовать вероятностную логику Т. Байеса [19].
Байесовская интерпретация вероятности выглядит несколько мистически: теорема Байеса показывает, как уровень доверия к оценке вероятности некоторого события может кардинально измениться вследствие получения результатов других событий. В частности, уточнить ответы на вероятностные вопросы о состоянии подмножества переменных можно, наблюдая за другими переменными (переменные-свидетельства). Процесс вычисления апостериорного распределения переменных по переменным-свидетельствам называют вероятностным выводом.
На самом деле логика байесовского вывода может быть сформулирована достаточно просто и наглядно – это оценка изменения условной вероятности события в зависимости от того, при каких условиях она определяется. Первоначальная (априорная) оценка вероятности, сделанная для контрольных условий без выделения случаев влияния ВПФ, меняется на более специфическую (апостериорную) вероятность для условий определенного влияния ВПФ. Следующий шаг – инверсия результата: вынесение суждения об уровне внутренней связи событий по относительной вероятности их проявления в выбранных условиях. Именно в этот момент можно утверждать, что теорема Байеса связывает воедино доверие к предположению до и после принятия во внимание новых доказательств.
Предложенная логика использовалась в работе [19] для рациональной диагностики причин ПОЗ. Подробно описан алгоритм, подразумевающий специальную технологию сбора, анализа и представления данных эпидемиологических исследований. Показано, что оценки силы вероятностной связи ПОЗ с ВПФ, основанные на коэффициенте Yule's Q и статистике Фишера χ2, приводят к тем же качественным выводам, что и анализ Т. Байесом апостериорной вероятности, однако последний позволяет наглядно проследить логику возникновения ситуации и дает количественную меру воздействия ВПФ, то есть позволяет достоверно диагностировать заболевание в качестве профессионально обусловленного.
Анализ причинно-следственных отношений ясно указывает на ВПФ как причину ПОЗ. Это обстоятельство было очевидно заранее, поэтому результат следует рассматривать как подтверждение адекватности алгоритма. Помимо конкретных результатов, предлагаемые методы анализа, основанные на расширении логики Т. Байеса, дают новые возможности рациональной (количественной) характеристики ситуации с ПОЗ в рабочем коллективе [19].
Рост качества и объемов медицинской информации приводит к развитию интегрированного подхода к проблемам пациентов с коморбидностью, способствует углубленному пониманию проблем специалистами в области общественного здравоохранения и клиническими работниками.
Одновременно рост объемов медицинской информации в мире и скорости ее накопления приводит к необходимости использования ИИ для управления охраной труда в промышленности. Частью работы по созданию ИИ является подготовка комплекса обучающих данных, моделирующего реальные зависимости «доза – эффект» в области медицины труда.
Результаты исследований в данной области позволяют более точно определять параметры требуемой медицинской помощи, а также оценивать прогностически значимые параметры развития неотложных состояний у работников, подвергающихся действию вредных производственных факторов.
1. Косырев О. А. Искусственный интеллект и развитие охраны труда: введение в ИИ: от теории к практике. – URL: https://www.youtube.com/watch?v=HjU4q2_ywP0
2. Oxman A. D., Guyatt G. H., Guidelines for reading literature reviews. Canadian Medical Association Journal 1988 (v.138): p. 697 – 703.
3. Тарловская Е. И. Коморбидность и полиморбидность – современная трактовка и насущныезадачи, стоящие перед терапевтическим сообществом // Кардиология. – 2018. – № 58 (S9). – С. 29 – 38. – DOI: 10.18087/cardio.2562.
4. Лазебник Л. Б. Старение и полиморбидность // Consilium Medicum.– 2005.– Т. 7. – № 12. – С. 1 – 7.
5. Верткин А. Л., Скотников А. С. Коморбидность // Лечащий врач. – 2013. – № 6. – С. 66 – 68.
6. Laux G. et al. Co- and multimorbidity patterns in primary care based on episodes of care: results from the German CONTENT project // British Medical Journal Health Services Research. 2008. Vol. 8. № 14. – URL: http://www.biomedcentral.com/1472-6963/8/14
7. Гасанов Р. Ф. Коморбидность синдрома нарушения внимания как результат диагностической неопределенности // Обозрение психиатрии и медицинской психологии им. В.М. Бехтерева. – 2007. – № 4. – С. 1− 6.
8. Белялов Ф. И. Лечение внутренних болезней в условиях коморбидности: монография. – Иркутск: РИОИГИУВ, 2012. – 285 с.
9. Федорович Г. В. Рациональная эпидемиология профессиональных заболеваний (модели и методы). – Saarbrűcken, Deutschland: Palmarium Academic Publishing, 2014: Р. 343. ISBN-13: 978-3-639-82722-4. – URL: https://www.morebooks.shop/shop-ui/shop/product/9783639827224; http://elibrary.ru/item.asp?id=23256439
10. Guyatt G. H., Sackett D. L., Cook D. J. Users' guides to the medical literature. Evidence-Based Medicine Working Group. JAMA. 1993 Dec 1; 270 (21): 2598 – 601. DOI: 10.1001/jama.270.21.2598. PMID: 8230645.
11. Федорович Г. В. Зависимость «доза – эффект» в гигиене труда (риск-ориентированный подход). – Saarbrűcken, Deutschland: Palmarium Academic Publishing, ISBN-13: 978-620-2-38060-7. 2017:201.– URL: http://www.palmarium-publishing.ru; https://www.morebooks.shop/store/gb/book
12. Ломовской Р. А. Статистический анализ данных: методы и приложения в научных исследованиях // Актуальные исследования. – 2023. – № 15 (145). – С. 29–34. – URL: https://apni.ru/article/6013-statisticheskij-analiz-dannikh-metodi-i-prilo
13. Аптон Г. Анализ таблиц сопряженности. – Москва: Финансы и статистика, 1982. – 143 с.
14. Youden W. J. Index for rating diagnostic tests // Cancer, Vol. 3, № 1, 1950, pp. 32 – 35.
15. Yule G. On the Methods of Measuring Association Between Two Attributes // Journal of the Royal Statistical Society, Vol. 75, № 6, 1912, pp. 579 – 652.
16. Савилов Е. Д. Причинность в эпидемиологии / Савилов Е. Д., Астафьев В. А., Анганова Е. В., Кичигина Е. Л., Жданова С. Н. – Иркутск: РИО ГБОУ ДПО ИГМАПО, 2015. – 36 с.
17. Joffe M., Gambhir M., Chadeau-Hyam M. et al. Causal diagrams in systems epidemiology // Emergig Themes in Epidemiology, Vol.9, № 1, 2012. DOI: 10.1186/1742-7622-9-1.
18. Хей Дж. Введение в методы байесовского статистического вывода. – Москва: Финансы и статистика, 1987. – 336 с.
19. Федорович Г. В. Теорема Т. Байеса в профэпидемиологии // Безопасность и охрана труда. – 2023. – № 2. – С. 5 – 9. – DOI: 10.54904/52952_2023_2_5_9.