«Врач и информационные технологии», 2008, N 6
К ВОПРОСУ СОЗДАНИЯ ОТРАСЛЕВОГО КЛАССИФИКАТОРА НАИМЕНОВАНИЙ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ И
МЕДИКО-ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ (ОКСЭП) И ЕГО РОЛИ В ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЯХ ВТОРОГО ПОКОЛЕНИЯ В СИСТЕМЕ ЗДРАВООХРАНЕНИЯ
Система здравоохранения является территориально распределенной многоуровневой структурой, образованной различного типа объектами, отличающимися друг от друга характером выполняемых функций, объемами работ, различными формами собственности, видами подчиненности и другими специфическими особенностями. Внутри системы в соответствии с ее структурой перемещаются огромные потоки информации, содержащей сведения о деятельности образующих ее объектов. Вся совокупность информации, ее потоки внутри отрасли и технологические процессы обработки (информационные технологии) образуют единое информационное пространство (информационную среду, информационную систему и т.д.) отрасли. Информационное пространство так же, как и сама отрасль, имеет дискретную структуру, объединяющую множество информационных систем объектов более низкого порядка в единую информационную структуру отрасли. Основная функция информационного пространства отрасли заключается в обеспечении всех пользователей необходимой и достоверной информацией, предоставляющей возможность решения постоянно расширяющегося и увеличивающегося круга задач отрасли. Однако периодически возникают ситуации, при которых возможность информационных систем выполнять эту функцию в той или иной мере не отвечает потребностям пользователей информационного ресурса. В таких случаях возникают кризисные ситуации, при которых пользователь вынужден работать в условиях дефицита необходимой ему информации. Для устранения кризисных ситуаций чаще всего приходится либо проводить модернизацию всего информационного пространства за счет расширения отдельных «узких» мест, то есть находить и использовать еще не полностью реализованные возможности, либо полностью заменять устаревшие технологии, исчерпавшие свой ресурс развития, другим поколением, обладающим большим ресурсом и большей перспективой развития. За последнее десятилетие в здравоохранении все отчетливее стали проявляться признаки подобной кризисной ситуации. Все чаще обращает на себя внимание [1-4]: — низкий уровень быстродействия технологических процессов обработки информации в информационных сетях, связанный с наличием в технологических цепочках обработки информации большого количества участков с ручными работами, значительно снижающими эффект быстродействия современной техники; — наличие больших объемов ручных работ, в основном на участках формирования первичных документов и отсутствие условий, позволяющих осуществлять ввод в машину первичных показателей непосредственно с мест их формирования (рабочих мест пользователей); — низкий уровень систематизации и унификации (текстовых) наименований показателей как основной источник случайных, трудно выявляемых и исправляемых погрешностей, снижающий качество самой информации; — низкий уровень унификации форм документов, связанный с постоянно текущим процессом обновления форм отчетно-статистических документов, осложняющего и затягивающего процессы технологической обработки информации, и т.д. Признаки кризисной ситуации характерны не только для системы здравоохранения, но и для всей страны в целом. Неслучайно поэтому была разработана федеральная целевая программа «Развитие информатизации в России на период до 2010 года». В системе здравоохранения — «Концепция информатизации Федерального агентства по здравоохранению и социальному развитию» (N 240 от 30.12.04). В октябре 2005 года проведена Международная конференция «Информационные и телемедицинские технологии в охране здоровья» (октябрь 2005 г.), отметившая значимость развития и совершенствования информационных технологий в деле реализации государственной политики по обеспечению населения необходимой медицинской помощью [1-3]. В настоящее время в публикациях все чаще рассматривается вопрос о необходимости и характере преобразований информационного пространства отрасли. Делаются попытки определить, нужна ли модернизация существующей технологии обработки информации или требуется замена ее новым поколением. Для этого, видимо, в первую очередь надо выяснить причину кризисной ситуации, вызвавшую неспособность информационного пространства выполнять свою функцию, понять природу возникшей дисгармонии и найти пути ее устранения. Детально изучить запас ресурса развития действующей технологии. В данном случае при проведении такого рода исследования был рассмотрен процесс взаимодействия трех основных составляющих информационного пространства: непосредственно сама информация (информационный ресурс), действующие технологии обработки информации (технологии первого поколения) и информационные потоки. Информация как специфический объект исследования в основе своей представляет сведения о деятельности различных объектов отрасли. Первой и основной единицей информации является технико-экономический и социально-экономический показатель. Второй единицей в силу специфики существующей технологии следует считать форму документа, так как именно она является непосредственным продуктом обработки. В общепринятом понимании показатель есть ни что иное, как отображение отдельного свойства любого объекта. Структурно он состоит из двух компонентов. Первым компонентом является наименование показателя, несущее смысловое описание свойства объекта и имеющее в основном текстовую форму отображения. Второй — мера того свойства, которое заключено в смысловом содержании наименования показателя. Обычно это либо цифра, либо логическое выражение. При существующей технологии единичный показатель не имеет возможности самостоятельного перемещения. Как правило, в потоке информации перемещается группа отобранных единичных показателей, представленная в формате документа. Единичные показатели в этом случае как бы «упаковываются» в двоичную матрицу. Все отобранные показатели структурируются так, чтобы их численные значения занимали центральное место в матрице, а структурированные элементы наименования размещались по его контуру. Матрица, в которой размещены только наименования показателей, является формой документа. Она не несет в себе никакой официальной информации. Форма документа, в которую занесены численные значения показателей, будучи факсимильно заверенной лицом, ответственным за достоверность показателей, правомощность которого подтверждена соответствующей печатью, является документом, а его содержание — официальной информацией. В таком виде показатели (информация) вливаются в информационные потоки отрасли и становятся продуктом, для обработки которого вплоть до настоящего времени создаются различного типа информационные технологии. Состав единиц информации, размещаемых в том или ином документе, и формирование потоков продвижения информации по многоуровневой организационной структуре отрасли определяются и регламентируются только пользователем информационного пространства. Поэтому состояние информационного пространства и уровень качества информационных технологий во многом определяются соответствием самой информации интересам ее пользователей еще до передачи ее на машинную обработку. В это понятие входит не только отбор единиц информации, подлежащих механизированной обработке, но и их терминологическая состоятельность, выверенность на соответствие смысловой нагрузке и алгоритмам расчета их численных значений. Все это говорит о том, что доля ответственности за качество информационных технологий лежит и на пользователях информационного пространства, поскольку исходный продукт для технологической обработки готовят именно они. Однако в рамках действующей технологии этому направлению до сих пор не было уделено достаточного внимания. Технология обработки информации есть ни что иное, как совокупность информационных процессов, связанных с созданием, поиском, сбором, обработкой, накоплением, хранением, распространением и потреблением информации. В ее состав входят информационный ресурс, сосредоточенный на технических носителях, языковая среда общения пользователей информационного ресурса, непосредственно сам технологический процесс обработки, технические средства, математическое и программное обеспечение и т.д. Их состояние и уровень развития в значительной степени определяют возможности информационных технологий. На начальном этапе, когда только закладывались основы первых механизированных информационных технологий (технологий первого поколения) в нашей стране, пользователь информации ставил только две задачи: — сокращение объемов ручного труда за счет перевода максимально возможного числа участков технологической цепочки обработки информации на механизированный режим; — увеличение скорости обработки управленческой информации и доставки ее пользователю. Соответственно под эти задачи создавались новые для того времени технологии механизированной обработки информации и новое информационное пространство, которое, не претерпев значительных качественных изменений, продолжает функционировать и по сей день. Уровень развития вычислительной техники того времени был невысок. Это были большие крупногабаритные машины, обладающие недостаточными объемами памяти, низким уровнем быстродействия, сложной технологией взаимодействия пользователя с машиной в процессе общения и т.д. Выпуск вычислительной техники в нашей стране не был налажен. Техники выпускалось мало, качество ее было невысоким. Унификация технического оборудования, без которой невозможно создание любой поточной линии по автоматизированной обработке управленческой информации для обслуживания всех уровней управления отраслями и государства, была практически неосуществимой для того времени задачей. Требовалось время на развитие технических средств. Математическое и программное обеспечение вычислительных машин находилось на стадии становления. В арсенале информационных языков фактически отсутствовали логические операторы, позволяющие осуществлять процедуры поиска информации в базах данных по заданному набору признаков. Большинство информационных языков содержали операторы, позволяющие проводить только вычислительные (арифметические) процедуры, что было недостаточно для создания информационных технологий, способных реализовывать расчетные и поисковые (логические) процедуры. Информационные процессы были ориентированы только на сбор, обработку, накопление, хранение, распространение и потребление информации. Задачи создания новой (вторичной) информации на основе собираемой информации (первичной), а также создания систем поиска информации (поисковых систем) не предусматривалось. В технологиях, ориентированных на механизированный процесс обработки информации, создание условий для самостоятельного хождения единичного показателя в информационном пространстве не было предусмотрено. Единичный показатель и по сей день проходит все стадии обработки только в ее формате документа. Причем только в той его части, которая связана с процессом расчета численных значений. Наименования показателей (текстовая форма) для выполнения вычислительных процедур не используются и в машину не вводятся. Их заменяют условными кодовыми обозначениями — идентификаторами. Прямого доступа к искомому показателю, минуя обращение к форме документа, не существует. Именно это обстоятельство является в настоящий момент едва ли не основной причиной, мешающей созданию информационно-поисковых систем, обладающих высокой разрешающей способностью и способностью работать в режиме реального времени. На практике этому факту не уделяется достаточного внимания. Чаще всего делают попытки придать процессу механизации не свойственные ему функции поиска путем усложнения программных средств. Состояние самого продукта технологической обработки при этом во внимание не принимается. В свое время появление в технологии первого поколения двух взаимодействующих форм обработки информации («ручной» и «машинной») вызвало потребность создания языковой среды общения человека и машины и нормализации естественного языка общения пользователей между собой. Создать такую среду и язык общения была призвана Государственная система унификации классификации и кодирования. В ее рамках разрабатывались общесоюзные, отраслевые и локальные классификаторы, предназначенные для создания совокупности двух взаимосвязанных языков — естественного (текстового) и кодового (цифрового), обеспечивающих единство информационного пространства отраслей и государства в целом. Эти языки в первую очередь должны были обеспечить идентификацию объектов, необходимую для выполнения коммуникативных функций системы, в частности, создания потоков информации. Во-вторых, решить проблемы нормализации естественного языка. Очистить терминологию, используемую в отрасли, от терминов и профессиональных жаргонов, искажающих смысловое содержание основных единиц управленческой информации. Проблема идентификации объектов отрасли была достаточно быстро решена в рамках «Единой системы классификации и кодирования» (ЕСКК). С ее помощью и по сей день поддерживается единство информационного пространства отрасли. До сих пор продолжают функционировать и развиваться «Общесоюзный классификатор предприятий и объединений» (ОКПО), «Общесоюзный классификатор промышленной и сельскохозяйственной продукции» (ОКП), «Международный классификатор болезней» (МКБ), «Общесоюзный классификатор территорий» (ОКАТО), «Общесоюзный классификатор отраслей народного хозяйства» (ОКОНХ), «Общесоюзный классификатор видов деятельности» (ОКВД), «Общесоюзный классификатор управленческой документации» (ОКУД) и многие другие. Иначе обстояло дело с «Общесоюзным классификатором технико-экономических и социальных показателей» (ОКТЭСП), изначально предназначавшимся для создания языковой среды общения между пользователем и техническими средствами обработки информации. Классификатор должен был обеспечить функцию кодирования технико-экономических показателей, то есть присвоения им кодовых и текстовых идентификаторов, необходимых для механизированной технологии обработки информации. Именно в структуре классификатора все наименования показателей должны были пройти лингвистическую обработку на соответствие алгоритмам расчета и нормам естественного языка. Объем классификатора ограничивался количеством наименований показателей, достаточных для выполнения задач управления отраслью. Однако, как выясняется в настоящее время, идеология, заложенная в основу его разработки, намного опережала потребности пользователей и технические возможности разрабатываемых тогда информационных технологий [6-9]. Основных причин такой ситуации было несколько. Во-первых, состояние техники и ее программного обеспечения не позволяло использовать текстовую форму идентификации показателя в разрабатываемой механизированной технологии обработки информации. Как уже отмечалось ранее, идентификаторы в терминах естественного языка не воспринимались вычислительной техникой ввиду отсутствия в информационных языках логических операторов, позволяющих осуществлять процедуры поиска показателей в базах данных по заданному набору признаков. С другой стороны, идентификаторы в форме кодовой записи приобретали значительную длину (большое количество десятичных разрядов) и, следовательно, отвлекали на себя большие объемы оперативной памяти. Что в свою очередь приводило к снижению быстродействия техники или сбою в ее работе. Во-вторых, пользователи, от которых требовалось проведение большой и сложной работы по упорядочению на уровне единичного показателя в основном терминологического характера и описания расчетных алгоритмов, не понимали ее значимости. Управленческий персонал (менеджеры) не представлял, что может дать новая непривычная и довольно сложная для него форма работы с единичным показателем, не понимал ее преимуществ и необходимости. В частности, не понимал, что для решения отдельных своих задач у него может появиться возможность «поштучно» отбирать необходимые ему показатели и «упаковывать» их в те формы документов, которые он сам создаст. В его понятии существовали давно установившиеся формы документов и все необходимые показатели достаточно в них сгруппировывались. В-третьих, перед разработчиками технологий первого поколения не ставились задачи создания поисковых систем, обладающих высокой разрешающей способностью и обеспечивающих прямой поиск отдельных показателей и построение их динамических рядов. Не ставились задачи интеграции информационного ресурса отрасли. Поэтому и не возникла тогда необходимость создания уникального поискового образа для каждого показателя, обеспечивавшего возможность его самостоятельного хождения в информационном пространстве всей отрасли. Эти задачи стали возникать значительно позднее, когда технология первого поколения уже функционировала. В-четвертых, на стадии разработки методических основ построения классификатора выяснилось, что наименование единичного показателя как объект унификации, классификации и кодирования весьма не просто, как это кажется на первый взгляд [7]. В частности, для решения задач унификации, классификации и кодирования требовалось проведение значительного объема работ лингвистического характера. В методических материалах по разработке классификатора предлагалось извлечение наименований из форм документов, то есть из их традиционной среды существования, для последующего структурирования в формате классификатора и проведения последующих процедур унификации, классификации и кодирования. Сложность этого процесса заключалась в том, что наименования показателей имеют не только сложнейшую структуру разнообразных развернутых текстовых конструкций, но еще не менее сложные формы размещения этих конструкций в различных формах документов. Для разработчиков стало ясно, что создание классификатора без автоматизации самого процесса разработки практически несостоятельно. Техники для проведения подобных работ в то время не существовало. Поэтому по вполне объективным причинам текстовой форме идентификации наименований показателей в разрабатываемой тогда информационной технологии места не нашлось. Она оказалась невостребованной. Эта невостребованность практически означала отказ от разработки ОКТЭСП и, следовательно, отказ от использования наименования показателя в качестве идентификатора основной информационной единицы с правом самостоятельного хождения в информационном пространстве. Создание информационной технологии, основанной на применении классификатора наименований показателей, а также разработка самого классификатора оказались преждевременным делом. Внимание к разработке классификатора наименований показателей было ослаблено, а затем полностью забыто. Развитие информационных технологий пошло по пути, более приемлемому для того времени. Функцию кодирования технико-экономических показателей было решено возложить на систему унификации форм документов. Лингвистическая обработка текстовой формы идентификатора показателей при этом методе кодирования ушла на второй план, поскольку для выбранной технологии она практического значения не имела. Техника с текстовой формой не работала, а пользователь всегда имел возможность разобраться со смысловыми значениями, заложенными в наименованиях показателей, даже если они были недостаточно точно сформулированы. Для кодовой идентификации показателей был применен координатный метод, при котором в качестве кодового обозначения показателя стали использовать координаты его расположения в форме документа. При этом длина кодовой записи значительно сокращалась, однако взамен образовывалась жесткая связь между показателем и формой документа, которая в настоящее время является одной из главных причин, ведущих к сокращению времени жизни технологии первого поколения. Это выяснилось в более позднее время, когда начали предприниматься попытки создания поисковой системы на базе действующей технологии. Оказалось, что «Классификатор унифицированных форм документов» (ОКУД) является источником значительных информационных шумов, мешающих проведению поисковых процедур. Существование шумов напрямую связано с наличием жесткой связи между показателем и формой документа, поскольку в самом методе кодирования изначально заложено условие, при котором каждый показатель может иметь неограниченное множество самых разнообразных кодовых идентификаторов. Вполне естественно, что результативность поиска в этих условиях сводится до минимума. Другая, не менее негативная сторона, обусловленная выбранным методом кодирования, — это неустойчивое состояние классификатора ОКУД в условиях объективно существующей непрерывной актуализации (обновления) форм документов. Режим постоянно текущего непрерывного обновления стал причиной значительных задержек не только в технологическом процессе обработки информации, но больших сложностей с ее сбором. В частности, возникают проблемы со скоростью внесения и доведения изменений до широкого круга территориально распределенных пользователей. В настоящее время эти специфические особенности технологии первого поколения превратились в ее серьезные недостатки, в первую очередь в силу того, что изменился сам пользователь. Можно сказать, что за прошедшие годы пользователь достаточно комфортно адаптировался к работе в условиях механизированных технологий обработки информации, у него выработалась привычка общения с техникой, повысилась потребность в быстром получении необходимой и достоверной информации. В практику его работы вошел компьютер, мобильный телефон и многое другое. Изменились его потребности. Все чаще пользователь высказывает необходимость в создании единого информационного ресурса на всем информационном пространстве отрасли и перехода на автоматизированную технологию обработки информации [2]. Идут поиски концепции построения информационных и коммуникационных технологий, способных работать в режиме реального времени, обеспечивая пользователю возможность проводить не только необходимые ему виды мониторинга, но и возможность доступа к ресурсам информационного пространства непосредственно со своего рабочего места. Ставится вопрос о создании инфраструктуры для обмена электронными документами с использованием электронной цифровой подписи [11]. Все это говорит о том, что в настоящее время от реально работающей информационной технологии требуется выполнение функций, на которые она не была рассчитана. Именно это обстоятельство является первопричиной кризисной ситуацией, возникшей в информационном пространстве отрасли. На основе изложенного выше можно с уверенностью сказать, что устранение кризисной ситуации лежит не столько в плоскости совершенствования технических и программных средств, сколько в состоянии продукта, подлежащего технологической обработке. Можно предположить, что изменение продукта непременно приведет к коренному изменению всего технологического процесса и в свою очередь его программного обеспечения. Вероятной альтернативой технологии первого поколения может стать информационная технология второго поколения, которая будет ориентирована на обработку единичного показателя, имеющего право самостоятельного хождения в информационном пространстве и свой уникальный поисковый образ, не имеющий жесткой связи с формой документа. Переход на информационную технологию второго поколения способен качественно изменить облик информационного пространства отрасли. В частности: — появится новая среда общения между человеком и техническими средствами обработки информации. В качестве механизма, обеспечивающего ее функционирование, может быть применен классификатор наименований показателей. Процедура идентификации (кодирования) единиц информации, учитывая высокий уровень развития технических средств и математического обеспечения, может быть полностью возложена на технические средства, а пользователю предоставлена возможность общения с техническими средствами на естественном для него языке. Идеология, ранее заложенная в основу разработки такого классификатора, может быть востребована. Тем более, что технические средства и математическое обеспечение в настоящее время не являются больше ограничением ее развития; — система унификации форм документов освободится от функции кодификации единиц информации. Взамен в ее структуру войдут программы, позволяющие самим пользователям информационного пространства с помощью технических средств создавать формы документов, ориентируясь на собственные интересы. Изменится назначение альбомов унифицированных форм документов. Они будут выполнять чисто собирательную функцию (функцию «упаковки» показателей) и не влиять на процесс функционирования технических средств, как это имеет место в действующей технологии; — появится возможность организовать информационный ресурс отрасли в виде единой территориально распределенной информационной платформы, в которой основной единицей информации, подлежащей хранению на технических носителях, будет выступать единичный показатель. Образно говоря, «мозаичная» структура информационной платформы будет иметь «мелко зернистую» структуру, так как в основание ее будет заложена самая мелкая и наиболее стабильная единица («кирпичик») информации, которой вряд ли когда потребуется замена. Стабильность информационной единицы и стабильность организационной структуры информационной платформы являются залогом ее гибкости и практически неограниченного времени жизни всего информационного пространства; — на базе такой информационной платформы открывается возможность создания мощной фактографической информационно-поисковой системы, обладающей высокой степенью разрешения и способностью обеспечить режим прямого доступа к информационным ресурсам в режиме реального времени непосредственно с рабочих мест пользователей; — открывается возможность создания непрерывного автоматического режима обработки информации во всей технологической сети, оборудованной терминалами для поставщиков и потребителей информации, расположенными непосредственно на их рабочих местах. У пользователя появится возможность перехода на более прогрессивные методы работы непосредственно с электронными носителями, сводя до минимума традиционно существующие приемы работы с бумажными носителями и т.д. Проведенный анализ показывает, что в условиях возросших требований пользователей, а также выросших возможностей современной техники и математического обеспечения наиболее «узким» местом в информационном пространстве отрасли оказалась среда общения между пользователями информационного ресурса и техническими средствами. Выходом из кризисной ситуации может стать отказ от координатного метода идентификации единичного показателя и, следовательно, от жесткой связи между идентификатором и формой документа. В этом случае каждый показатель, будучи обеспечен собственным поисковым образом, уникальным для всего информационного пространства отрасли, в форме текстового и кодового идентификаторов, приобретет возможность самостоятельного хождения в информационном пространстве. Увеличится дискретность структуры информационного ресурса, позволяющая качественно изменить все информационное пространство. Но для этого потребуется не только создание классификатора наименований технико-экономических и социальных показателей (ОКТЭСП) как нового механизма, создающего и регламентирующего новую среду общения, но и создание принципиально новых средств программного и технического обеспечения, ориентированных на взаимодействие с новой средой общения. Практически это означает смену поколений технологий обработки информации.
ЛИТЕРАТУРА
- Красильников И.А., Мусийчук Ю.И., Петров Е.И. Тенденции развития информатизации здравоохранения по данным журнала «Врач и информационные технологии» (к двухлетию выхода журнала) // Врач и информационные технологии. — 2006. — N 2. — С. 7-13.
- Стуколова Т.И. Современное состояние и перспективы развития информатизации в здравоохранении Российской Федерации // Проблемы управления здравоохранением. — 2002. — N 1. — С. 20-22.
- Концепция информатизации Федерального агентства по здравоохранению и социальному развитию // Врач и информационные технологии. — 2005. — N 5. — С. 4-12.
- Кокорина Е.П., Вялкова Г.М., Кузнецов П.П., Михайлова Л.А. Значение системы аналитических медицинских центров для укрепления управленческой вертикали в отрасли и повышения эффективности работы ЛПУ // Проблемы управления здравоохранением. — 2002. — N 1. — С. 34-36.
- Глоссарий основных понятий и терминов системы счетов российского здравоохранения. Словарь современной медико-экономической науки / Под ред. акад. РАМН В.И.Стародубова — М.: РИО ЦНИИОИЗ МЗ РФ, 2004. — 124 с.
- Общесоюзный классификатор технико-экономических и социальных показателей (ОКТЭСП). — М.: ЦСУ СССР, 1980.
- Общесоюзный классификатор. Технико-экономические показатели. Методические указания. ЦСУ СССР. Госстандарт СССР. — М.: Издательство стандартов, 1975.
- Экономическая информация. Методические проблемы. — М.: Статистика, 1975.
- Методика опытного внедрения ОКТЭП. — М.: ЦСУ СССР, 1980.
- «Единое информационное пространство здравоохранения может функционировать только на основе технологически грамотно построенных систем управления учрежденческого уровня». Интервью с директором Исследовательского центра медицинской информатики Института программных систем РАН Ядулой Иман-оглы Гулиевым // Врач и информационные технологии. — 2007. — N 2. — С. 4-9.
- Столбов А.П. Информатизация здравоохранения: новые реформы — старые проблемы // Врач и информационные технологии. — 2007. — N 2. — С. 66-72.
Главный специалист ФГУ
ЦНИИОИЗ Росздрава России
С.А.РЕПКИНА
Д.м.н., профессор ФГУ
ЦНИИОИЗ Росздрава России,
г. Москва
С.А.ЛЕОНОВ