![]() |
|
|
|
|
|
![]()
Катастрофоустойчивые геокластерные системы Проминвестбанка и АКБ "Укрсоцбанк"
Назначение
Геокластерная система Проминвестбанка - первый катастрофоустойчивый комплекс, созданный специалистами корпорации Квазар-Микро. Основная цель проекта - создание устойчивой к катастрофам программно-аппаратной платформы, предназначенной для развертывая критичного финансового приложения (SWIFTAlliance).
Цели и задачи
Общие требования, предъявленные к системе, были следующими:
В настоящее время единственным приемлемым методом обеспечения катастрофоустойчивости гражданских информационных комплексов является размещение их элементов на различных площадках, разнесенных на достаточное расстояние. Подобные распределенные системы, по своей сути, являются кластерными и часто именуются географическими кластерами или геокластерами.
Особенности проектных решений
Одним из наиболее существенных отличий геокластера от классического высокодоступного кластера является методика обеспечения доступа различных узлов к одним и тем же данным. В высокодоступных кластерах для достижения этой цели традиционно используется разделяемый дисковый массив. По понятным причинам, подобный подход в случае геокластера неприменим. Вместо этого применяются средства удаленной репликации данных, при этом узлы на каждой площадке обладают собственной актуальной копией данных.
Схема решения
Исходя из имеющихся у заказчика ресурсов, было принято решение о создании двухузловой геокластерной системы, узлы которой расположены на площадках в различных зданиях. Основой системы являются RISC-серверы среднего уровня p620 семейства IBM pSeries, работающие под управлением ОС AIX
Благодаря использованию новейших технологий, эти сервера, при умеренной стоимости, обладают высокой производительностью, хорошо масштабируются, а также имеют развитые встроенные средства мониторинга и резервирования аппаратуры. Полное дублирование таких аппаратных компонент, как блоки питания, вентиляторы, диски, дисковые контейнеры, SCSI-контроллеры, в сочетании с встроенными в ОС AIX средствами ранней диагностики и предупреждения позволило добиться высокой степени локальной отказоустойчивости серверов.
Синхронная удаленная репликация данных реализована при помощи ПО Geographic Remote Mirroring (GeoRM) for AIX производства компании IBM. Такие свойства GeoRM, как синхронность процесса репликации, полная независимость от прикладного ПО и возможность использования в качестве транспортной среды существующих IP-сетей позволили полностью удовлетворить выдвинутые Заказчиком требования.
Важнейшим этапом проекта явилось обеспечение высокой эффективности действий персонала в критических ситуациях. Для решения этой задачи были предприняты следующие действия:
Разработанные сценарии восстановления предоставлены заказчику в виде документа "План восстановления в аварийных ситуациях". Документ регламентирует необходимую реакцию персонала в случае возникновения аварийных ситуаций различного характера, в том числе отказа отдельных аппаратных компонент, обратимого и необратимого отказа узлов, ошибок оператора. Для каждого случая предусмотрены три этапа реагирования: идентификация проблемы на основе имеющихся симптомов, восстановление сервиса, восстановление штатного режима работы системы. Эффективность разработанных процедур была подтверждена в ходе проведенных со специалистами Заказчика практических занятий по реагированию на аварийные ситуации.
Хронология реализации проекта
Созданная геокластерная система успешно прошла этапы тестирования и опытной эксплуатации и с ноября 2002 года введена в промышленную эксплуатацию.
Менее чем через год - в сентябре 2003 г. - в АКБ "Укрсоцбанк" вступил в стой второй украинский геокластер. Функционально он полностью аналогичен системе Проминвесбанка и отличается только типом использованного оборудования - на этот раз в качестве кластерных узлов были применены компактные RISC-серверы начального уровня IBM pSeries 610.
Опыт
Накопленные в ходе реализации первого проекта знания и опыт позволили создать вторую геокластерную систему в максимально сжатые сроки - проект был реализован всего за пять недель, включая период тестовой эксплуатации и обучение специалистов банка.
Интересным моментом является то, что разработанный специалистами Квазар-Микро "План восстановления в аварийных ситуациях" уже использовался на практике в обоих банках, к счастью, по вполне будничному поводу - переход сообщества SWIFT на новую систему коммуникаций.
Процедура перехода довольно сложна и требует существенных изменений в настойках операционной системы и ПО SWIFTAlliance, а также достаточно продолжительного этапа тестирования. В обычных условиях это приводит к длительным административным простоям системы межбанковских коммуникаций, что крайне отрицательно сказывается на деятельности крупных банков.
Возможность независимого функционирования узлов геокластера позволила специалистам Проминвестбанка и Укрсоцбанка выполнить все необходимые действия поочередно на каждом узле, при этом второй узел продолжал функционировать в штатном режиме, обеспечивая непрерывность функционирования системы доступа к SWIFT.
Активация, деактивация и ресинхронизация узлов при этом проводились в соответствии с "Планом восстановления в аварийных ситуациях", что еще раз доказало эффективность и безошибочность изложенных в нем процедур.
Результаты
Накопленный уникальный опыт по реализации геокластерных решений в двух ведущих украинских банках позволяет утверждать, что корпорация "Квазар-Микро" довела технологию создания катастрофоустойчивых систем до уровня тиражируемых решений.
|
|
||||||||||||||||||||||||
| О нас | Карта сайта | Подсайты | Поиск | Контакты | Обратная связь | Сотрудникам | Copyright © 2005 Kvazar-Micro. All rights reserved |