Сучасну організацію неможливо уявити без електронних даних. І чим крупніше фірма, тим сильніше її функціонування залежить від комп’ютерної техніки. Документи і бухгалтерія, рахунки клієнтів і організацій, рекламна інформація, пошта, програми, файли з графічними і аудіо/відео даних, корпоративні бази даних і т. д., — все знаходиться на дисках серверів локальних мереж або дисках мейнфреймів. Можна навіть порівняти, що інформація — це кров, яка тече по жилах корпорації і підтримує його життєдіяльність.

Тенденції зростання обсягів та концентрації інформації

В даний час практично всі організації стикаються з проблемою критичного наростання обсягів інформації. Зростання даних ставить перед технічним персоналом будь-якої компанії завдання побудови сучасної системи зберігання даних. За даними дослідження, проведеного компанією Meta Group (Стемфорд, шт. Коннектикут), обсяг інформації, аккумулируемой компаніями, подвоюється кожні 18 місяців. Звичайно, такі показники поки що більш актуальні для зарубіжних компаній, але і в російських фірмах йде процес збільшення обсягів корисної інформації. Тим більше, що зараз в Росії швидкими темпами розвиваються такі сфери діяльності, як електронна комерція, планування ресурсів підприємства (ERP) та управління взаємовідносинами з клієнтами (customer relationship management — CRM).

Історично склалося так, що на кожному підприємстві зібрався цілий комплекс різних автоматизованих систем, кожна з яких так чи інакше вирішує ті завдання, для яких вона призначена. Ні для кого не секрет, що обмінюватися даними всі ці системи можуть з великими труднощами, а то й взагалі потрібен новий введення даних для кожної конкретної системи. Тому, виникає зацікавленість користувачів у концентрації інформації, щоб застосовувати її на різних системних платформах. При цьому, спільне використання інформації передбачає консолідацію корпоративного апаратного забезпечення. Переважаючі в корпоративних інформаційних системах додатки баз даних тільки посилюють потребу в зв’язках між різними платформами. Концепцію «великого мішка» успішно застосовують багато компаній. Проведений Business Research Group опитування 300 фахівців показав, що дві третини респондентів розглядають можливість об’єднання пристроїв зберігання даних в єдину підсистему, яка допускає спільне використання даних.

Як це не дивно, більшість компаній відносяться до питання створення структури зберігання даних не надто серйозно. «Поки що більшість компаній діють імпульсивно. Усвідомлюючи зростання обсягу інформації, вони просто збільшують число серверів і розширюють обсяг дискового простору. Лише деякі підходять до проблеми стратегічно», — говорить Джефф Хайн, керівник підрозділу професійного обслуговування компанії Berkshire Computer Products (Хопкинтон, шт. Массачусетс). Причому такий похід спостерігається як у зарубіжних, так і в російських компаніях.

Ціна втрати доступу до корпоративної інформації

Можна довго обговорювати успіхи технічного прогресу, однак у словосполученні «інформаційні технології» друге поняття завжди підпорядковане першому, а інформація коштувала, і буде коштувати дорожче засобів її обробки, передачі та зберігання. Плата за підтримку неминуче зростаючих обсягів даних становить сьогодні, за даними IDC, 50% всіх витрат на ІТ-рішення. І все це для того, щоб уникнути ще більш високих витрат, пов’язаних з втратами доступу до сховищ інформації і вимірюваних від 20 тис. до 6 млн. дол. в годину залежно від додатка. Ця сума складається з вартості зниження продуктивності службовців із-за збою в системі, вартості роботи, яка не може бути виконана, поки система не відновлена, вартості ремонту, що вийшли з ладу елементів системи. Тому при реалізації критично важливих для підприємства додатків варто врахувати, що ціна простоїв із-за збоїв системи цілком виправдовує вкладення чималих коштів в установку відмовостійких архітектур. Десять років тому, коли сервер локальної мережі на базі процесора Intel виходив з ладу, неприємності компанії обмежувалися обуренням користувачів з приводу відсутності доступу до електронної пошти. Тепер же при виході з ладу програм, від яких безпосередньо залежить прибуток, і при втраті доступу до цінної інформації, компанія зазнає збитків.

У Сполучених Штатах, де залежність від комп’ютерів вище, ніж у Росії, оскільки техніка і програми використовуються більш широко, збитки від збоїв систем складають до 4 млрд. доларів у рік (за даними FIND/SVP). Як правило, зупинка американської фірми на строк до 8 днів веде до зниження до 3-4% річного обороту компанії, а з простою 10 днів здатні подолати всі компанії. Повна ж втрата корпоративної інформації загрожує компанії крахом.

Загальні вимоги до дискових підсистем зберігання даних

Однією з основних проблем побудови дискової підсистеми зберігання даних, в усі часи залишається завдання забезпечення тривалого функціонування. Рішення цієї задачі має три складові: надійність, доступність (готовність) і зручність обслуговування. Всі ці три складових припускають, в першу чергу, боротьбу з несправностями системи, породжуваними відмовами і збоями в її роботі.

Дискова підсистема зберігання даних має в своєму складі накопичувачі на жорстких магнітних дисках. Як будь-технічно складний продукт, накопичувачі на жорстких дисках схильні виходу з ладу зовнішніх і внутрішніх причин. До зовнішніх відносяться — механічні, електричні, погані умови експлуатації. Внутрішні причини діляться на два типи. Перші, «фатальні» — вигорання мікросхем управління, вихід з ладу контактів, внутрішні руйнування компонентів. Другі виявляються у вигляді поступового погіршення функціональних показників диска, виходу характеристик за межі робочого діапазону.

Підвищення надійності системи ґрунтується на принципі запобігання несправностей, шляхом зниження інтенсивності відмов і збоїв за рахунок застосування електронних схем і компонентів з високим та надвисоким ступенем інтеграції, зниження рівня перешкод, полегшених режимів роботи схем, забезпечення теплових режимів їх роботи, а також за рахунок удосконалення методів складання апаратури. Одиницею вимірювання надійності є середній час напрацювання на відмову (MTBF — Mean Time Between Failure).

У 1987 році троє фахівців з університету Берклі опублікували статтю з описом методів підвищення надійності шляхом використання масивів невеликих (3.5 – і 5.25-дюймових) дисководів, які можуть досягти показників продуктивності, характерних для одного великого дорогого диска (Large Single Expensive Disk — SLED) в мэйнфреймах. Ця технологія отримала назву RAID — Redundant Array of Inexpensive Disks (надлишковий масив недорогих дисків). Але пізніше, розшифровка абревіатури RAID зазнала зміна — тепер вона означає Redundant Array of Independent Disks (надлишковий масив незалежних дисків). Дисковий масив RAID — це консолідована серверна система для зберігання даних великого обсягу. В масивах RAID значне число дисків відносно малої ємності використовується для зберігання великих обсягів даних, а також для забезпечення високої надійності та надлишковості. Такий масив сприймається комп’ютером як єдине логічне пристрій.

Підвищення готовності передбачає запобігання впливу відмов і збоїв на роботу системи зберігання даних за допомогою засобів контролю і корекції помилок, а також засобів автоматичного відновлення робочого процесу після прояву несправності. Ключовим моментом тут є забезпечення захисної надлишковості на базі як апаратного, так і програмного забезпечення. Це дозволяє зберегти поточний стан даних або продовжити виконання процесу до заміни вийшли з ладу компонентів на справні.

Відмовостійка система зберігання даних повинна забезпечувати перехід на альтернативне пристрій у разі збою, а також інформувати адміністратора про будь-які зміни конфігурації, так щоб він міг відновити вийшли з ладу компоненти перш, ніж перестануть працювати їх дублікати. Для цього система повинна посилати повідомлення на консоль адміністратора, реєструвати на диску всі помилки для періодичного перегляду, а також мати можливість відправити зовнішнє повідомлення, у разі якщо збій відбувся в відсутність адміністратора на своєму робочому місці.

Підвищення готовності є спосіб боротьби за зниження часу простою системи. Одиницею виміру тут є коефіцієнт готовності, який визначає ймовірність перебування системи в працездатному стані в будь-який довільний момент часу. Статистично коефіцієнт готовності визначається як MTBF/(MTBF+MTTR), де MTTR (Mean Time To Repair) — середній час відновлення (ремонту), тобто середній час між моментом виявлення несправності і моментом повернення системи до повноцінного функціонування.

Необхідно сказати декілька слів про користь застосування резервного копіювання. Звичайно, забезпечення резервного копіювання даних збільшує вартість системи зберігання даних, але треба пам’ятати, що резервні копії — це свого роду «рятувальний круг», здатний стати в нагоді в самих різних ситуаціях (наприклад пожежа, повінь, терористичний акт, тощо). Тому, можливий розумний компроміс між сумарною вартістю систем резервного копіювання і збитками, які може понести фірма в разі втрати даних.

Зрозуміло, що суто технічними рішеннями неможливо повністю запобігти можливі втрати даних. Також необхідні організаційні заходи, що попереджають втрату інформації. По-перше, необхідно забезпечити безпеку доступу до інформації, по-друге, розробити технологію резервного копіювання і відновлення, і, нарешті, визначити місце зберігання резервних носіїв.

При дотриманні всіх цих заходів, втрати інформації зводяться до мінімуму, і, навіть якщо, з якихось причин відбуваються втрати — забезпечується швидке відновлення даних з максимально можливою достовірністю.

Питання вибору дискових систем зберігання даних

Думається, що про необхідність застосування дискових підсистем зберігання даних було сказано вже достатньо. Тому, більш корисним представляється сформулювати перелік загальних питань, які слід враховувати при виборі певної системи зберігання даних:

– Виконання системи?

– Які можливості системи до масштабованості?

– Наскільки надійними є що використовуються дисководи?

– Забезпечення доступності даних: Як реалізовані функції резервування елементів? Як відбувається заміна дисків? Скільки часу це займає та чи можна це зробити не перериваючи роботи?

– Є можливість роботи з різними системними платформами?

– Яким чином здійснюється діагностування системи і аналіз результатів перевірки?

– Чи підтримується технологія забезпечення резервного копіювання?

В даний час на ринку представлено досить велику кількість дискових підсистем зберігання даних різних виробників, що відрізняються за своїми можливостями і характеристиками. В якості прикладу можна розглянути систему TETRAGON фірми COMPAREX (Німеччина), виробником якої є фірма HITACHI (Японія). Дискові системи TETRAGON є лідером на світовому ринку по технічним характеристикам і надійності, насправді гарантують 100%-ву доступність даних (за даними Gartner Group). Організація Raid Advisory Board по своїй класифікації дискових масивів, з точки зору користувачів по захищеності даних, привласнила сімейства COMPAREX TETRAGON максимальний клас DTDS+ (Disaster Tolerant Disk System, або віддалене «дзеркало») — забезпечує збереження даних навіть при повній відмові або фізичне руйнування однієї з систем, а також доступ до даних при відмові будь-якої одиничної компоненти і збереження даних при збої живлення і інших впливах навколишнього середовища.

Дискові підсистеми зберігання даних COMPAREX TETRAGON T2000/T2100 мають наступні технічні характеристики:

– Підсистема TETRAGON виконана як окремий пристрій, що складається з двох блоків — контролера (1 шт.) і дискового масиву (до 4 шт.). Контролер спеціально розроблений для RAID масивів, до якого може підключатися до 4 пар дискових процесорів, кожна з пар допускає до 8 одночасних операцій обміну даних з дисками. Всі елементи контролера з’єднані двома внутрішніми шинами з пропускною здатністю 200 MB/s. ;

Крім цього є ще одна шина, що використовується тільки для цілей управління з пропускною здатністю 100 MB/s. Для моделі T2100 пропускна здатність кожної з двох внутрішніх шин 240 MB/s, а шин управління по 135 MB/s (їх також 2 шт.).

Для обміну даних між серверами і системою TETRAGON, в ній є канальні процесори, які представляють з себе потужні RISС — процесори. У моделі TETRAGON 2000 таких процесорів може бути до 4, а в моделі T2100 — до 8 шт. Кожен з канальних процесорів має по 4 фізичних шляхи для перепосылки даних.

Обсяг енергонезалежної кеш-пам’яті може становити до 8GB (модель Т2000) і до 16GB (T2100).

Побудова системи надає повну незалежність від марок обчислювального обладнання, з яким передбачається спільна робота. Не вимагається установки додаткового програмного забезпечення — достатньо тільки засобів операційної системи.

– Унікальна архітектура TETRAGON дозволяє легко розширювати ємність підсистеми, в залежності від потреб користувача. Мінімальна ємність забезпечує 22.68 GB пам’яті прямого доступу і може бути збільшена до 1 600 GB (для моделі Т2000) і до 11 000 GВ (модель Т2100).

– Спеціально розроблені високонадійні 3.5″ дискові накопичувачі (MTBF — 2 000 000 годин), ємністю до (9 GB. ( (модель Т2000) та до 47 GB. (модель Т2100) або унікальні 2.5″ диски ємністю 6 GB і 15GB, зі швидкістю обертання 12000 об./с (тільки в моделі Т2100), що відрізняються неперевершеною швидкодією. Диски різних об’ємів можуть комбінуватися в одній системі для того, щоб максимально задовольнити конкретним потребам користувача. Дисководи приєднані по двом паралельним інтерфейсу SCSI-2 Wide&Fast.

Система забезпечує постійну доступність даних (24 години 7 днів на тиждень). Дані, занесені в систему, ніколи не потребуватимуть підтримки в режимі off-line — незалежно від того, які помилки можуть статися і які модифікації або зміни конфігурації можуть знадобитися. Така безперервність операції досягається завдяки:

– Можливості виконувати всі модифікації обладнання, не перериваючи роботи користувача.
— Використанням технології RAID-5
— Наявності динамічних запасних дисків, які використовуються автоматично у разі відмов основних дисків. У малоймовірному випадку збою диска, його вміст автоматично відновлюється на запасному дисководі, а після установки справного переписується назад. Навіть при інтенсивній роботі користувачів вся ця операція займе не більше 2 годин. Користувач може мати до 8 запасних дисків
— Відсутності в системі не продубльованих елементів і модулів.

– Крім інтерфейсу з серверами архітектури S/390 по паралельних каналах (забезпечують швидкість передачі даних до 9 MB/s) або ESCON каналів вводу/виводу (до 17 МГ/s), системи TETRAGON можуть оснащуватися інтерфейсом SCSI (до 40 МВ/s) для одночасного підключення до процесорів інших платформ (UNIX, WindowsNT, Novell) і інтерфейсом Fibre Channel (тільки в моделі T2100) (швидкість до 100 МВ/s). Поставляються програмні засоби, що забезпечують за допомогою системи TETRAGON ефективний обмін даними між різними платформами, а також високошвидкісне збереження/відновлення інформації відкритих систем засобами мейнфреймів.

– Дискова підсистема TETRAGON надає великі можливості по діагностуванню. Наприклад, в режимі простою, система автоматично запускає програми перевірки дискового масиву, що дозволяє по-перше завчасно виявити можливі помилки, а по-друге раціонально використовувати час незатребуваності системи користувачами. Є можливості передавати інформацію про помилки відразу на робоче місце адміністратора дискової підсистеми або прямо в сервіс центр.

– Система має підтримку режиму Remote Copy (функція ведення віддаленої дзеркальної копії) в синхронному і асинхронному режимі. Резервна підсистема може бути встановлена в приміщенні, віддаленому до 43км від основного обчислювального центру, при цьому використовується з’єднання між дисковими підсистемами за ESCON каналах.

У даній статті розглянуто питання необхідності побудови систем зберігання інформації у великих організаціях. А також описані найбільш переважні, з нашої точки зору, технології і продукти, які забезпечують з технічної сторони максимально можливу надійність і доступність даних.

А з економічного боку дозволяють зберегти вкладені інвестиції, за рахунок великих можливостей масштабованості.