Программно-аппаратная платформа Cloud.HPC
Введение
ООО МНПП «Тэкинком» предлагает ниже конвергентную вычислительную платформу для размещения в центре обработки данных.
Основными критериями при разработке решения являлись:
- Максимальная унификация модулей серверного оборудования и программного обеспечения для снижения капитальных и эксплуатационных затрат.
- Использование технологий виртуализации серверного оборудования и рабочих мест пользователей для повышения коэффициента эффективного использования оборудования и программного обеспечения.
- Использование технологий конвергентных межмашинных соединений, позволяющих на едином аппаратном обеспечении реализовывать как высокопроизводительные параллельные научные и технические расчеты, так и общие конструкторские и управленческие задачи.
- Использование при проектировании уже существующих на предприятии программно-аппаратных комплексов.
Необходимыми условиями при разработке решения являлись:
- Обеспечение требуемого уровня защиты информации на каждом уровне решения, в зависимости от класса обрабатываемой информации,
- Обеспечение отказоустойчивости решения как в целом, так и по отдельным компонентам.
- Обеспечение долговременного хранения данных.
- Возможность гибкой модернизации решения в зависимости от запросов пользователей.
Описание архитектуры
Архитектура платформы основана на модульном принципе. Каждый модуль состоит из унифицированных и частично взаимозаменяемых ячеек определённого функционального назначения.
Описание обязательных модулей
Ячейка Cloud.Node GA
Ячейка Cloud.Node GA в первую очередь предназначена для использования в качестве узлов многомашинного вычислительного комплекса. В качестве альтернативного варианта возможно использование ячейки для виртуализации серверной инфраструктуры, виртуализации рабочих мест пользователей, создания частного облачного сервиса.
Ячейка характеризуется количеством вычислительных узлов, используемых в ней и количеством соединений с конвергентной сетью передачи данных.
Например, ячейка Cloud.Node 30x1 GA содержит 30 вычислительных узлов, каждый из которых соединен с конвергентной сетью передачи данных по 1 каналу.
Ячейки могут объединятся в вычислительные модули в количестве до 8 ячеек на один модуль.
В случае, когда к ячейке предъявляются повышенные требования по защите информации, ячейка может быть выполнена в специальной версии Cloud.Node GA S.
Например, ячейка Cloud.Node S 16x1 GA содержит 16 вычислительных узлов, каждый из которых соединен с конвергентной сетью передачи данных по 1 каналу.
Ячейка Cloud.Node HA
Ячейка Cloud.Node HA в первую очередь предназначена для использования в качестве узлов платформы виртуализации. В качестве альтернативного варианта возможно использование ячейки для узлов многомашинного вычислительного комплекса с поддержкой арифметических и графических ускорителей типа Intel Xeon Phi или NVidia GPU, виртуализации рабочих мест пользователей, создания частного облачного сервиса, создание конвергентных систем хранения данных.
В дизайне ячейки реализовано требование NSPOF (без единой точки отказа), что позволяет обеспечить высокую отказоустойчивость платформы.
Ячейка характеризуется количеством вычислительных узлов, используемых в ней и количеством соединений с конвергентной сетью передачи данных.
Например, ячейка Cloud.Node 12x2 HA содержит 12 вычислительных узлов, каждый из которых соединен с конвергентной сетью передачи данных по 2 дублированным каналам.
Ячейки могут объединятся в вычислительные модули в количестве до 8 шт на один модуль.
Модуль Cloud.Storage
Модуль Cloud.Storage предназначен для оперативного хранения данных, обрабатываемых на ячейках модуля Cloud.Node.
В модуле реализован доступ к системе хранения как через конвергентную сеть передачи данных, так и через унаследованные сети хранения данных.
Модуль предоставляет доступ к хранимым данным с использованием блочных и, опционально, файловых протоколов, что позволяет обеспечить хранение данных для различных сценариев использования ячеек Cloud.Node.
В дизайне модуля реализовано требование NSPOF (без единой точки отказа), что позволяет обеспечить высокую отказоустойчивость модуля.
Модуль комплектуется различными типами дисков, что позволяет сочетать как высокую производительность, так и большой объем хранимых данных.
Например, модуль Cloud.Storage 72x24 FS содержит 72 диска класса 600GB SAS 10K и 24 диска класса 2TB SAS 7.2K. FS означает возможность файлового доступа к хранимым данных.
В случае, когда к модулю предъявляются повышенные требования по защите информации, модуль может быть выполнена в специальной версии Cloud.Storage S.
Например, модуль Cloud.Storage S 12x0 содержит 12 дисков класса 600GB SAS 10K
Описание дополнительных модулей
Модуль Сloud.Archive
Модуль Cloud.Archive предназначен для долговременного хранения данных, обрабатываемых на ячейках модуля Cloud.Node.
В модуле реализован доступ к системе резервного хранения как через конвергентную сеть передачи данных, так и через унаследованные сети хранения данных.
Модуль предоставляет доступ к хранимым данным с использованием блочных и, опционально, файловых протоколов с использованием протоколов де дупликации данных, что позволяет обеспечить хранение данных для различных сценариев использования ячеек Cloud.Node.
Неотъемлемой частью модуля является программное обеспечение, обеспечивающее организованный процесс создания, хранения и архивации резервных копий всех данных платформы, причем процесс создания и перемещения резервных копий происходит без остановки работы ячеек Cloud.Node.
Модуль комплектуется ленточной библиотекой и сервером резервного копирования.
Например, модуль Cloud.Archive 80x24 содержит ленточную библиотеку на 80 слотов и 2 привода LTO6 и сервер с 24 дисками класса 1TB SAS 7.2K.
В случае, когда к модулю предъявляются повышенные требования по защите информации, модуль может быть выполнена в специальной версии Cloud.Archive S.
Например, модуль Cloud.Archive S 80x24 содержит ленточную библиотеку на 80 слотов и 2 привода LTO6 и сервер с 24 дисками класса 1TB SAS 7.2K.
Модуль Cloud.Core
Модуль Cloud.Core предназначен для интеграции конвергентной сети передачи данных, используемых для связи модулей платформы с сетью передачи данных, к которой подключаются клиенты.
Модуль предоставляет возможность коммутации между сетью передачи данных и конвергентной сетью передачи данных модулей с использованием сетевых технологий коммутации и маршрутизации.
В дизайне модуля реализовано требование NSPOF (без единой точки отказа), что позволяет обеспечить высокую отказоустойчивость модуля.
Модуль комплектуется коммутаторами, объединенными в единый стек, имеющих необходимое программное обеспечением для коммутации и маршрутизации данных.
Например, модуль Cloud.Core 48x12 FS имеющие 48 портов Gigabit SFP и 48 портов Gigabit T для интеграции к сети передачи данных и 12 портов 10 Gigabit SFP+ для интеграции с конвергентной сетью передачи данных.