Пустая трата места
На показатель эффективности использования хранилищ напрямую влияет проблема навыков. Все меньше и меньше квалифицированных ИТ-специалистов управляют большим объемом хранилищ, вследствие чего системные администраторы не имеют достаточных навыков управления хранилищами для управления критически важными инфраструктурами хранилищ. Это усугубляется тем фактом, что в новых предложениях по хранению часто используются старые, неэффективные технологии и методы управления хранением, полученные в результате реинжиниринга продукта.
Экономьте на хранении
Столкнувшись с постоянным давлением, направленным на снижение затрат на центры обработки данных, большинство ИТ-специалистов концентрируются на получении самой большой скидки или лучшей цены при покупке нового хранилища. Однако зачастую проще и быстрее сэкономить на расходах на хранение за счет улучшения использования существующих инфраструктур хранения.
Использование хранилища - это процент использованной емкости хранилища по отношению к количеству доступной или сконфигурированной емкости - и в течение последних шести лет в дата-центрах он постоянно снижается. За последние несколько лет использование хранилищ в центре обработки данных снизилось с 67% до рекордного минимума в 54% в 2016 году, а затем немного улучшилось до 56% в 2017 году.
Как отмечают эксперты, на каждые 10% неиспользуемого хранилища или сниженного использования хранилища в типичном массиве 300 ТБ стоимость потерянного пространства составляет около 12 000 долларов США для гибридного массива и 60 000 долларов США за твердотельный массив, включая затраты на программное обеспечение, поддержку и обслуживание. Эти неэффективные расходы удваиваются, если коэффициент использования хранилища составляет всего 60%, и далее на каждые 10% сокращения использования емкости. Затраты на приобретение для хранения в интегрированных системах близки к затратам гибридных массивов хранения, хотя иногда могут и превышать их. Затраты на системы хранения объектов, которые часто используются для аналитических рабочих нагрузок, примерно такие же, как и для недорогих массивов, работающих на обычных жестких дисках.
Расходы на ИТ-администрирование или расходы на персонал также могут быть уменьшены при увеличении коэффициентов использования хранилища, поскольку для уменьшения общего объема необработанной емкости требуется меньше администраторов хранилища. Это, в свою очередь, приведет к увеличению производительности администратора хранилища или даже администратора общего направления.
Неэффективное использование хранилища
За последние пять лет объем приобретаемой емкости массивов хранения увеличивался на 15% в год, но это дополнительное хранилище используется неэффективно. Эта дополнительная емкость хранения управляется меньшим количеством сотрудников, многие из которых имеют меньший опыт управления системами хранения.
Конечно, администрирование массивов хранения стало проще, а инициализация стала автоматизированной благодаря интерфейсам прикладного программирования (API) и ПО интеграции между гипервизорами и массивами хранения. В то же время в интегрированных или гиперконвергентных системах используется больше внутренних серверов или хранилищ с прямым подключением. Тем не менее, несмотря на относительную простоту предоставления хранилища, сокращение числа специальных администраторов хранилищ и отсутствие практики управления хранилищем уже оказывают негативное влияние на использование хранилищ и показатель затрат на ИТ.
Так, продолжающееся снижение использования хранилища и увеличение потерь также может быть связано с тем, что задачи администрирования сервера, сети и хранилища объединены в обязанности одного системного администратора.
Поскольку во многих организациях больше нет выделенных отделов или должности, рекомендации по хранению могут быть не реализованы. В наихудших сценариях системные администраторы могут даже не иметь каких-либо согласованных, документированных или принудительных рекомендаций по хранению. Кроме того, может не существовать согласованной цели для использования хранилища.
В некоторых средах, например в тех, где контейнеры Docker создаются и удаляются достаточно быстро, оставшееся постоянное хранилище из удаленных контейнеров может остаться без внимания. Со временем это может стать проблемой, так как увеличивается количество неиспользованных контейнеров.
Администраторы хранилища или системные администраторы общего направления должны управлять этим оставшимся хранилищем с помощью программного обеспечения для управления контейнерами или систем мониторинга, которые способны информировать систему хранения или администратора хранилища, когда хранилище удаленных контейнеров может быть удалено и повторно использовано для других приложений или контейнеров. Процесс управления контейнерами и жизненным циклом для временных данных - создание, использование и удаление - такой же, как и для любых приложений.
Кроме того, некоторые дата-центры могут иметь определенные объемы систем хранения для использования в рамках Биг Дата или аналитических приложениях. Программное обеспечение, используемое некоторыми аналитическими приложениями (например, зеркалирование, используемое в некоторых распределенных файловых системах), может быть не самым эффективным с точки зрения стоимости и эффективности хранения.
Например, более старые версии Hadoop часто используют свою репликацию по умолчанию для хранения файлов, которая требует в три раза больше памяти, чем если бы хранился один файл.
Самые эффективные варианты
Администраторы должны использовать наиболее эффективные или современные алгоритмы защиты Raid или коды стирания для оптимизации использования хранилища. Аналогичным образом, при использовании гипервизоров ИТ-руководителям и администраторам гипервизоров необходимо периодически проверять, используют ли они наиболее эффективные варианты хранения.
Кроме того, они должны проверять и анализировать продукты программно-определяемого хранилища (SDS) на момент покупки, прежде чем их можно будет использовать для замены встроенных в систему служб хранения.
Фактически не рекомендуется использование хранилища на 100%, потому что это не оставило бы места для расширения. Тем не менее, нет никаких причин, по которым использование хранилища должно составлять 56%. Вместо этого ИТ-руководителям рекомендуется стремиться к тому, чтобы коэффициент использования хранилища составлял около 80%, что является целевым показателем общепризнанно эффективных методик на протяжении десятилетий.
Этот 80% коэффициент позволяет использовать 20% свободного места для пиков спроса и краткосрочного роста.
Однако любые расчеты по использованию хранилищ усугубляются ростом неструктурированных данных, используемых в аналитике, и объемом внутреннего хранилища, используемого в гиперконвергентной инфраструктуре (HCI) и / или интегрированных системах, которые в настоящее время составляют все большую долю хранилищ в центрах обработки данных.
По этой причине ИТ-руководители должны отдавать предпочтение использованию систем мониторинга и составления отчетов об использовании хранилища. Это особенно важно в крупных инфраструктурах HCI и в рамках аналитики данных размером от сотен терабайт до петабайт.