Серверы баз данных используются компаниями для хранения объемной информации и работы с ней, так что обычно это мощные вычислительные машины. Но выбирать их только по принципу «чем мощнее, тем лучше» – плохой вариант. Важно понимать, какого типа данные необходимо хранить, чтобы подобрать наилучший вариант из возможных, не потерять такую важную и ценную информацию и не выйти за рамки бюджета.

Давайте разбираться, как влияет тип данных на выбор сервера базы данных, кому необходима эта машина и на какие характеристики стоит обратить особое внимание.

Структурированные данные

Базы данных: типы данных и как они влияют на выбор сервера

Данные, хранимые в базах, бывают двух типов: структурированные и неструктурированные. Давайте подробнее остановимся на каждом из них.

Структурированные данные

Системы обработки электронных платежей, бухгалтерские или банковские – все требуют сохранности в своих базах структурированных данных. В реальности они занимают 90 % объема в обычных информационных системах.

К такому типу данных также относятся:

  • сигнатуры лиц;
  • записи, состоящие из сигнатур лиц;
  • номера паспортов, различных документов, Ф. И. О. и т. д.
Структурированные данные от неструктурированных отличаются тем, что их гораздо проще собрать, а также довольно легко обрабатывать в базах данных. Объем таких данных довольно большой, но не требует особой мощности от сервера.

Неструктурированные данные

Неструктурированные данные встречаются реже, чем структурированные, поскольку это отдельная область знаний. Это может быть:

  • видеоинформация;
  • текст;
  • информация из медицинских систем, где хранятся данные рентгеновских снимков, томограмм, и т. п.

Если вести подсчет таких данных в петабайтах, их окажется гораздо больше, чем структурированных, но компаний, которые занимаются работой с ними, — меньше.

Например, компания «Яндекс» обрабатывает неструктурированные данные, сканируя местности Москвы. Здесь необходимо, чтобы сервер обладал не просто огромной памятью, но и довольно большой мощностью, чтобы классифицировать и распределять такие неупорядоченные данные.

Это особые случаи – и требования к серверам другие. В этой статье мы остановимся на выборе сервера для баз данных со структурированной информацией.

3 способа выбрать сервер для базы данных

Рассмотрим несколько подходов к данному вопросу:

Способ 1. Обратиться к разработчику

Можно обратиться к разработчику информационной системы. Он сможет подсказать, как достигнуть необходимой производительности с помощью той или иной машины, а также примерно определит, какие ресурсы потребуются в том или ином конкретном случае. Понадобится лишь предоставить разработчику информацию о данных, которые планируется обрабатывать в будущем.

Способ 2. Использовать характеристики текущего сервера

Попытаться оттолкнуться от имеющейся машины. Можно довольно объективно замерить, во что упирается производительность на определенном сервере.

Например, на сервере загрузка дисков равна 100 %. Соответственно, сервер 100 % времени занят, а очередь из дисковых команд длинная. Это означает, что процессор ждет, пока данные из накопителей перейдут к нему или же на него запишутся. Это дает понимание, что в отношении накопителей довольно много рисков. Далее нужно посмотреть количество операций ввода и вывода за одну секунду, а также какое количество мегабайт за ту же секунду способно записаться или считаться в имеющейся конфигурации. После такого аудита можно примерно прикинуть, какой сервер необходим, чтобы достичь требуемых цифр по производительности.

Это наилучший способ выбора, потому что мы можем определиться на чем-то, что у нас работает прямо сейчас.

Способ 3. «Угадайка, угадайка, интересная игра»

Конечно, всегда можно прикинуть в голове и предположить, какой сервер купить. Однако такой способ работает в отрыве от реальных данных, так что вероятность удачного выбора крайне мала.

Характеристики, на которые необходимо обратить внимание при выборе сервера баз данных

Мощность

Выбор мощности такого сервера зависит от того, насколько сложный анализ и обработку данных предстоит производить данной машине. Например, если требуется многократное выполнение одинаковых запросов, то маленькой мощностью не обойтись. Слабый процессор с такой задачей может не справиться и будет перегружен.

Для серверов управления базами данных, например, приобретают 64-ядерные процессоры с большим запасом памяти.
Сервер HPE ProLiant DL380 Gen10 (2U)

Объем памяти

Обычно системы управления баз данных построены таким образом, чтобы некоторые наиболее часто запрашиваемые данные хранилась в оперативной памяти. Это делается для того, чтобы легко «выхватить» нужные данные, не залезая за ними в накопитель.

Тут работает принцип, с которым мы сталкиваемся в домашней библиотеке, – самые нужные книги всегда на столе под рукой, менее важные – в первом ряду шкафа, еще менее значимые – во втором ряду.

От количества оперативной памяти зависит еще и производительность сервера. Чем больше оперативной памяти в сервере баз данных, тем выше производительность сервера.

Производительность процессора зависит от того, насколько быстро система управления базами данных получает данные, запросив их из накопителя. Механически это будет зависеть от скорости вращения диска, на это тоже стоит обратить внимание.

В исключительных случаях можно поставить такой объем RAM, который будет в несколько раз превышать объем самих баз данных. Это приведет к тому, что вся информация будет храниться в кеше, так что доступ к ней будет почти мгновенным.

Пропускная способность

Пропускная способность между процессором и оперативной памятью – немаловажный фактор. В персональном компьютере обычно два канала памяти, а в сервере их 12. Это означает, что процессор сервера способен обращаться одновременно к 12 модулям памяти, передавая данные в 6 раз быстрее, чем в персональном компьютере. А чем быстрее процессор имеет доступ к данным, тем быстрее он может их обрабатывать.

Безопасность

К базам данных предъявляются определенные требования по безопасности, поскольку структурированные данные могут включать в себя персональную информацию, утечка которой нанесет вред как бизнесу, так и находящимся в нем людям.

Но дело в том, что защита информации происходит не на самом сервере, а на предприятии. Обычно на предприятиях используют стандартные принципы информационной гигиены и безопасности, такие как антивирус и контроль доступа. По этой причине специфических требований по безопасности непосредственно к серверу нет.

Разберем конкретный пример выбора сервера под имеющиеся задачи и ресурсы. Например, необходимо выбрать сервер под базу 1С. Здесь нет необходимости в высокой производительности процессора, т. к. нет многопоточности процессов – мало параллельных действий, которые необходимо было бы выполнять одновременно. Раз процессор должен быстро обрабатывать задачи только в один поток, то нет нужды в большом количестве ядер, однако производительность каждого ядра должна быть максимальной.

Какой бизнес нуждается в таком сервере?

Любой бизнес – от небольшого до самого крупного – нуждается в сервере баз данных. Разница лишь в том, что мелким компаниям бывает достаточно одного небольшого сервера, чего не скажешь о крупных предприятиях.

В крупных компаниях производятся тысячи операций в день. База данных у них большая и сложная, и им необходима приемлемая мощность, большой объем памяти и высокая скорость работы. Например, для крупной сети магазинов может поставляться четырехпроцессорный сервер, внутри которого 32 модуля памяти по 256 гигабайт в каждом.

Выбор сервера напрямую зависит от масштаба задач – но не только текущих, но и прогнозируемых. Когда компания начинает масштабироваться (например, открываются новые филиалы), количество информации растет и, соответственно, изначальных ресурсов становится недостаточно. Масштабирование системы хранения данных должно происходить параллельно расширению той или иной компании. Необходимо на этот случай держать определенный резерв для возможности накопления информации. И ситуация здесь принципиально иная, чем, например, в сервере бекапа.

Отличие бекап-сервера от сервера баз данных

Главное отличие между ними заключается в том, что на бекап-сервере можно регулярно удалять информацию. Классический цикл «дневной, недельный, месячный» позволяет удалять версии, потерявшие актуальность. Место в бекапе освобождается автоматически, а резервные копии способны храниться очень много лет на лентах.

В сервере баз данных иная ситуация: от поступления новой информации старая не становится неактуальной по умолчанию. Соответственно, в случае долгосрочного хранения данных необходимо заранее позаботиться о наличии под рукой свежих объемов памяти. Для этого опять же нужно обратиться к разработчику, который способен примерно спрогнозировать, через какое время может понадобиться новое пространство и на какой промежуток времени его хватит.

Вместо заключения

Сервер баз данных является необходимостью для каждого бизнеса; нельзя сказать, что он будет значительно облегчать работу предприятия – скорее, без него работа практически невозможна. При этом на роль такой машины подойдет универсальный сервер: он сможет закрывать потребности любой компании, будь то малый бизнес, не требующий сильных мощностей и большого запаса памяти, или крупное предприятие, нуждающееся в разы более быстрой рабочей машины с большим объемом оперативки. Главное правило при выборе сервера баз данных – опираться именно на свои потребности и ресурсы на основе расчета.