Инновационный подход ускоряет работу с базами данных на SSD
В недавнем исследовании, представленном на технической конференции USENIX 2020, исследователи из корейского Научно-технического института свободной экономической зоны Тэгу Кёнбук (DGIST), описали новый способ реализации хранилища «ключ-значение» в твердотельных накопителях (SSD). Он имеет много преимуществ перед более широко используемым методом, в том числе улучшенную производительность, которая может привести к уменьшению задержек на стороне пользователя для многих интернет-сервисов, приложений искусственного интеллекта и облачных систем.
Хранилище «ключ-значение» (база данных «ключ-значение») — это способ хранения, управления и извлечения данных в форме пар «ключ-значение». Наиболее распространенный путь его реализации — использование хеш-функции, которая может оперативно сопоставить заданный ключ со связанными с ним данными для ускорения чтения/записи. Однако, случайная природа хэш-функции часто является проблемой, вызывая дополнительные задержки при работе с хранилищем.
Для решения этой проблемы, исследователи из DGIST прибегли к другой парадигме, под названием журнально-структурированное дерево со слиянием (Log-Structured Merge-tree, LSM). Она базируется на иерархическом упорядочивании данных и накладывает ограничение на максимальную задержку.
Благодаря оптимизации использования памяти, фиксированному верхнему пределу задержкек и аппаратным ускорителям, освобождающим центральный процессор от некоторых задач сортировки, разработанное командой DGIST решение под названием PinK, представляет собой новый и эффективный подход к хранению данных на SSD-накопителях в ЦОД.
Результаты экспериментов подтверждают повышение производительности, обеспечиваемое PinK, и демонстрируют перспективность наделения устройств хранения возможностью производить некоторые вычисления самостоятельно.
Источник: ko.com.ua