Аналог Oracle Exadata: архитектура и возможности Tantor XData Gen3

от Alex Matk

Tantor XData Gen3 представляет собой машину баз данных, спроектированную для устранения трёх ключевых архитектурных ограничений стандартного PostgreSQL: отсутствия горизонтального масштабирования, деградации производительности при подключении тысяч соединений и невозможности эффективной обработки смешанных транзакционных и аналитических нагрузок. Эти ограничения долгое время препятствовали использованию PostgreSQL в критических информационных системах крупного бизнеса, где традиционно применялись Oracle Exadata, SAP HANA и IBM Netezza.

По данным разработчика – компании Тантор Лабс, классический PostgreSQL демонстрирует критическое падение производительности при достижении 5 тысяч одновременных подключений, что делает его непригодным для высоконагруженных корпоративных сред без дополнительных архитектурных доработок. Tantor XData Gen3 обеспечивает стабильную работу при десятках тысяч подключений за счёт внедрения проприетарных технологий управления соединениями и балансировки нагрузки, сохраняя при этом полную совместимость с существующими приложениями и расширениями PostgreSQL.

Система не является форком PostgreSQL или «ускоренной» версией СУБД — это комплексный программно-аппаратный комплекс, где каждый компонент оптимизирован для работы в кластерной архитектуре. В отличие от простых репликационных решений, Tantor XData Gen3 реализует линейное масштабирование и позволяет независимо расширять подсистемы вычислений и хранения, что является архитектурной характеристикой, аналогичной подходу Oracle Exadata.

Технология распределённого хранения Tantor PFS и сетевой инфраструктуры

Проприетарная распределённая файловая система Tantor PFS функционирует поверх высокоскоростной сети RDMA с поддержкой протоколов InfiniBand или RoCEv2, предоставляя всем узлам кластера единое блочное устройство с задержками, сопоставимыми с использованием локального SSD-диска. Такая архитектура устраняет фундаментальное ограничение PostgreSQL — привязку экземпляра базы данных к одному серверу и локальному хранилищу. Приложение обращается к единой базе данных, в то время как система автоматически балансирует нагрузку и обрабатывает сбои на уровне инфраструктуры.

Использование протокола NVMe-oF (NVMe over Fabrics) в сочетании с RDMA позволяет организовать прямое обращение к удалённым устройствам хранения по сети с минимальными накладными расходами. Задержки доступа к общему хранилищу в данной архитектуре сопоставимы с показателями локальных SSD-накопителей, что критически важно для транзакционных систем с высокими требованиями к времени отклика. В Oracle Exadata аналогичную роль выполняет технология RDMA-доступа к флеш-кешу, где в поколениях X10M и X11M задержки чтения из кеша составляют 14 микросекунд при использовании памяти DDR5 в качестве кеширующего слоя XRMEM.

Tantor PFS реализует единое блочное устройство для всего кластера, что упрощает управление данными и исключает необходимость в шардировании на уровне приложения. Такая конструкция позволяет добавлять вычислительные узлы без перераспределения данных между физическими носителями, сохраняя линейный рост пропускной способности запросов.

Tantor RAC: реализация отказоустойчивости и балансировки нагрузки

Tantor RAC реализует активно-пассивную кластерную архитектуру с одним узлом, принимающим транзакции записи, и несколькими читающими узлами, которые обслуживают аналитические запросы и выборки данных. Технология включает автоматическое переключение на реплику при сбое основного узла (failover) с минимальным временем простоя, а также механизм умного прокси для маршрутизации запросов между узлами кластера. Согласованность данных на уровне сессий гарантирует, что клиентское приложение в рамках одной сессии будет видеть консистентное состояние данных независимо от того, на какой узел был направлен запрос.

Добавление читающих узлов в кластер увеличивает суммарную пропускную способность обработки запросов линейно — каждый новый узел принимает на себя часть нагрузки по чтению. Такой подход характерен для архитектур, разделяющих транзакционные и аналитические потоки, и аналогичен принципам работы Oracle Real Application Clusters, где несколько узлов одновременно работают с единым хранилищем. В Tantor XData Gen3, в отличие от Oracle RAC с его мульти-мастер архитектурой, используется упрощённая схема с одним мастер-узлом для записи, что снижает сложность обеспечения согласованности при конкурентном доступе.

Рекомендую посмотреть
Австралия запретила YouTube и все соцсети детям до 16 лет — первой в мире, но явно не последней

Механизм CSN реализован для повышения производительности при высокой конкуренции транзакций, характерной для крупных информационных систем с тысячами одновременно работающих пользователей. Этот механизм оптимизирует обработку номеров последовательности фиксации транзакций, устраняя типичные узкие места в управлении многоверсионностью данных.

Гибридная обработка транзакционных и аналитических запросов (HTAP)

Tantor XData Gen3 обеспечивает полноценную одновременную обработку транзакционных и аналитических запросов (HTAP) без необходимости выгрузки данных в отдельные аналитические хранилища или витрины. Такая возможность реализована благодаря архитектурному разделению вычислительных ресурсов и использованию единого хранилища, где транзакционные операции записи не блокируют выполнение тяжёлых аналитических сканирований. В классическом PostgreSQL попытка выполнить ресурсоёмкий аналитический запрос на рабочей транзакционной системе приводит к деградации производительности обоих типов нагрузки.

Конвейерная запись WAL, реализованная в системе, позволяет ускорить фиксацию транзакций за счёт параллельной обработки журнала предзаписи на нескольких узлах. Параллельная обработка запросов на всех узлах кластера распределяет вычислительную нагрузку при выполнении аналитических операций, таких как полное сканирование таблиц, агрегация и сортировка больших объёмов данных.

Аппаратной основой для обработки смешанных нагрузок служат процессоры AMD EPYC. Эти процессоры обеспечивают значительное количество ядер в одном сокете, поддержку десятков линий PCIe 5.0 и до 12 каналов памяти на процессор. Такая конфигурация позволяет одновременно выполнять большое количество транзакционных операций и ресурсоёмких аналитических запросов без взаимных блокировок. Для сравнения, Oracle Exadata X11M использует процессоры AMD EPYC пятого поколения с сопоставимыми характеристиками: в конфигурациях с двумя сокетами доступно до 96 ядер, а пропускная способность памяти DDR5 увеличена на 33 процента относительно предыдущего поколения X10M.

Архитектурное позиционирование и целевые сценарии применения

Tantor XData Gen3 позиционируется как альтернатива Oracle Exadata, SAP HANA и IBM Netezza в информационных системах с критическими требованиями к масштабируемости, доступности и производительности при смешанных нагрузках. Решение ориентировано на организации, которые до настоящего времени не могли мигрировать с импортных СУБД на PostgreSQL-совместимые платформы из-за архитектурных ограничений открытой СУБД. Основной сценарий применения — замена существующих инфраструктур Oracle Exadata, где накоплен значительный объём данных и бизнес-логики, реализованной в хранимых процедурах и триггерах.

В отличие от Oracle Exadata, где реализована концепция offloading — выгрузка операций на уровень storage-серверов (Smart Scan, декомпрессия, дешифрование данных непосредственно в ячейках хранения), Tantor XData Gen3 делает акцент на горизонтальном масштабировании вычислительных узлов и едином адресном пространстве хранения. Oracle Exadata в поколениях X10M и X11M использует двухсокетные storage-серверы с процессорами AMD EPYC, выполняющие микрокод обработки SQL непосредственно в storage-слое, в то время как Tantor PFS работает как классическое единое блочное устройство.

Сетевая инфраструктура в Oracle Exadata X11M базируется на адаптерах ConnectX-7 с пропускной способностью 200 гигабит в секунду на порт, использующих протокол RoCE для RDMA-доступа. Tantor XData Gen3 также применяет RDMA через сети InfiniBand или RoCEv2, что создаёт сопоставимую основу для организации эффективного обмена данными между вычислительными и storage-узлами.

Ключевое различие между системами заключается в экосистеме: Oracle Exadata оптимизирован исключительно для Oracle Database, включая поддержку векторного поиска для AI-нагрузок (ускорение HNSW-запросов на 43 процента и IVF-запросов на 55 процентов в версии X11M). Tantor XData Gen3, сохраняя полную совместимость с PostgreSQL, предоставляет путь миграции для организаций, использующих открытую экосистему Postgres, с сохранением всех существующих расширений и прикладного кода без изменений.

Связанные посты