Apache Superset и Tableauэто системы бизнес-аналитики, используемые организациями для визуализации и анализа данных.

Apache Superset – это Open source BI система, то есть, приложение с открытым исходным кодом, которое может обрабатывать данные в масштабе петабайт.

Tableau известен в аналитическом сообществе как лидер в области систем бизнес-аналитики с простой в использовании платформой и множеством интеграций.

Эта статья даст вам представление об Apache Superset и Tableau по 5 различным направлениям: функции платформы и гибкость, поддерживаемые источники данных, аутентификация и авторизация, визуализация, цены.

Оглавление

Введение в Apache Superset

Apache Superset – это лёгкое веб-приложение для BI-аналитики с открытым исходным кодом. Оно используется для исследования и визуализации данных, предоставляя широкий спектр возможностей для визуализации: от круговых до высокодетализированных геопространственных диаграмм.

Приложение возникло в виде проекта Максима Бошемена на форуме разработчиков, когда тот работал в Airbnb, а позже, в 2017 г, было встроено в инкубационную программу apache. В организации Apache Software Foundation оно превратилось из инкубационной программы в проект высшего уровня.

Особенности Apache Superset:

  • Предоставляет богатый набор визуализаций.
  • Даёт возможность создания собственных визуализаций с помощью подключаемых модулей, что значительно расширяет возможности продукта.
  • Поддерживает большинство баз данных на основе SQL: MS SQL Server, MySQL, PostgreSQL, Oracle, SQLite, MariaDB, Redshift; и многие другие благодаря использованию SQLAlchemy.
  • Может интегрироваться с Apache Druid. Apache Druid – это база данных, используемая в приложениях для обеспечения высокой производительности запросов и ответов в режиме реального времени. Продолжительное время безотказной работы, обеспечиваемое Apache Druid, имеет первостепенное значение при работе с данными.
  • Содержит встроенную SQL IDE, с помощью которой аналитик может выполнять SQL-запросы.
  • Apache Superset использует расширяемую модель безопасности для определения доступа к своим функциям и интегрируется с основными поставщиками аутентификации (OAuth, OpenID, LDAP и т. д.).
 

Введение в Tableau

Tableau – BI-система, созданная в 2003 году тремя студентами Стэнфордского университета. Tableau имеет низкий порог вхождения, так что позволяет создавать визуализации и дашборды нетехническим специалистам любого уровня. Другое важное преимущество инструмента – большое количество поддерживаемых источников данных.

Особенности Tableau:

  • Позволяет пользователю использовать естественный язык для получения ответов из данных.
  • Предлагается в различных вариантах:  как локально, так и в облаке.
  • Подключается к облачной базе данных любого типа и к базам данных на основе SQL.
  • Предлагает пользователю простую в использовании и удобную функцию перетаскивания элементов при работе с дашбордом.
  • Позволяет без ошибок собирать и агрегировать данные из разных источников.
  • Предоставляет различные виды визуализаций для выявления тенденций.
  • Позволяет передавать созданные дашборды как между сотрудниками организации, так и за её пределы.

Понимание ключевых различий между Apache Superset и Tableau

Теперь, когда вы ознакомились с основами Apache Superset и Tableau, рассмотрим 5 критических факторов, важных для осуществления разумного выбора BI-инструмента, который лучше всего будет соответствовать вашим нуждам:

  1. Apache Superset в сравнении с Tableau: Поддерживаемые источники данных
  2. Apache Superset в сравнении с Tableau: Визуализация
  3. Apache Superset в сравнении с Tableau: Аутентификация и авторизация
  4. Apache Superset в сравнении с Tableau: Платформа
  5. Apache Superset в сравнении с Tableau: Цены

1. Apache Superset в сравнении с Tableau: Поддерживаемые источники данных

Для загрузки, очистки и объединения данных перед проведением анализа совместно с Tableau можно использовать продвинутый ETL-инструмент Tableau Prep, который обладает большим количеством функций для проведения ETL-процедуры, среди которых: объединение разрозненных источников, соединение множества источников по маске, агрегация, замена значений. Все шаги преобразований с данными показаны на графической схеме с возможностью просмотреть данные на каждом шаге. В Tableau есть собственные механизмы для очистки и трансформации данных, так что Tableau Prep стоит использовать, если стандартного функционала недостаточно.

Tableau поддерживает широкий спектр источников данных: файлы CSV, JSON, PDF, Microsoft Excel и Access; коннекторы баз данных от компаний, предлагающих SaaS – Amazon Redshift, Google BigQuery, Microsoft Azure, и другие; коннекторы ODBC и JDBC.

Apache Superset поддерживает большое число баз данных:

  • Microsoft SQL Server, Amazon Redshift, Big Query, MySQL, Snowflake, Apache Druid, Firebird, MariaDB, SQLite, Oracle, Postgres, Elasticsearch, Vertica, и любые базы данных, которые поддерживают SQLAlchemy.

В сравнении Tableau и Apache Superset по возможностям работы с источниками данных  выигрывает Tableau, так как список источников для подключения у данного инструмента более широкий.

 

2. Apache Superset в сравнении с Tableau: Визуализация

Apache Superset содержит богатый набор стандартных визуализаций и, кроме того, поставляется с SQL Lab (средой SQL разработки), которая позволяет пользователям создавать уникальные запросы к данным и строить визуализации на их основе с помощью SQL-запросов.
В возможности Tableau по работе с визуализациями входят: работа пользователей по принципу drag-and-drop, то есть перетаскиванием визуальных элементов на дашборде мышью; создание иерархий в данных; применение фильтров; и др.

 

3. Apache Superset в сравнении с Tableau: Аутентификация и авторизация

Безопасность Apache Superset обеспечивается с помощью созданной поверх Flask платформы разработки приложений Flask App Builder (FAB).

К основным обеспечиваемым FAB типам аутентификации относятся:

  1. LDAP
  2. OpenID
  3. Databases
  4. OAuth
  5. REMOTE_USER

Tableau же обладает особенностью, которая отсутствует в Apache Superset – обеспечением аутентификации на разных уровнях, например, на уровне проекта или конкретного дашборда. Это означает, что даже если у вас есть доступ к серверу, вы не сможете получить доступ к некоторым функциям, если не прошли аутентификацию.

Основные поддерживаемые Tableau типы аутентификации это:

  1. Active Directory
  2. OpenID
  3. SAML
  4. OAuth

4. Apache Superset в сравнении с Tableau: Платформа

Tableau работает на разных платформах, таких как:

  1. Desktop
  2. Mobile
  3. Web
  4. Embedded

Наличие различных вариантов реализации Tableau даёт пользователям большое преимущество  – доступ к данным отовсюду в любое время.

В отличие от Tableau Apache Superset может быть развёрнута только на онлайн-сервере или на локальном хостинге. Apache Superset пока не поддерживает мобильные, облачные и встроенные приложения, как это делает Tableau. Конечно, при желании опытные разработчики могут найти способ обойти эту особенность архитектуры и запустить Apache Superset на рабочем столе. Поскольку Apache Superset  более новый, чем Tableau, инструмент на рынке BI, скорее всего, в будущем появятся перечисленные варианты реализации, недоступные на данный момент.

5. Apache Superset в сравнении с Tableau: Цены

Ценообразование Tableau зависит от нужных вам аналитических возможностей , и от выбранного организацией варианта развертывания (локально или в облаке). Также есть возможность докупать необходимые вспомогательные лицензии к существующему плану.

Тарифные планы Tableau представлены в таблице.

 

Вариант

Tableau Creator —

Находите инсайты в данных благодаря мощному набору продуктов, поддерживающих ваши сквозные аналитические процессы

Tableau Explorer —

Изучайте проверенные данные и отвечайте на собственные вопросы быстрее с помощью self-service аналитики

Tableau Viewer —

Взаимодействуйте с дашбордами и визуализациями на безопасной и простой в использовании платформе

Для физ. лиц:

$70 пользователь/мес  | ежегодно

Для компаний:

Развернуть на сервере­­: On-premise или публичное облако

$70 пользователь/мес  | ежегодно

$35 пользователь/мес  | ежегодно

$12 пользователь/мес  | ежегодно

Онлайн: полностью обслуживаемый Tableu

$70 пользователь/мес  | ежегодно

$42 пользователь/мес  | ежегодно

$15 пользователь/мес  | ежегодно

Apache Superset в данном случае обладает значительным преимуществом, т.к. его можно использовать совершенно бесплатно! На этом завершим обсуждение сравнения особенностей Apache Superset и Tableau и опишем их недостатки.

Недостатки Apache Superset

  • Форматы визуализации: Apache Superset поддерживает максимум 30 форматов визуализации.
  • Подключения к источникам данных: Количество источников, к которым подключается Apache Superset не велико.
  • Размещение: Apache Superset работает только на онлайн-сервере или на локальном хостинге, но так как она дорабатывается,  в ближайшем будущем возможны другие варианты размещения системы.

Недостатки Tableau

  • Стоимость: Стоит учитывать, что кроме оплаты пакета, стоимость которого может оказаться неподъёмной для малой организации, придётся оплачивать каждую дополнительную лицензию.
  • Сложность программного обеспечения: Несмотря на низкий порог вхождения для пользователей, Tableau обладает большим количеством функций. При дальнейшей работе с инструментом пользователю может понадобиться более глубокий уровень его понимания, а возможно, даже обучение и сертификация.
  • Нерегулярность Резервного Копирования: Tableau не выполняет регулярное резервное копирование своего программного обеспечения.

Заключение

При выборе инструмента компании нужно учитывать её масштабы, потребности в визуализации и используемые практики работы. Tableau – отличный выбор, если вам важны безопасность и возможность разграничения прав доступа, при условии, что вы готовы потратить денежные средства на BI. Это также полезный инструмент для компании, которая захочет встраивать аналитику на веб-сайты или порталы и предоставлять доступ к дашбордам отдельным лицам для персональной работы.

Apache Superset подойдёт тем, кто готов самостоятельно разбираться, как её устанавливать, и имеет ресурсы, чтобы её на них разместить. Несмотря на некоторые существующие ограничения, нужно учитывать, что Apache Superset находится на стадии разработки и в дальнейшем они ,возможно, будут устранены. Большие преимущества программы: бесплатность и сообщество, участвующее в её развитии.

Все перечисленные факторы важны, но не стоит забывать, что определяющим фактором при выборе программы должны быть рабочая нагрузка и расширяемость.

Если Вас заинтересовала статья, то подписывайтесь на наш блог, в котором мы самостоятельно создаем контент и поэтому новые статьи выходят не чаще одного раза в неделю😊

Форма подписки на статьи:

Насколько интересной была статья?

Кликните на звезду, чтобы оценить статью

Средний рейтинг: 2.7 / 5. Оценок: 3

Оценок еще нет. Оцените, чтобы быть первым

Эксперт Павел Лебедев

Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.

Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.

Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.