BI системы: термины и их значения

В данной статье мы собрали наиболее часто встречаемые термины, используемые при обсуждении систем бизнес аналитики BI и описание их значений.

Виджет (widget)

Список терминов:

Виджетом называют элемент, который является визуальным отображением данных и основным элементом при построении дашбордов. Виджеты подбираются  зависимости от цели визуализации конкретных показателей: 

  • необходмости показать текущий тренд,
  • визуального сравнения  показатели.

Также при выборе виджета следует учитывать количество измерений (элементов), в разрезе которых требуется отобразить значения показателей.

Примеры виджетов изображены ниже:

Дашборд (dashboard) 

Или также встречается название «аналитическая панель»— графическое отображение (результат процесса визуализации) данных, являющееся основным инструментом для принятия решений.

Является визуальным отображением работы BI системы, видимым пользователю. Позволяет пользователям упростить процесс принятия решений за счет представления данных в виде визуальных элементов— виджетов. 

Элементы, из которых строятся дашбоды, называются виджетами. Дашборды обладают, как правило, фильтрами, например, Дата, Регион, Менеджер и прочие для того, чтобы можно было оперативно отфильтровать данные по интересующему измерению и увидеть нужное значение в соответствии с выбором.

Существует большое количество виджетов. Наиболее используемыми являются: 

  • круговая диаграмма («пирог», «пончик», pie chart), используемая для отображения доли какого-либо показателя от общего значения 

Как правило, дашборды отображают срез по деятельности в каком-либо направлении:

  • продажи,
  • маркетинг,
  • финансы,
  • HR

Примеры дашбордов можно увидеть ниже:

Подробнее про то, что такое дашборд, его назначение и способам его разработки вы можете узнать из нашей статьи

Apache Superset

Apache Superset — это веб-приложение для бизнес-аналитики с открытым исходным кодом (Open source), которое позволяет пользователям исследовать, визуализировать и обмениваться результатами исследования данных, полученных из различных источников.

Поддерживает широкий спектр источников данных, включая базы данных SQL, базы данных NoSQL и облачные сервисы хранения данных. Apache Superset разработан с учетом высокой масштабируемости и настраиваемости, что делает его идеальным инструментом для крупных организаций с разнообразными потребностями в данных.

Он построен на базе Flask и React.js и лицензирован под Apache License 2.0.

Подробнее про функциональные возможности данной BI системы можно прочитать в нашей статье о Бесплатных BI системах

Apache Airflow

Apache Airflow — это оркестратор с открытым исходным кодом (Open source). 

Данный оркестратор выполняет следующие функции:

  • создание, 
  • выполнение,
  • мониторинг,
  • оркестровка потоков операций по обработке данных (пайплайнов).

Нередко Airflow характеризуют как ETL инструмент, что по своей сути, является не совсем верной классификацией.

Он построен на базе нескольких технологий, включая Python, Apache Thrift, SQLAlchemy, Jinja2, Flask и Celery.

Подробнее про функциональные возможности данной BI системы можно прочитать в нашей статье: Обзор Apache Airflow

BI системы

Системы бизнес аналитики BI (Business intelligence) системы, целью внедрения которой является создание эффективных инструментов для принятия решений.

Что мы подразумеваем под термином «эффективный инструмент для принятия решений»

Система содержит в себе данные, которые генерят различные подразделения я внутри компании, такие как, продажи, маркетинг, финансы и иные, относящиеся к функционированию компании.

Система выполняет следующие функции:

  • объединяет в себе имеющиеся данные,
  • трансформирует их требуемым образом,
  • представляет данные в виде дашбордов (аналитических панелей), которые упрощают процесс принятий решений в

трансформирует их нужным способом и представляет в 

Data driven подход

Это методология, которая основывается на анализе и использовании данных для принятия решений. Data driven подход позволяет компаниям оптимизировать свою деятельность и достичь более эффективных результатов.

Он позволяет собирать, анализировать и интерпретировать большие объемы данных для выявления тенденций, паттернов и закономерностей. Это позволяет компаниям принимать обоснованные решения, основанные на фактах и конкретных данных, а не на предположениях или интуиции.

В целом, data driven подход — это стратегия, которая позволяет компаниям принимать обоснованные решения на основе данных. Он помогает компаниям быть более успешными и конкурентоспособными на рынке.

Data warehouse (DWH)

Data Warehouse: это специальная система, которая используется для хранения и управления большими объемами данных. Data warehouse представляет собой централизованное хранилище, где данные из различных источников собираются, трансформируются и загружаются для дальнейшего анализа и использования. Данные организуются в логическую структуру, что упрощает доступ к информации и повышает ее ценность.

DWH это важный инструмент для современных компаний, позволяющий им эффективно управлять и анализировать большие объемы данных. Благодаря data warehouse, компании могут получить полную картину своей деятельности и принимать обоснованные решения на основе данных, то есть, перейти к data driven подходу.

По своей сути, это хранилище, где  Data warehouse позволяет компаниям агрегировать данные из различных источников и создавать отчеты, дашборды в BI системах и аналитические модели на основе этих данных.

Это также инструмент для оптимизации работы с данными. Благодаря ему компании могут улучшить процессы извлечения, трансформации и загрузки данных, сократить время и ресурсы, затрачиваемые на обработку информации.
Data warehouse это также инструмент для улучшения качества данных. Благодаря data warehouse, компании могут проводить очистку и стандартизацию информации, удалять дубликаты, исправлять ошибки и обеспечивать единство данных перед их загрузкой в систему.

DAX

DAX (Data Analysis Expressions)  — язык, созданный специально для работы с моделями данных с помощью формул и выражений. Данный язык используется в некоторых продуктах от Майкрософт, в частности, если говорить про системы бизнес-аналитики BI, то в системе Power BI. 

DAX позволяет аналитикам и разработчикам создавать мощные и гибкие выражения для анализа и моделирования данных.

Он является неотъемлемой частью Power BI. DAX позволяет создавать вычисляемые столбцы, измерения, фильтры, агрегированные меры и другие объекты, необходимые для создания сложных моделей данных и отчетов.

Удобство языка DAX заключается в его простоте и интуитивно понятном синтаксисе. Благодаря этому, даже новички могут легко освоить DAX и начать создавать выражения для анализа данных. DAX также поддерживает множество встроенных функций, которые обеспечивают широкий спектр возможностей для проведения сложных вычислений и манипулирования данными. Кроме того, DAX позволяет использовать контекстные вычисления, что способствует более точным и гибким аналитическим расчетам.

Использование языка DAX предоставляет аналитикам множество возможностей. С его помощью можно создавать сложные формулы и вычисляемые столбцы, агрегировать данные, фильтровать их, а также проводить аналитические исследования и моделирование данных. DAX предоставляет функции для работы с датами, временем, текстом, числами и множеством других типов данных. Это позволяет аналитикам выполнять широкий спектр операций, начиная от простых арифметических вычислений до сложных статистических анализов.

Среди российских BI систем на текущий момент язык DAX поддерживает только BI платформа Visiology. Данная функциональность рассматривается пользователями, особенно которые мигрируют с Power BI, как крайне весомый фактор в пользу Визиолоджи. 

ETL

ETL (Extract, Transform, Load) — это процесс, который используется для извлечения данных из различных источников, их трансформации и загрузки в систему бизнес аналитики BI.

ETL процессы играют важную роль в современном бизнесе, позволяя компаниям эффективно управлять и анализировать большие объемы данных.

Cистемы ETL служат для автоматизации и оптимизации процесса извлечения, трансформации и загрузки данных. Они позволяют компаниям собирать данные из различных источников, таких как базы данных, файлы Excel, веб-страницы и другие, и преобразовывать их в нужный формат для дальнейшей загрузки в целевую систему BI.

Процессы ETL помогают компаниям обеспечить качество данных путем очистки и стандартизации информации. Они позволяют удалить дубликаты, исправить ошибки и привести данные к единому формату перед загрузкой в целевую систему.

ETL системы также обеспечивают автоматизацию процесса загрузки данных, что снижает риск ошибок и повышает эффективность работы. Они позволяют компаниям управлять большими объемами данных и обеспечивать их своевременную загрузку в целевую систему.

Насколько интересной была статья?

Кликните на звезду, чтобы оценить статью

Средний рейтинг: 0 / 5. Оценок: 0

Оценок еще нет. Оцените, чтобы быть первым

Эксперт Павел Лебедев

Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.

Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.

Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.