본문 바로가기

Big Data

Druid - Use Cases

아파치 드루이드는 실시간 성능이 중요한 시스템에서 위력을 발휘하는 데이터베이스이다.

드루이드는 분석용 어플리케이션의 GUI 로 훌륭하게 작동하며 fast aggregation 이 필요한 backend 시스템에도 적합하다. 또한 드루이드는 event-oriented 한 data 에 훌륭하게 적용된다.

Use Cases

드루이드의 일반적인 응용 분야는 다음과 같다.

  • Clickstream analytics (web and mobile analytics)
  • Risk/fraud analysis
  • Network telemetry analytics (network performance monitoring)
  • Server metrics storage
  • Supply chain analytics (manufacturing metrics)
  • Application performance metrics
  • Business intelligence / OLAP

OLAP and business intelligence

드루이는 BI use case 에 흔히 사용된다. Presto 나 Hive 와 같은 SQL-on-Hadoop engines 과는 다르게 Druid는 높은 동시성과 1 초 미만의 쿼리를 위해 설계되어 UI를 통한 interactive 데이터 탐색을 지원한다.

이러한 점이 일반적으로 druid 가 진정으로 interactive 한 visual analytics 에 더 적합하게 한다.

만약 당신이 user-facing application 이 필요하고 drill-down queries 를 제공하려 한다면 드루이드는 아주 최적의 선택이다.

application 은 druid 의 API 를 이용해 개발하거나 드루이드위에서 동작하는 shelf applications 을 활용할 수 있다.

User activity and behavior

드루이드는 clickstreams, viewstreams, activity streams 에 자주 사용된다. 구체적인 사용 사례에는 특사용자 참여 측정, 제품 릴리스에 대한 A / B 테스트 데이터 추적, 사용 패턴 이해가 포함된다.

드루이드는 distinct counts 를 통해 user metrics 를 측정할 수 있다. (exactly or approximately 두가지 알고리즘을 모두 제공한다).

이것은 daily active users 와 같은 것들이 exactly or approximately 하게 측정될 수 있다는 것을 의미한다.

게다가 드루이드는 funnel analysis 를 위해 사용될 수 있으며 한 작업을 수행했지만 다른 작업을 수행하지 않은 사용자 수를 측정 할 수 있습니다. 이러한 분석은 제품에 대한 사용자 등록을 추적하는 데 유용하다.

'Big Data' 카테고리의 다른 글

[Druid][Tutorial] Writing an ingestion spec  (0) 2020.11.24
Druid - Design  (0) 2020.11.10
Druid - Technology Overview  (0) 2020.10.19