dbt cloudのROIについて
はじめに
dbt公式からdbt cloudのROIを説明するウェビナーが公開された。dbt cloudは非常に高額で導入の障壁が高かったので見てみることにした。
https://www.getdbt.com/resources/study-forrester-tei-webinar/
pdfでのレポートも公開されています。
https://www.getdbt.com/resources/study-forrester-tei/
要約
dbt cloud導入の背景
データウェアハウス製品が発達するにしたがって直接SQLを扱って分析するユーザーが増えていわゆる「データのサイロ化」が顕著になった。そんな中、データパイプラインの依存関係やデプロイを一気通貫で行ってくれるdbtが業界のほぼデファクトとなり、一般的に使われるようになった。
dbt cloudを導入した顧客はこれまでよりもはるかに高速にデータの提供や、工数の削減を行うことができるようになった。
TEIについて
実際の価値を測る上ではROIだけでは不十分で、riskやflexibilityを考慮することが必要。
- risk
- 見積もりの正確性
- 見積もりの見直し頻度
- flexibility
- ユーザー増加への対応や、他部署への活用が簡単にできるか
TEI=Total economic impactという指標でdbt cloudの導入価値を測ることにした。
これを測るために以下の5つ手順を設けた。
- Due Diligence: 投資価値の事前調査
- 顧客へのインタビュー
- 財務モデルのフレームワーク
- ケーススタディの作成
- レビュー、総括
TableauやTreasure Dataが同様の分析を行っており日本語のレポートも出しているので、そちらも併せて読むとわかりやすいです。
- https://www.tableau.com/ja-jp/learn/whitepapers/total-economic-impact-report-tableau
- https://www.treasuredata.co.jp/download-forrester-report/
例
上記の企業を例に挙げる。
Benefits
内訳は以下
- Increased data engineer productivity
- 30%リリース速度が向上
- 11,000時間工数削減
- データエンジニア間でのデータの信頼度の向上
- Avoided cost of poor data quality rework
- データ調査にかける工数が60%減少
- Data analyst time saving
- 1日でデータ分析にかける時間が30分から45分削減
(セマンティックレイヤーの活用など?)
- 1日でデータ分析にかける時間が30分から45分削減
- Avoided data trasformation costs
- 移行前より20%のコスト削減
Cost
リスク調整済みのコストは上記。
flexibility
dbt cloudは幅広いプロジェクトで活用可能。
- 経理部門: $18 millionの過剰なコストが発生していることを発見した
- マーケティング部門: チャーン分析によって顧客の離脱が5%減少した
Financial summary
ROI, NPVは上記の通り。
おわりに
TableauやTrasure DataもTEIの分析をしていたので、割と一般的な分析なのかと参考になりました。ただdbt coreとの比較については言及されなかったので、地道にインフラコストや運用工数を出しながら比較していくしかないのかという感覚です。
Very great post. I simply stumbled upon your blog and wished to say that
I've really enjoyed browsing your blog posts. In any case I'll
be subscribing on your feed and I am hoping you write again soon!