Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SPCS で実現する dbt All in Snowflake の世界
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
あれ
March 02, 2024
Technology
3
860
SPCS で実現する dbt All in Snowflake の世界
2024/03/01「
Snowpark Container Servicesで解き放つ!データアプリケーションの魔法
」発表スライドです。
あれ
March 02, 2024
Tweet
Share
More Decks by あれ
See All by あれ
Snowflake Openflow は 「難しい」と思っているあなたへ ~あらゆるデータを「簡単に」連携できる理由、お見せします~
__allllllllez__
1
400
TROCCO 2025年の進化をデモで振り返る
__allllllllez__
0
460
今日から始められる!SPCSのきほん
__allllllllez__
0
100
サッカーとデータ基盤の話
__allllllllez__
0
280
今年も進化した Snowpark Container Services の話をしたい
__allllllllez__
0
20
Backlog ユーザー棚卸しRTA、多分これが一番早いと思います
__allllllllez__
1
700
Python フレンドリーなクラウドデータプラットフォーム Snowflake のお話 ~ データ分析基盤のアレもコレも Python でやってみよう
__allllllllez__
0
130
5分でわかる! Snowpark Container Service
__allllllllez__
0
1.2k
Python と Snowflake はズッ友だょ!~ Snowflake の Python 関連機能をふりかえる ~
__allllllllez__
2
420
Other Decks in Technology
See All in Technology
今日から始めるAmazon Bedrock AgentCore
har1101
4
420
こんなところでも(地味に)活躍するImage Modeさんを知ってるかい?- Image Mode for OpenShift -
tsukaman
1
170
Agent Skils
dip_tech
PRO
0
140
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
580
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
har1101
0
340
Why Organizations Fail: ノーベル経済学賞「国家はなぜ衰退するのか」から考えるアジャイル組織論
kawaguti
PRO
1
220
登壇駆動学習のすすめ — CfPのネタの見つけ方と書くときに意識していること
bicstone
3
130
20260208_第66回 コンピュータビジョン勉強会
keiichiito1978
0
200
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
120
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
230
Red Hat OpenStack Services on OpenShift
tamemiya
0
140
20260204_Midosuji_Tech
takuyay0ne
1
160
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Designing Powerful Visuals for Engaging Learning
tmiket
0
240
How GitHub (no longer) Works
holman
316
140k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
230
Context Engineering - Making Every Token Count
addyosmani
9
670
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
How to build a perfect <img>
jonoalderson
1
4.9k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
350
Into the Great Unknown - MozCon
thekraken
40
2.3k
Accessibility Awareness
sabderemane
0
58
Designing Experiences People Love
moore
144
24k
Become a Pro
speakerdeck
PRO
31
5.8k
Transcript
SPCS で実現する dbt All in Snowflake の世界 2024/03/01 あれ(@__allllllllez__)
© 2024 DATUM STUDIO Co. Ltd. 1 自己紹介 【名前】 あれ(@__allllllllez__)
広報さんにカッコよく撮影してもらってウッキウキ→ 【所属】 DATUM STUDIO株式会社 データエンジニアリング本部 データエンジニア部 2024 Data Superheroes
© 2024 DATUM STUDIO Co. Ltd. 2 コンテンツ • Snowpark
Container Services(SPCS)って何? ~SPCS ざっくり概要~ • SPCSについてもうちょっと詳しく ~機能周りのアレコレ~ • SPCS使ってみた ~dbt 全部乗せ~
© 2024 DATUM STUDIO Co. Ltd. Snowpark Container Services (SPCS)って何?
© 2024 DATUM STUDIO Co. Ltd. 4 Snowpark Container Services
(SPCS)って何? • コンテナ in Snowflake • Snowflakeのデータベースやステージにア クセス可能 • アプリケーションでSnowflakeのデータを扱 うために、データをSnowflake外に出す必 要はない • カンタン操作 • アプリケーションイメージのアップロードは Docker 等で可能 • サービス実行などの操作も、SQLなどのイ ンタフェースでOK • フルマネージド • クラスターやノードの管理は不要 • オートスケール • こんなことができる • 任意の言語で作成したアプリケーションを Snowflakeに持ち込める • 長時間実行可能 Snowflake 内でコンテナ化アプリケーションを容易にデプロイ・管理・スケーリン グするために設計されたフルマネージドコンテナサービス https://www.snowflake.com/blog/snowpark-container-services-deploy-genai-full-stack-apps/
© 2024 DATUM STUDIO Co. Ltd. 5 Snowpark Container Services
(SPCS)って何? つまり、 こういうこと データウェアハウス データインジェスト データ変換フレームワーク データカタログ AI/MLプラットフォーム ビジネスインテリジェンス 分析環境 ワークフローエンジン お好きな言語の データアプリケーション
© 2024 DATUM STUDIO Co. Ltd. 6 Snowpark Container Services
(SPCS)って何? つまり、 こういうこと データウェアハウス データインジェスト データ変換フレームワーク データカタログ AI/MLプラットフォーム ビジネスインテリジェンス 分析環境 ワークフローエンジン お好きな言語の データアプリケーション ※実は動かせないもの あったらすまんな
© 2024 DATUM STUDIO Co. Ltd. Snowpark Container Services だいたいわかった
© 2024 DATUM STUDIO Co. Ltd. もうちょっと詳しく
© 2024 DATUM STUDIO Co. Ltd. 9 SPCSについてもうちょっと詳しく SPCS を構成する主な要素は、イメージレジストリ・コンピューティングプール・
サービス/ジョブの3つ イメージ レジストリ アプリケーション イメージの保存先 コンピューティング プール ジョブ/サービスを実行する 仮想マシン ノード コレクション 継続しない アプリケーション (現在 PrPr) 継続して稼働する アプリケーション サービスで定義した 処理を呼び出すUDF ジョブ サービス関数 サービス 仕様 yaml コンテナの設定 コマンドに直接書いてもいい push インタフェース インタフェース(SQL・CLIなど)操作 pull 作成 ステージにput コマンド 操作
© 2024 DATUM STUDIO Co. Ltd. 10 SPCSについてもうちょっと詳しく SPCSのコスト要因は、主にストレージ・コンピューティングプール・データ転送 ✓
イメージレジストリ ✓ ログ(イベントテーブルに書き出したログ) ✓ ボリューム(ステージをマウントした場合) ストレージ コンピューティングプール データ転送 ✓ インスタンス ファミリータイプ xノード数 x 実行時間 ✓ ファミリータイプ別性能一覧 → CREATE COMPUTE POOL ✓ 消費クレジット一覧 → CreditConsumptionTable.pdf ✓ Ingress(外部から Snowflake へのデータの移動) ✓ Egress(Snowflake から外部へのデータの移動) Koreedaさんの記事にあるコンテナ費用まとめが一番わかりやすいです
© 2024 DATUM STUDIO Co. Ltd. 11 SPCSについてもうちょっと詳しく コンピューティングプール・データ転送のコストは、Snowsight「Admin」> 「Cost
Management」で確認が可能
© 2024 DATUM STUDIO Co. Ltd. 12 SPCSについてもうちょっと詳しく コンテナに関する情報はSQLで取得可能。また、SQL以外のインターフェースも開 発が進んでいる
ステータスとログ インタフェース ✓コンピュートプールの状態、サービスのログなどは SQL コマンドで確認が可能 ✓ 現時点ではSQLでSPCS構成オブジェクトの操作が可能 ✓ SnowCLI でも操作可能になるはず!(現在 PrPr)
© 2024 DATUM STUDIO Co. Ltd. Snowpark Container Services 完全に理解した
© 2024 DATUM STUDIO Co. Ltd. では実際に使ってみましょう
© 2024 DATUM STUDIO Co. Ltd. お題はこちら
© 2024 DATUM STUDIO Co. Ltd. in
© 2024 DATUM STUDIO Co. Ltd. 全部乗せ
© 2024 DATUM STUDIO Co. Ltd. 18 dbt ALL in
Snowflake ざっくりこんな感じの構成 イメージ レジストリ アプリケーション イメージの保存先 コンピューティングプール dbt run dbt test dbt docs push インタフェース pull 作成 コマンド 操作 アクセス サービス ジョブ ステージ dbt プロジェクト 配置 マウント テスト実行 モデル作成
© 2024 DATUM STUDIO Co. Ltd. 19 dbt ALL in
Snowflake • コンテナが生存し続ける必要がないので、ジョブ(PrPr)で実行する まずは dbt debug で疎通確認 • ログで All Check Passed! を確認 (中略) ※Oauth トークンを使用した接続は(現状)不可、 ネットワークルールと外部アクセス統合が必要
© 2024 DATUM STUDIO Co. Ltd. 20 dbt ALL in
Snowflake • これも生存し続ける必要がないのでジョブ(PrPr)で実行する dbt compile でステージに書き込ませてみる ファイルできてる!
© 2024 DATUM STUDIO Co. Ltd. 21 dbt ALL in
Snowflake dbt seed と dbt run でデータを作っていく • これもジョブ(PrPr)で実行する • まずは seed • • 続けて run テーブルできてる! ※使用データは Building a Kimball dimensional model with dbt でおなじみ dbt-dimensional-modelling/adventureworks
© 2024 DATUM STUDIO Co. Ltd. 22 dbt ALL in
Snowflake 最後に dbt docs でドキュメント作成&SPCSでホスティングしてみる • 継続起動してほしいので、サービスとして実行 • サービス作成が成功したら、しばし待ってから、URLを確認
© 2024 DATUM STUDIO Co. Ltd. 23 dbt ALL in
Snowflake SPCS サービスへのアクセスは、Snowflake の認証により可能になる(Snowflake Oauth)
© 2024 DATUM STUDIO Co. Ltd. 24 dbt ALL in
Snowflake Snowflake で普通に dbt docs が閲覧できます
© 2024 DATUM STUDIO Co. Ltd. in でした
© 2024 DATUM STUDIO Co. Ltd. Snowpark Container Services めっちゃ楽しい
© 2024 DATUM STUDIO Co. Ltd. だいたい何でもできる 無限の可能性がある 今後のアップデートも非常に楽しみ
© 2024 DATUM STUDIO Co. Ltd. おしまい