Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ソースコードから理解するPreloadとJITの話/preload_and_jit
Search
Ryo Tomidokoro
December 12, 2020
Programming
1
2.5k
ソースコードから理解するPreloadとJITの話/preload_and_jit
preloadとJITの話をなるべくわかり易く、それでいて深く書いてみました。
Ryo Tomidokoro
December 12, 2020
Tweet
Share
More Decks by Ryo Tomidokoro
See All by Ryo Tomidokoro
ADRを一年運用してみた/adr_after_a_year
hanhan1978
7
2.8k
B+木入門:PHPで理解する データベースインデックスの仕組み/b-plus-tree-101
hanhan1978
5
3.4k
ADRを一年運用してみた/our_story_about_adr
hanhan1978
4
1.5k
PHPで学ぶ Session の基本と応用 / web-app-session-101-2024
hanhan1978
12
4.9k
レガシー回避のPHP開発術/avoid_php_legacy
hanhan1978
14
11k
Laravel Collectionの計算量を調べてみた2023/laravel_collection_time_complexity_2023
hanhan1978
0
930
PHP で学ぶ Cache の距離の話 / study_cache_with_php
hanhan1978
7
1.8k
Laravel を低速化する技術 / how to slow laravel
hanhan1978
1
3.1k
俺の Laravel がこんなに速いわけがない! / My Laravel Too Fast
hanhan1978
0
1.7k
Other Decks in Programming
See All in Programming
哲学史とモデリング
tanakahisateru
3
440
TypeScript Custom GitHub Action Development Tips
peaceiris
5
850
TypeScriptとGraphQLで実現する 型安全なAPI実装 / TSKaigi 2024
hokaccha
5
2.9k
slow types ってなんだろう?
karad
0
210
Embedding it into Ruby code
soutaro
2
430
Dev ContainersとTestcontainers
bells17
3
100
Effectで作る堅牢でスケーラブルなAPIゲートウェイ / Robust and Scalable API Gateway Built on Effect
yasaichi
7
1.2k
TypeScriptで使いやすいOpenAPIの書き方
yukimochi_dwango
1
960
freeeのエンジニアが 就活で出そうな コーディングテストを 解説してみる
freee
1
180
TypeScript 関数型スタイルでバックエンド開発のリアル
naoya
49
16k
RuboCop: LSP and Prism
koic
1
110
AppRouter Panel Talk
yosuke_furukawa
PRO
1
530
Featured
See All Featured
Side Projects
sachag
451
41k
A better future with KSS
kneath
231
16k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
21
2k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
228
16k
Reflections from 52 weeks, 52 projects
jeffersonlam
345
19k
The Brand Is Dead. Long Live the Brand.
mthomps
49
31k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
126
32k
Bash Introduction
62gerente
605
210k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
From Idea to $5000 a Month in 5 Months
shpigford
377
45k
Imperfection Machines: The Place of Print at Facebook
scottboms
261
12k
How to Ace a Technical Interview
jacobian
273
22k
Transcript
@hanhan1978 ソースコードから理解する PreloadとJITの話 PHP Conference Japan 2020/12/12
@hanhan1978 • 富所 亮 • 職業 ◦ Webアプリケーションエンジニア ◦ 雑用係
• ブログ ◦ https://blog.hanhans.net • Yokohama North AM ◦ https://anchor.fm/yokohama-north-am
興味のある方は... ※気が向いた時にやってます ... https://shadow-php.connpass.com/
秒でGDBデバッグ https://github.com/hanhan1978/shadow-php/wiki
本日のテーマ preloadとjitの肌感を掴む • 謎の技術にせず、仕組みから理解 • どれくらい速度向上するのか • 本番環境での採用是非
PHP高速化の歴史
PHPはスクリプト言語 実行の大まかな流れ
PHPはスクリプト言語 実行の大まかな流れ ここで時間がかかる
PHPerが行ってきた解決策
中間コードキャッシュ コンパイル結果(OPCode)をメモリにキャッシュ
歴代の中間コードキャッシュ XCache 〜PHP5.6 eAccelarator 〜PHP5.6 Alternative PHP Cache (APC) PHP5.4
Zend Opcache PHP5.5〜 ※これらのツールを同居させると ShareMemory戦国時代になりSegFault
OPCacheがデファクトスタンダード PHP5.5以降は一択 そして、PHP7.4以降からOPCacheにさらなる高速化の仕組みが 導入されるようになった....ここから本題
余談1 稀によく見るうっかりさん。OPCache入ってない ※php -v ですぐ確認できるので、心当たりのある方は確認を
※OPcacheが入ってなくて良いことは一個もないです
PHPスクリプト実行の詳細
PHPはスクリプト言語 • 実行時にコンパイル • コンパイル&実行を繰返す
例えば
PHP実行の流れ
None
実行の詳細
None
None
中間コードキャッシュに よってコンパイルの過程 が省略される
具体例
ファイル構成
index.php
autoload.php
A.php
B.php
実行すると
実行すると autoloaderが2回呼び出されている
実行の流れ
4回のコンパイル
OPCacheが解決するもの 4回分のコンパイルがキャッシュで解決
計測
OPCache − ◯ Req / Sec 111.55 680.42 ※OPCacheの有効化によって、処理速度は約 6倍
Laravelの30秒ベンチマーク
高速化技術が達成すること 1. OPCache >> 2. OPCache preload >> 3. OPCache
JIT >> ??? ??? ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> 3.
OPCache JIT >> ??? ???
OPCache preloadとは?
PHP7.4から追加 https://wiki.php.net/rfc/preload
• OPCacheの機能追加として提案 • サーバー起動時に指定ファイルをコンパイル して、メモリに読込 ※一見すると、中間コードキャッシュと同じことをしているように見える
具体例
ファイル構成
preload.php
php.ini
実行すると
実行すると Class Aはautoloadされてない!!
実行の流れ
3回のコンパイル
• autoloadが省略される • preload以外のファイルは opcache.validate_timestamp=0と同じ挙動 • 直接のrequireはpreloadが活用されない
preloadソース v7.4.3
ext/opcache/ZendAccelarator.c - SAPI起動時に L4200 preload_load() - globalなデータ領域にpreloadしたクラス、ファイルの情報を登録 する - opcodes実行時のコンパイルに使われるのは、L1914
persistent_compile_file。これはpreloadの有無に依らない
Zend/zend_execute_API.c - L1419 zend_fetch_class_by_name が未解決のクラス名に対して コールされる - zend_hash_findでコンパイル済みのクラスが発見されれば、それを 使う(preload) -
それ以外は、autoloaderを使ってクラスの解決が行われて、ファイル が見つかればコンパイルされる ※要するにpreloadされるとautoloaderまで処理がいかずに解決できる
計測
Laravelの30秒ベンチマーク OPCache − ◯ ◯ Preload − − ◯ Req
/ Sec 111.55 680.42 774.14 ※preload有効化によって、処理速度は約 14%向上
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> 3.
OPCache JIT >> ??? ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> ???
余談 Windows用PHPのpreload機能は7.4.2の時点で機能削除 https://www.php.net/manual/en/opcache.preloading.php
OPCache JITとは?
PHP8.0から追加 https://wiki.php.net/rfc/jit
ZendVMで実行するのではなく Native Codeを実行する
• 機械語実行により処理速度が最適化 • 同様のことはpcre-jitやJS等でもおなじみ
実行の詳細
None
None
OPCodeをさらに機械語に変換 CPUで直接実行!!
• コード実行が最適化 • JITコンパイルのオーバーヘッドは実行速度で 補填
JITソース v8.0.0
OPCacheが主に関わってくるソースコード JIT関連はopcache/jitに固まっているので 分かりやすい。
opcodeをx86のアセンブラに変換している zend_jit_x86.c
ext/opcache/jit/zend_jit.c - zend_jit_op_array において泥臭い変換処理が行われている - アーキテクチャ依存のコード変換なので未対応だと動作しない - LuaJIT由来のDynAsmを利用
JIT化される単位 - zend_jit_op_array はファイル毎に呼び出し - クラス単位、関数単位でopcodeの最適化が行われて、関数のIOを合わ せた形でZendVMの主処理と繋ぎ合わされる - 1ファイル1関数に全部の処理を入れたら、効果的に効きそう
計測
Laravelの30秒ベンチマーク OPCache − ◯ ◯ Preload − − ◯ Req
/ Sec 111.55 680.42 774.14 Req / Sec (JIT) − 696.57 812.93 ※JIT有効化によって、処理速度は約 2.5〜5%向上
モンテカルロ法を計測
円周率計算のベンチマーク OPCache − ◯ Sec 9.74 8.96 Sec (JIT) −
5.20 ※JIT有効化によって、処理速度は約 42%向上 100,000,000回試行の処理時間
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> ???
高速化技術が達成すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> コード実行の最適化
JITの現状
• https://bugs.php.net/search.php?cmd=display&packa ge_name[]=opcache • RedditのPHP系板 • https://www2.slideshare.net/nikita_ppv/justintime-co mpiler-in-php-8 情報キャッチアップ
使用上の注意
• 内部の実行パスが変わる • 開発も同じ設定にするのが吉 • ファイル更新でopcache_clearとか...
phpunitで使うには これを設定しないと、コマンドライン実行時にopcache が動かない。
まとめ
高速化技術が解決すること 1. OPCache >> コンパイル回数の軽減 2. OPCache preload >> autoloadの軽減
3. OPCache JIT >> コード実行の最適化
仕組みを理解 適切なアプリケーションに適用 コレ大事!!
参考1 https://speakerdeck.com/hanhan1978/web-application-tuning-guildline
参考2 https://gist.github.com/hellerbarde/2843375 Network IOはメモリアク セスの5万倍遅い
リアルなウェブアプリのボトルネックは、大半 がDBアクセス CPU負荷の数%は全体のボトルネックでは 微々たるもの
本番投入はオススメしづらい... ISUCON用機能なのでは...