mirror of
https://github.com/QwenLM/Qwen.git
synced 2026-05-20 16:35:47 +08:00
Update FAQ_ja.md
This commit is contained in:
@@ -35,7 +35,7 @@ Flash attention は、トレーニングと推論を加速するオプション
|
|||||||
|
|
||||||
#### CPU のみを使うことはできますか?
|
#### CPU のみを使うことはできますか?
|
||||||
|
|
||||||
はい、`python cli_demo.py --cpu_only` を実行すると、CPU のみでモデルと推論をロードします。
|
はい、`python cli_demo.py --cpu-only` を実行すると、CPU のみでモデルと推論をロードします。
|
||||||
|
|
||||||
#### Qwen はストリーミングに対応していますか?
|
#### Qwen はストリーミングに対応していますか?
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user