Update FAQ_zh.md

This commit is contained in:
Junyang Lin
2023-08-30 17:41:41 +08:00
committed by GitHub
parent bcb14fb2fd
commit c9583eee6b

View File

@@ -32,7 +32,7 @@ flash attention是一个用于加速模型训练推理的可选项且仅适
#### 我没有GPU只用CPU运行CLI demo可以吗 #### 我没有GPU只用CPU运行CLI demo可以吗
可以的,运行`python cli_demo.py --cpu_only`命令即可将模型读取到CPU并使用CPU进行推理。 可以的,运行`python cli_demo.py --cpu-only`命令即可将模型读取到CPU并使用CPU进行推理。
#### Qwen支持流式推理吗 #### Qwen支持流式推理吗