mirror of
https://github.com/QwenLM/Qwen.git
synced 2026-05-20 08:25:47 +08:00
add french readme
This commit is contained in:
11
README_CN.md
11
README_CN.md
@@ -1,5 +1,5 @@
|
||||
<p align="left">
|
||||
中文</a>  |  <a href="README.md">English</a>  |  <a href="README_JA.md">日本語</a>
|
||||
中文</a>  |  <a href="README.md">English</a>  |  <a href="README_JA.md">日本語</a> |  <a href="README_FR.md">Français</a>
|
||||
</p>
|
||||
<br><br>
|
||||
|
||||
@@ -9,7 +9,7 @@
|
||||
<br>
|
||||
|
||||
<p align="center">
|
||||
🤗 <a href="https://huggingface.co/Qwen">Hugging Face</a>   |   🤖 <a href="https://modelscope.cn/organization/qwen">魔搭社区</a>   |    📑 <a href="https://arxiv.org/abs/2309.16609">论文</a>    |   🖥️ <a href="https://modelscope.cn/studios/qwen/Qwen-14B-Chat-Demo/summary">Demo</a>
|
||||
🤗 <a href="https://huggingface.co/Qwen">Hugging Face</a>   |   🤖 <a href="https://modelscope.cn/organization/qwen">魔搭社区</a>   |    📑 <a href="https://arxiv.org/abs/2309.16609">论文</a>    |   🖥️ <a href="https://modelscope.cn/studios/qwen/Qwen-14B-Chat-Demo/summary">Demo</a>
|
||||
<br>
|
||||
<a href="assets/wechat.png">微信</a>   |    钉钉    |   <a href="https://discord.gg/z3GAxXZ9Ce">Discord</a>  
|
||||
</p>
|
||||
@@ -27,7 +27,8 @@
|
||||
在这个项目中,你可以了解到以下内容
|
||||
|
||||
* 快速上手Qwen-Chat教程,玩转大模型推理
|
||||
* 量化模型相关细节,包括用法、显存占用、推理性能等。这部分还提供了和非量化模型的对比。
|
||||
* 量化模型相关细节,包括GPTQ和KV cache量化
|
||||
* 推理性能数据,包括推理速度和显存占用。
|
||||
* 微调的教程,帮你实现全参数微调、LoRA以及Q-LoRA
|
||||
* 搭建Demo的方法,包括WebUI和CLI Demo
|
||||
* 搭建API的方法,我们提供的示例为OpenAI风格的API
|
||||
@@ -332,7 +333,7 @@ response, history = model.chat(tokenizer, "Hi", history=None)
|
||||
| Qwen-7B-Chat (Int8) | 55.4 | 59.4 | 48.3 | 34.8 |
|
||||
| Qwen-7B-Chat (Int4) | 55.1 | 59.2 | 49.7 | 29.9 |
|
||||
| Qwen-14B-Chat (BF16) | 64.6 | 69.8 | 60.1 | 43.9 |
|
||||
| Qwen-14B-Chat (Int8) | 63.6 | 68.6 | 60.0 | 48.2 |
|
||||
| Qwen-14B-Chat (Int8) | 63.6 | 68.6 | 60.0 | 48.2 |
|
||||
| Qwen-14B-Chat (Int4) | 63.3 | 69.0 | 59.8 | 45.7 |
|
||||
<br>
|
||||
|
||||
@@ -543,7 +544,7 @@ model = AutoModelForCausalLM.from_pretrained(
|
||||
sh finetune/finetune_ds.sh
|
||||
```
|
||||
|
||||
尤其注意,你需要在脚本中指定正确的模型名称或路径、数据路径、以及模型输出的文件夹路径。在这个脚本中我们使用了DeepSpeed ZeRO 3。如果你想修改这个配置,可以删除掉`--deepspeed`这个输入或者自行根据需求修改DeepSpeed配置json文件。此外,我们支持混合精度训练,因此你可以设置`--bf16 True`或者`--fp16 True`。经验上,如果你的机器支持bf16,我们建议使用bf16,这样可以和我们的预训练和对齐训练保持一致,这也是为什么我们把默认配置设为它的原因。
|
||||
尤其注意,你需要在脚本中指定正确的模型名称或路径、数据路径、以及模型输出的文件夹路径。在这个脚本中我们使用了DeepSpeed ZeRO 3。如果你想修改这个配置,可以删除掉`--deepspeed`这个输入或者自行根据需求修改DeepSpeed配置json文件。此外,我们支持混合精度训练,因此你可以设置`--bf16 True`或者`--fp16 True`。在使用fp16时,请使用DeepSpeed支持混合精度训练。经验上,如果你的机器支持bf16,我们建议使用bf16,这样可以和我们的预训练和对齐训练保持一致,这也是为什么我们把默认配置设为它的原因。
|
||||
|
||||
运行LoRA的方法类似全参数微调。但在开始前,请确保已经安装`peft`代码库。另外,记住要设置正确的模型、数据和输出路径。我们建议你为模型路径使用绝对路径。这是因为LoRA仅存储adapter部分参数,而adapter配置json文件记录了预训练模型的路径,用于读取预训练模型权重。同样,你可以设置bf16或者fp16。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user