Merge branch 'main' into update_ja-docs

2026-05-20 16:35:47 +08:00 · 2023-08-30 17:43:51 +08:00
parent def2071cf8 c9583eee6b
commit 45cfb93be4
7 changed files with 629 additions and 115 deletions
--- a/README_JA.md
+++ b/README_JA.md
@@ -328,7 +328,7 @@ openai.api_key = "none"

 # ストリーミングレスポンスを有効化するリクエストを作成する
 for chunk in openai.ChatCompletion.create(
-    model="Qwen-7B",
+    model="Qwen",
    messages=[
        {"role": "user", "content": "你好"}
    ],
@@ -340,7 +340,7 @@ for chunk in openai.ChatCompletion.create(

 # ストリーミングレスポンスを有効化しないリクエストを作成する
 response = openai.ChatCompletion.create(
-    model="Qwen-7B",
+    model="Qwen",
    messages=[
        {"role": "user", "content": "你好"}
    ],
@@ -378,22 +378,22 @@ model = load_model_on_gpus('Qwen/Qwen-7B-Chat', num_gpus=2)

 Qwen-7B-Chat は、API、データベース、モデルなど、ツールの利用に特化して最適化されており、ユーザは独自の Qwen-7B ベースの LangChain、エージェント、コードインタプリタを構築することができます。ツール利用能力を評価するための評価[ベンチマーク](eval/EVALUATION.md)では、Qwen-7B は安定した性能に達しています。

-| Model       | Tool Selection (Acc.↑) | Tool Input (Rouge-L↑) | False Positive Error↓ |
-| :------------ | :-----------------------: | :----------------------: | :----------------------: |
-| GPT-4       |           95%           |        **0.90**        |          15%          |
-| GPT-3.5     |           85%           |          0.88          |          75%          |
-| **Qwen-7B** |         **99%**         |          0.89          |        **9.7%**        |
+| Model            | Tool Selection (Acc.↑) | Tool Input (Rouge-L↑)  | False Positive Error↓  |
+|:-----------------|:----------------------:|:----------------------:|:----------------------:|
+| GPT-4            | 95%                    | **0.90**               | 15%                    |
+| GPT-3.5          | 85%                    | 0.88                   | 75%                    |
+| **Qwen-7B-Chat** | **99%**                | 0.89                   | **9.7%**               |

 ReAct プロンプトの書き方や使い方については、[ReAct の例](examples/react_prompt.md)を参照してください。ツールを使用することで、モデルがよりよいタスクを実行できるようになります。

 さらに、エージェントとしての能力を示す実験結果を提供する。詳細は [Hugging Face Agent](https://huggingface.co/docs/transformers/transformers_agents) を参照して下さい。Hugging Face が提供するランモードベンチマークでの性能は以下の通りです:

-| Model           | Tool Selection↑ | Tool Used↑ |  Code↑  |
-| :---------------- | :----------------: | :-----------: | :---------: |
-| GPT-4           |     **100**     |   **100**   | **97.41** |
-| GPT-3.5         |      95.37      |    96.30    |   87.04   |
-| StarCoder-15.5B |      87.04      |    87.96    |   68.89   |
-| **Qwen-7B**     |      90.74      |    92.59    |   74.07   |
+| Model            | Tool Selection↑ | Tool Used↑  |   Code↑   |
+|:-----------------|:---------------:|:-----------:|:---------:|
+| GPT-4            |     **100**     |   **100**   | **97.41** |
+| GPT-3.5          |      95.37      |    96.30    |   87.04   |
+| StarCoder-15.5B  |      87.04      |    87.96    |   68.89   |
+| **Qwen-7B-Chat** |      90.74      |    92.59    |   74.07   |

 <br>