Agent 工具调用：Function Calling 与 Tool Use 实战

如果 Agent 是「大脑」，那工具就是它的「双手」。

没有工具的 Agent 只能进行纯文本交互，无法访问外部信息，无法执行实际操作，无法真正改变世界。

工具调用是 Agent 从「聊天机器人」进化为「智能助手」的关键能力。

本文要点#

Function Calling 核心原理
OpenAI vs Anthropic 工具调用对比
Tool Schema 设计最佳实践
工具选择与排序策略
多工具协同模式
常见工具类型与实现

一、工具调用的本质#

1.1 为什么需要工具调用？#

1
问题：大模型的局限性
2

3
1. 知识截止：训练数据有时效性，无法获取最新信息
4
2. 计算能力：复杂数学计算容易出错
5
3. 无外部访问：无法访问数据库、API、文件系统
6
4. 无实际操作：只能「说」，不能「做」
7

8
解决：工具调用
9

10
让大模型能够调用外部工具，获取信息、执行操作。

1.2 工具调用的基本流程#

sequenceDiagram participant U as 用户 participant A as Agent (LLM) participant T as 工具 U->>A: 提出请求 Note over A: 分析任务<br/>判断需要调用工具 A->>A: 生成工具调用参数 A->>T: 调用工具 T-->>A: 返回结果 Note over A: 处理工具结果<br/>生成最终回答 A-->>U: 返回结果

1.3 核心概念#

1
┌─────────────────────────────────────────────────────────────┐
2
│                    工具调用核心概念                          │
3
├─────────────────────────────────────────────────────────────┤
4
│                                                             │
5
│  Tool（工具）                                                │
6
│  ├── 定义：可供调用的外部功能                                │
7
│  ├── 示例：搜索、数据库查询、API调用、代码执行               │
8
│  └── 属性：名称、描述、参数Schema、执行函数                  │
9
│                                                             │
10
│  Tool Schema                                                │
11
│  ├── 定义：工具的结构化描述                                  │
12
│  ├── 内容：名称、功能描述、参数定义                          │
13
│  └── 格式：JSON Schema                                      │
14
│                                                             │
15
│  Function Calling                                           │
16
│  ├── 定义：模型生成工具调用参数的能力                        │
17
│  ├── 过程：理解需求 → 选择工具 → 构造参数                    │
18
│  └── 输出：结构化的工具调用请求                              │
19
│                                                             │
20
│  Tool Use                                                   │
21
│  ├── 定义：实际执行工具调用                                  │
22
│  ├── 过程：接收参数 → 执行函数 → 返回结果                    │
23
│  └── 实现：开发者提供的执行逻辑                              │
24
│                                                             │
25
└─────────────────────────────────────────────────────────────┘

二、Function Calling 原理详解#

2.1 OpenAI Function Calling#

基本使用#

1
from openai import OpenAI
2

3
client = OpenAI()
4

5
# 1. 定义工具
6
tools = [
7
    {
8
        "type": "function",
9
        "function": {
10
            "name": "get_weather",
11
            "description": "获取指定城市的当前天气信息",
12
            "parameters": {
13
                "type": "object",
14
                "properties": {
15
                    "city": {
16
                        "type": "string",
17
                        "description": "城市名称，如：北京、上海"
18
                    },
19
                    "unit": {
20
                        "type": "string",
21
                        "enum": ["celsius", "fahrenheit"],
22
                        "description": "温度单位，默认摄氏度"
23
                    }
24
                },
25
                "required": ["city"]
26
            }
27
        }
28
    }
29
]
30

31
# 2. 发送请求
32
response = client.chat.completions.create(
33
    model="gpt-4o",
34
    messages=[
35
        {"role": "user", "content": "北京今天天气怎么样？"}
36
    ],
37
    tools=tools,
38
    tool_choice="auto"  # auto: 自动决定是否调用工具
39
)
40

41
# 3. 处理响应
42
message = response.choices[0].message
43

44
if message.tool_calls:
45
    # 模型决定调用工具
46
    for tool_call in message.tool_calls:
47
        function_name = tool_call.function.name
48
        arguments = json.loads(tool_call.function.arguments)
49

50
        print(f"调用工具: {function_name}")
51
        print(f"参数: {arguments}")
52
        # 执行工具并获取结果
53
        result = execute_tool(function_name, arguments)

完整的函数调用循环#

1
import json
2
from openai import OpenAI
3

4
class OpenAIFunctionCaller:
5
    """OpenAI Function Calling 完整实现"""
6

7
    def __init__(self, model: str = "gpt-4o"):
8
        self.client = OpenAI()
9
        self.model = model
10
        self.tools = []
11
        self.tool_functions = {}
12

13
    def register_tool(self, schema: dict, function: callable):
14
        """注册工具"""
15
        self.tools.append(schema)
16
        self.tool_functions[schema["function"]["name"]] = function
17

18
    def run(self, user_message: str, max_iterations: int = 5) -> str:
19
        """执行对话，支持多轮工具调用"""
20

21
        messages = [
22
            {"role": "user", "content": user_message}
23
        ]
24

25
        for _ in range(max_iterations):
26
            # 调用模型
27
            response = self.client.chat.completions.create(
28
                model=self.model,
29
                messages=messages,
30
                tools=self.tools,
31
                tool_choice="auto"
32
            )
33

34
            message = response.choices[0].message
35

36
            # 检查是否需要调用工具
37
            if not message.tool_calls:
38
                # 无需调用工具，返回最终回答
39
                return message.content
40

41
            # 添加助手消息到历史
42
            messages.append(message)
43

44
            # 处理每个工具调用
45
            for tool_call in message.tool_calls:
46
                function_name = tool_call.function.name
47
                arguments = json.loads(tool_call.function.arguments)
48

49
                # 执行工具
50
                result = self._execute_tool(function_name, arguments)
51

52
                # 添加工具结果到历史
53
                messages.append({
54
                    "role": "tool",
55
                    "tool_call_id": tool_call.id,
56
                    "content": str(result)
57
                })
58

59
        return "达到最大迭代次数，任务未完成"
60

61
    def _execute_tool(self, name: str, arguments: dict) -> any:
62
        """执行工具"""
63
        if name not in self.tool_functions:
64
            return f"错误：未知工具 {name}"
65

66
        try:
67
            return self.tool_functions[name](**arguments)
68
        except Exception as e:
69
            return f"工具执行错误：{str(e)}"
70

71

72
# 使用示例
73
caller = OpenAIFunctionCaller()
74

75
# 注册天气工具
76
caller.register_tool(
77
    schema={
78
        "type": "function",
79
        "function": {
80
            "name": "get_weather",
81
            "description": "获取城市天气",
82
            "parameters": {
83
                "type": "object",
84
                "properties": {
85
                    "city": {"type": "string", "description": "城市名称"}
86
                },
87
                "required": ["city"]
88
            }
89
        }
90
    },
91
    function=lambda city: f"{city}今天晴，温度15-25°C"
92
)
93

94
# 执行
95
result = caller.run("北京今天天气怎么样？")
96
print(result)

2.2 Anthropic Tool Use#

基本使用#

1
from anthropic import Anthropic
2

3
client = Anthropic()
4

5
# 1. 定义工具（与 OpenAI 略有不同）
6
tools = [
7
    {
8
        "name": "get_weather",
9
        "description": "获取指定城市的当前天气信息",
10
        "input_schema": {
11
            "type": "object",
12
            "properties": {
13
                "city": {
14
                    "type": "string",
15
                    "description": "城市名称"
16
                },
17
                "unit": {
18
                    "type": "string",
19
                    "enum": ["celsius", "fahrenheit"],
20
                    "description": "温度单位"
21
                }
22
            },
23
            "required": ["city"]
24
        }
25
    }
26
]
27

28
# 2. 发送请求
29
response = client.messages.create(
30
    model="claude-sonnet-4-20250514",
31
    max_tokens=1024,
32
    messages=[
33
        {"role": "user", "content": "北京今天天气怎么样？"}
34
    ],
35
    tools=tools
36
)
37

38
# 3. 处理响应
39
for block in response.content:
40
    if block.type == "tool_use":
41
        # 工具调用
42
        tool_name = block.name
43
        tool_input = block.input
44

45
        print(f"调用工具: {tool_name}")
46
        print(f"参数: {tool_input}")
47

48
        # 执行工具
49
        result = execute_tool(tool_name, tool_input)
50

51
        # 继续对话
52
        response = client.messages.create(
53
            model="claude-sonnet-4-20250514",
54
            max_tokens=1024,
55
            messages=[
56
                {"role": "user", "content": "北京今天天气怎么样？"},
57
                {"role": "assistant", "content": response.content},
58
                {
59
                    "role": "user",
60
                    "content": [
61
                        {
62
                            "type": "tool_result",
63
                            "tool_use_id": block.id,
64
                            "content": str(result)
65
                        }
66
                    ]
67
                }
68
            ],
69
            tools=tools
70
        )

完整实现#

1
import anthropic
2
from typing import List, Dict, Any, Callable
3

4
class AnthropicToolUser:
5
    """Anthropic Tool Use 完整实现"""
6

7
    def __init__(self, model: str = "claude-sonnet-4-20250514"):
8
        self.client = anthropic.Anthropic()
9
        self.model = model
10
        self.tools = []
11
        self.tool_functions: Dict[str, Callable] = {}
12

13
    def register_tool(self, name: str, description: str,
14
                     input_schema: dict, function: Callable):
15
        """注册工具"""
16
        self.tools.append({
17
            "name": name,
18
            "description": description,
19
            "input_schema": input_schema
20
        })
21
        self.tool_functions[name] = function
22

23
    def run(self, user_message: str, max_iterations: int = 5) -> str:
24
        """执行对话"""
25

26
        messages = [
27
            {"role": "user", "content": user_message}
28
        ]
29

30
        for _ in range(max_iterations):
31
            response = self.client.messages.create(
32
                model=self.model,
33
                max_tokens=4096,
34
                messages=messages,
35
                tools=self.tools
36
            )
37

38
            # 检查是否有工具调用
39
            tool_use_blocks = [
40
                block for block in response.content
41
                if block.type == "tool_use"
42
            ]
43

44
            if not tool_use_blocks:
45
                # 没有工具调用，返回文本结果
46
                text_blocks = [
47
                    block for block in response.content
48
                    if block.type == "text"
49
                ]
50
                return "".join(block.text for block in text_blocks)
51

52
            # 添加助手响应
53
            messages.append({
54
                "role": "assistant",
55
                "content": response.content
56
            })
57

58
            # 处理工具调用
59
            tool_results = []
60
            for block in tool_use_blocks:
61
                result = self._execute_tool(block.name, block.input)
62

63
                tool_results.append({
64
                    "type": "tool_result",
65
                    "tool_use_id": block.id,
66
                    "content": str(result)
67
                })
68

69
            # 添加工具结果
70
            messages.append({
71
                "role": "user",
72
                "content": tool_results
73
            })
74

75
        return "达到最大迭代次数"
76

77
    def _execute_tool(self, name: str, arguments: dict) -> Any:
78
        """执行工具"""
79
        if name not in self.tool_functions:
80
            return {"error": f"未知工具: {name}"}
81

82
        try:
83
            return self.tool_functions[name](**arguments)
84
        except Exception as e:
85
            return {"error": str(e)}

2.3 OpenAI vs Anthropic 对比#

1
┌─────────────────────────────────────────────────────────────┐
2
│                  Function Calling 对比                       │
3
├─────────────────────────────────────────────────────────────┤
4
│                                                             │
5
│  OpenAI                          Anthropic                  │
6
│  ────────────────────────────    ────────────────────────   │
7
│                                                             │
8
│  Schema 格式:                     Schema 格式:               │
9
│  {                               {                          │
10
│    "type": "function",             "name": "...",           │
11
│    "function": {                   "description": "...",    │
12
│      "name": "...",                "input_schema": {...}    │
13
│      "description": "...",       }                          │
14
│      "parameters": {...}                                      │
15
│    }                                                         │
16
│  }                                                         │ │
17
│                                                             │
18
│  工具调用格式:                    工具调用格式:               │
19
│  message.tool_calls[]            response.content[]         │
20
│    .function.name                  .type == "tool_use"      │
21
│    .function.arguments             .name                    │
22
│    .id                             .input                   │
23
│                                                             │
24
│  工具结果格式:                    工具结果格式:               │
25
│  {                               {                          │
26
│    "role": "tool",                 "type": "tool_result",   │
27
│    "tool_call_id": "...",          "tool_use_id": "...",    │
28
│    "content": "..."                "content": "..."         │
29
│  }                               }                          │
30
│                                                             │
31
│  特点:                            特点:                      │
32
│  • tool_choice 可控制             • 必须在 tools 中定义      │
33
│  • 支持并行调用                   • 更严格的 Schema 验证     │
34
│  • 调用更简洁                     • 错误处理更详细           │
35
│                                                             │
36
└─────────────────────────────────────────────────────────────┘

三、Tool Schema 设计最佳实践#

3.1 Schema 设计原则#

flowchart TD A[Tool Schema 设计] --> B[清晰命名] A --> C[详细描述] A --> D[合理参数] A --> E[类型安全] B --> B1[动词+名词] B --> B2[避免缩写] C --> C1[说明功能] C --> C2[使用场景] C --> C3[返回内容] D --> D1[必填/可选] D --> D2[默认值] D --> D3[参数校验] E --> E1[使用枚举] E --> E2[设置范围] E --> E3[格式约束]

3.2 好的 Schema 示例#

1
# 好的设计
2
good_weather_tool = {
3
    "type": "function",
4
    "function": {
5
        "name": "get_current_weather",
6
        "description": """获取指定城市的实时天气信息。
7

8
使用场景：
9
- 用户询问某地天气时调用
10
- 需要天气数据做决策时使用
11

12
返回信息：温度、湿度、天气状况、风向风速""",
13
        "parameters": {
14
            "type": "object",
15
            "properties": {
16
                "city": {
17
                    "type": "string",
18
                    "description": "城市名称，支持中英文，如：北京、Beijing"
19
                },
20
                "country": {
21
                    "type": "string",
22
                    "description": "国家代码（ISO 3166），如：CN、US。可选，用于区分同名城市"
23
                },
24
                "units": {
25
                    "type": "string",
26
                    "enum": ["metric", "imperial"],
27
                    "description": "温度单位：metric(摄氏度)，imperial(华氏度)。默认 metric"
28
                }
29
            },
30
            "required": ["city"]
31
        }
32
    }
33
}
34

35
# 不好的设计
36
bad_weather_tool = {
37
    "type": "function",
38
    "function": {
39
        "name": "weather",  # 不清晰
40
        "description": "获取天气",  # 太简单
41
        "parameters": {
42
            "type": "object",
43
            "properties": {
44
                "c": {  # 缩写不明确
45
                    "type": "string"
46
                    # 缺少描述
47
                },
48
                "u": {  # 缩写不明确
49
                    "type": "string"
50
                    # 没有限制值范围
51
                }
52
            }
53
        }
54
    }
55
}

3.3 参数设计技巧#

1
# 1. 使用枚举限制选项
2
status_tool = {
3
    "type": "function",
4
    "function": {
5
        "name": "update_order_status",
6
        "parameters": {
7
            "type": "object",
8
            "properties": {
9
                "order_id": {"type": "string"},
10
                "status": {
11
                    "type": "string",
12
                    "enum": ["pending", "processing", "shipped", "delivered", "cancelled"],
13
                    "description": "订单状态"
14
                }
15
            }
16
        }
17
    }
18
}
19

20
# 2. 使用默认值减少必填参数
21
search_tool = {
22
    "type": "function",
23
    "function": {
24
        "name": "search_products",
25
        "parameters": {
26
            "type": "object",
27
            "properties": {
28
                "query": {"type": "string", "description": "搜索关键词"},
29
                "page": {
30
                    "type": "integer",
31
                    "description": "页码，从1开始",
32
                    "default": 1
33
                },
34
                "page_size": {
35
                    "type": "integer",
36
                    "description": "每页数量",
37
                    "default": 20
38
                },
39
                "sort_by": {
40
                    "type": "string",
41
                    "enum": ["relevance", "price_asc", "price_desc", "rating"],
42
                    "default": "relevance"
43
                }
44
            },
45
            "required": ["query"]
46
        }
47
    }
48
}
49

50
# 3. 复杂对象使用嵌套结构
51
order_tool = {
52
    "type": "function",
53
    "function": {
54
        "name": "create_order",
55
        "parameters": {
56
            "type": "object",
57
            "properties": {
58
                "customer": {
59
                    "type": "object",
60
                    "properties": {
61
                        "name": {"type": "string"},
62
                        "email": {"type": "string", "format": "email"},
63
                        "phone": {"type": "string"}
64
                    },
65
                    "required": ["name", "email"]
66
                },
67
                "items": {
68
                    "type": "array",
69
                    "items": {
70
                        "type": "object",
71
                        "properties": {
72
                            "product_id": {"type": "string"},
73
                            "quantity": {"type": "integer", "minimum": 1}
74
                        },
75
                        "required": ["product_id", "quantity"]
76
                    }
77
                },
78
                "shipping_address": {
79
                    "type": "object",
80
                    "properties": {
81
                        "street": {"type": "string"},
82
                        "city": {"type": "string"},
83
                        "zip_code": {"type": "string"}
84
                    }
85
                }
86
            },
87
            "required": ["customer", "items"]
88
        }
89
    }
90
}

四、工具选择与排序策略#

4.1 tool_choice 参数#

1
# OpenAI 的 tool_choice 选项
2
options = {
3
    "auto": "模型自动决定是否调用工具",
4
    "none": "强制不调用任何工具",
5
    "required": "强制必须调用至少一个工具",
6
    {"type": "function", "function": {"name": "xxx"}}: "强制调用指定工具"
7
}
8

9
# 示例：强制调用搜索工具
10
response = client.chat.completions.create(
11
    model="gpt-4o",
12
    messages=[{"role": "user", "content": "搜索最新的AI新闻"}],
13
    tools=[search_tool],
14
    tool_choice={"type": "function", "function": {"name": "web_search"}}
15
)

4.2 工具选择策略#

flowchart TD A[用户请求] --> B{分析意图} B --> C[识别关键实体] B --> D[理解任务类型] C --> E{匹配工具} D --> E E --> F{单工具?} F -->|是| G[调用对应工具] F -->|否| H[工具排序] H --> I[按相关性排序] I --> J[按历史成功率] J --> K[返回排序结果]

4.3 智能工具选择器#

1
from typing import List, Dict
2
import re
3

4
class ToolSelector:
5
    """智能工具选择器"""
6

7
    def __init__(self, tools: List[Dict]):
8
        self.tools = tools
9
        self.tool_stats = {}  # 工具统计信息
10

11
    def select_tools(self, query: str, max_tools: int = 5) -> List[Dict]:
12
        """选择最相关的工具"""
13

14
        scored_tools = []
15

16
        for tool in self.tools:
17
            score = self._calculate_relevance(tool, query)
18
            scored_tools.append((tool, score))
19

20
        # 按分数排序
21
        scored_tools.sort(key=lambda x: x[1], reverse=True)
22

23
        return [t[0] for t in scored_tools[:max_tools]]
24

25
    def _calculate_relevance(self, tool: Dict, query: str) -> float:
26
        """计算工具与查询的相关性"""
27

28
        function = tool.get("function", {})
29
        name = function.get("name", "").lower()
30
        description = function.get("description", "").lower()
31

32
        score = 0.0
33

34
        # 1. 名称匹配
35
        name_words = name.split("_")
36
        for word in name_words:
37
            if word in query.lower():
38
                score += 0.3
39

40
        # 2. 描述关键词匹配
41
        query_words = set(query.lower().split())
42
        desc_words = set(description.split())
43
        overlap = query_words & desc_words
44
        score += len(overlap) * 0.1
45

46
        # 3. 正则模式匹配
47
        patterns = self._extract_patterns(function)
48
        for pattern in patterns:
49
            if re.search(pattern, query, re.IGNORECASE):
50
                score += 0.2
51

52
        # 4. 历史成功率
53
        stats = self.tool_stats.get(name, {})
54
        success_rate = stats.get("success_rate", 0.5)
55
        score *= (0.5 + success_rate * 0.5)
56

57
        return score
58

59
    def _extract_patterns(self, function: Dict) -> List[str]:
60
        """从描述中提取模式"""
61
        description = function.get("description", "")
62
        patterns = []
63

64
        # 简单的模式提取逻辑
65
        # 实际中可以使用更复杂的 NLP 技术
66
        weather_keywords = ["天气", "温度", "weather", "temperature"]
67
        search_keywords = ["搜索", "查找", "search", "find"]
68

69
        for keyword in weather_keywords:
70
            if keyword in description.lower():
71
                patterns.append(r"天气|温度|weather")
72

73
        for keyword in search_keywords:
74
            if keyword in description.lower():
75
                patterns.append(r"搜索|查找|search|find")
76

77
        return patterns
78

79
    def record_result(self, tool_name: str, success: bool):
80
        """记录工具调用结果"""
81
        if tool_name not in self.tool_stats:
82
            self.tool_stats[tool_name] = {
83
                "calls": 0,
84
                "successes": 0,
85
                "success_rate": 0.5
86
            }
87

88
        stats = self.tool_stats[tool_name]
89
        stats["calls"] += 1
90
        if success:
91
            stats["successes"] += 1
92

93
        stats["success_rate"] = stats["successes"] / stats["calls"]

五、多工具协同模式#

5.1 并行调用#

1
class ParallelToolCaller:
2
    """并行工具调用"""
3

4
    def __init__(self, caller):
5
        self.caller = caller
6
        self.executor = ThreadPoolExecutor(max_workers=10)
7

8
    async def call_parallel(self, tool_calls: List[Dict]) -> List[Any]:
9
        """并行执行多个工具调用"""
10

11
        futures = []
12
        for call in tool_calls:
13
            future = self.executor.submit(
14
                self.caller._execute_tool,
15
                call["name"],
16
                call["arguments"]
17
            )
18
            futures.append(future)
19

20
        results = [f.result() for f in futures]
21
        return results
22

23

24
# 使用示例
25
async def process_complex_query(query: str):
26
    """处理需要多个工具的复杂查询"""
27

28
    # 假设模型决定需要调用多个工具
29
    tool_calls = [
30
        {"name": "get_weather", "arguments": {"city": "北京"}},
31
        {"name": "get_news", "arguments": {"topic": "科技", "limit": 5}},
32
        {"name": "get_stock", "arguments": {"symbol": "AAPL"}}
33
    ]
34

35
    # 并行执行
36
    results = await parallel_caller.call_parallel(tool_calls)
37

38
    # 整合结果
39
    return {
40
        "weather": results[0],
41
        "news": results[1],
42
        "stock": results[2]
43
    }

5.2 工具链式调用#

flowchart LR A[用户请求] --> B[工具1: 搜索] B --> C[结果1] C --> D[工具2: 分析] D --> E[结果2] E --> F[工具3: 生成] F --> G[最终结果]

1
class ChainedToolCaller:
2
    """链式工具调用"""
3

4
    def __init__(self, caller):
5
        self.caller = caller
6

7
    def execute_chain(self, query: str, chain: List[Dict]) -> Any:
8
        """执行工具链"""
9

10
        context = {"query": query, "results": []}
11

12
        for step in chain:
13
            # 准备参数（可以使用前一步的结果）
14
            arguments = self._prepare_arguments(step, context)
15

16
            # 执行工具
17
            result = self.caller._execute_tool(
18
                step["tool"],
19
                arguments
20
            )
21

22
            context["results"].append({
23
                "tool": step["tool"],
24
                "arguments": arguments,
25
                "result": result
26
            })
27

28
        return context
29

30
    def _prepare_arguments(self, step: Dict, context: Dict) -> Dict:
31
        """准备工具参数，支持引用前序结果"""
32

33
        arguments = {}
34
        arg_config = step.get("arguments", {})
35

36
        for key, value in arg_config.items():
37
            if isinstance(value, str) and value.startswith("$"):
38
                # 引用前序结果
39
                ref_path = value[1:]  # 去掉 $
40
                value = self._resolve_reference(ref_path, context)
41

42
            arguments[key] = value
43

44
        return arguments
45

46
    def _resolve_reference(self, path: str, context: Dict) -> Any:
47
        """解析引用路径"""
48

49
        # 支持格式：$results[0].result.data
50
        parts = path.split(".")
51
        value = context
52

53
        for part in parts:
54
            if "[" in part:
55
                # 数组索引
56
                key = part.split("[")[0]
57
                index = int(part.split("[")[1].rstrip("]"))
58
                value = value[key][index]
59
            else:
60
                value = value[part]
61

62
        return value
63

64

65
# 使用示例
66
chain = [
67
    {
68
        "tool": "web_search",
69
        "arguments": {"query": "$query"}
70
    },
71
    {
72
        "tool": "extract_content",
73
        "arguments": {"url": "$results[0].result.url"}
74
    },
75
    {
76
        "tool": "summarize",
77
        "arguments": {"content": "$results[1].result.content"}
78
    }
79
]
80

81
result = chain_caller.execute_chain("AI最新进展", chain)

5.3 条件分支#

1
class ConditionalToolCaller:
2
    """条件分支工具调用"""
3

4
    def execute_with_conditions(self, query: str, rules: List[Dict]) -> Any:
5
        """根据条件选择执行路径"""
6

7
        for rule in rules:
8
            if self._evaluate_condition(rule["condition"], query):
9
                return self._execute_action(rule["action"])
10

11
        return None
12

13
    def _evaluate_condition(self, condition: str, query: str) -> bool:
14
        """评估条件"""
15

16
        conditions = {
17
            "contains_weather": lambda q: any(
18
                word in q for word in ["天气", "温度", "weather"]
19
            ),
20
            "contains_search": lambda q: any(
21
                word in q for word in ["搜索", "查找", "search"]
22
            ),
23
            "is_question": lambda q: "?" in q or "？" in q
24
        }
25

26
        evaluator = conditions.get(condition, lambda q: False)
27
        return evaluator(query)
28

29

30
# 规则配置
31
rules = [
32
    {
33
        "condition": "contains_weather",
34
        "action": {"tool": "get_weather", "arguments": {"city": "北京"}}
35
    },
36
    {
37
        "condition": "contains_search",
38
        "action": {"tool": "web_search", "arguments": {"query": "$query"}}
39
    },
40
    {
41
        "condition": "is_question",
42
        "action": {"tool": "answer_question", "arguments": {"question": "$query"}}
43
    }
44
]

六、常见工具类型与实现#

6.1 搜索工具#

1
def web_search_tool(query: str, limit: int = 5) -> list:
2
    """网络搜索工具"""
3

4
    tools_schema = {
5
        "type": "function",
6
        "function": {
7
            "name": "web_search",
8
            "description": "搜索互联网获取信息",
9
            "parameters": {
10
                "type": "object",
11
                "properties": {
12
                    "query": {
13
                        "type": "string",
14
                        "description": "搜索关键词"
15
                    },
16
                    "limit": {
17
                        "type": "integer",
18
                        "description": "返回结果数量",
19
                        "default": 5
20
                    }
21
                },
22
                "required": ["query"]
23
            }
24
        }
25
    }
26

27
    # 实现搜索逻辑
28
    # 可以使用 SerperAPI、Bing Search API 等
29
    import requests
30

31
    API_KEY = "your-api-key"
32
    url = "https://api.serper.dev/search"
33

34
    response = requests.post(
35
        url,
36
        headers={"X-API-KEY": API_KEY},
37
        json={"q": query, "num": limit}
38
    )
39

40
    results = response.json().get("organic", [])
41

42
    return [
43
        {
44
            "title": r["title"],
45
            "link": r["link"],
46
            "snippet": r.get("snippet", "")
47
        }
48
        for r in results[:limit]
49
    ]

6.2 数据库工具#

1
import sqlite3
2
from typing import List, Dict
3

4
class DatabaseTool:
5
    """数据库查询工具"""
6

7
    def __init__(self, db_path: str):
8
        self.conn = sqlite3.connect(db_path)
9
        self.conn.row_factory = sqlite3.Row
10

11
    def get_schema(self) -> dict:
12
        """返回工具 Schema"""
13
        return {
14
            "type": "function",
15
            "function": {
16
                "name": "query_database",
17
                "description": "执行 SQL 查询获取数据库信息",
18
                "parameters": {
19
                    "type": "object",
20
                    "properties": {
21
                        "sql": {
22
                            "type": "string",
23
                            "description": "SQL 查询语句（仅支持 SELECT）"
24
                        }
25
                    },
26
                    "required": ["sql"]
27
                }
28
            }
29
        }
30

31
    def execute(self, sql: str) -> List[Dict]:
32
        """执行查询"""
33
        # 安全检查：只允许 SELECT
34
        if not sql.strip().upper().startswith("SELECT"):
35
            return {"error": "仅支持 SELECT 查询"}
36

37
        try:
38
            cursor = self.conn.execute(sql)
39
            rows = cursor.fetchall()
40
            return [dict(row) for row in rows]
41
        except Exception as e:
42
            return {"error": str(e)}
43

44

45
# 使用示例
46
db_tool = DatabaseTool("sales.db")
47

48
# 注册到 Agent
49
caller.register_tool(
50
    schema=db_tool.get_schema(),
51
    function=db_tool.execute
52
)

6.3 API 调用工具#

1
import requests
2
from typing import Dict, Any
3

4
class APICallTool:
5
    """通用 API 调用工具"""
6

7
    def __init__(self, base_url: str, headers: Dict = None):
8
        self.base_url = base_url.rstrip("/")
9
        self.headers = headers or {}
10

11
    def get_schema(self) -> dict:
12
        return {
13
            "type": "function",
14
            "function": {
15
                "name": "api_call",
16
                "description": f"调用 {self.base_url} 的 API 接口",
17
                "parameters": {
18
                    "type": "object",
19
                    "properties": {
20
                        "method": {
21
                            "type": "string",
22
                            "enum": ["GET", "POST", "PUT", "DELETE"],
23
                            "default": "GET"
24
                        },
25
                        "endpoint": {
26
                            "type": "string",
27
                            "description": "API 端点路径"
28
                        },
29
                        "params": {
30
                            "type": "object",
31
                            "description": "查询参数"
32
                        },
33
                        "body": {
34
                            "type": "object",
35
                            "description": "请求体（POST/PUT）"
36
                        }
37
                    },
38
                    "required": ["endpoint"]
39
                }
40
            }
41
        }
42

43
    def execute(self, method: str = "GET", endpoint: str = "",
44
               params: Dict = None, body: Dict = None) -> Any:
45

46
        url = f"{self.base_url}/{endpoint.lstrip('/')}"
47

48
        try:
49
            response = requests.request(
50
                method=method,
51
                url=url,
52
                headers=self.headers,
53
                params=params,
54
                json=body
55
            )
56
            response.raise_for_status()
57
            return response.json()
58
        except requests.exceptions.RequestException as e:
59
            return {"error": str(e)}

6.4 代码执行工具#

1
import subprocess
2
import tempfile
3
import os
4

5
class CodeExecutionTool:
6
    """代码执行工具"""
7

8
    def get_schema(self) -> dict:
9
        return {
10
            "type": "function",
11
            "function": {
12
                "name": "execute_code",
13
                "description": "执行 Python 代码并返回结果",
14
                "parameters": {
15
                    "type": "object",
16
                    "properties": {
17
                        "code": {
18
                            "type": "string",
19
                            "description": "要执行的 Python 代码"
20
                        },
21
                        "timeout": {
22
                            "type": "integer",
23
                            "description": "执行超时时间（秒）",
24
                            "default": 30
25
                        }
26
                    },
27
                    "required": ["code"]
28
                }
29
            }
30
        }
31

32
    def execute(self, code: str, timeout: int = 30) -> dict:
33
        """安全执行代码"""
34

35
        # 使用临时文件执行
36
        with tempfile.NamedTemporaryFile(
37
            mode='w', suffix='.py', delete=False
38
        ) as f:
39
            f.write(code)
40
            temp_file = f.name
41

42
        try:
43
            result = subprocess.run(
44
                ['python', temp_file],
45
                capture_output=True,
46
                text=True,
47
                timeout=timeout
48
            )
49

50
            return {
51
                "success": result.returncode == 0,
52
                "stdout": result.stdout,
53
                "stderr": result.stderr
54
            }
55

56
        except subprocess.TimeoutExpired:
57
            return {
58
                "success": False,
59
                "error": f"执行超时（{timeout}秒）"
60
            }
61

62
        finally:
63
            os.unlink(temp_file)

七、工具调用最佳实践#

7.1 错误处理#

1
class RobustToolCaller:
2
    """健壮的工具调用"""
3

4
    def execute_with_retry(self, tool_name: str, arguments: dict,
5
                          max_retries: int = 3) -> dict:
6

7
        last_error = None
8

9
        for attempt in range(max_retries):
10
            try:
11
                result = self._execute_tool(tool_name, arguments)
12

13
                if isinstance(result, dict) and "error" in result:
14
                    last_error = result["error"]
15

16
                    # 尝试修复参数
17
                    fixed_args = self._try_fix_arguments(
18
                        tool_name, arguments, last_error
19
                    )
20
                    if fixed_args != arguments:
21
                        arguments = fixed_args
22
                        continue
23

24
                return {"success": True, "result": result}
25

26
            except Exception as e:
27
                last_error = str(e)
28
                time.sleep(2 ** attempt)  # 指数退避
29

30
        return {
31
            "success": False,
32
            "error": last_error,
33
            "suggestion": self._suggest_alternative(tool_name, arguments)
34
        }
35

36
    def _try_fix_arguments(self, tool_name: str, arguments: dict,
37
                          error: str) -> dict:
38
        """尝试修复参数"""
39

40
        # 使用 LLM 分析错误并建议修复
41
        prompt = f"""
42
工具调用失败，请分析错误并建议修复：
43

44
工具：{tool_name}
45
参数：{json.dumps(arguments)}
46
错误：{error}
47

48
请返回修复后的参数（JSON格式）。
49
"""
50

51
        fixed = self.llm.generate(prompt)
52
        return json.loads(fixed)

7.2 安全控制#

1
class SecureToolManager:
2
    """安全的工具管理"""
3

4
    def __init__(self):
5
        self.tools = {}
6
        self.permissions = {}  # 工具权限配置
7
        self.audit_log = []    # 审计日志
8

9
    def register_tool(self, name: str, function: callable,
10
                     permission_level: str = "normal"):
11
        """注册工具并设置权限级别"""
12

13
        self.tools[name] = function
14
        self.permissions[name] = permission_level
15

16
    def execute(self, tool_name: str, arguments: dict,
17
               user_permission: str = "normal") -> any:
18
        """执行工具（带权限检查）"""
19

20
        # 1. 权限检查
21
        required = self.permissions.get(tool_name, "normal")
22
        if not self._check_permission(user_permission, required):
23
            self._log(tool_name, arguments, "PERMISSION_DENIED")
24
            raise PermissionError(
25
                f"权限不足：需要 {required} 级别"
26
            )
27

28
        # 2. 参数校验
29
        validated_args = self._validate_arguments(tool_name, arguments)
30

31
        # 3. 执行并记录
32
        try:
33
            result = self.tools[tool_name](**validated_args)
34
            self._log(tool_name, validated_args, "SUCCESS", result)
35
            return result
36
        except Exception as e:
37
            self._log(tool_name, validated_args, "ERROR", str(e))
38
            raise
39

40
    def _check_permission(self, user_level: str, required: str) -> bool:
41
        """检查权限"""
42
        levels = ["guest", "normal", "admin", "super"]
43
        return levels.index(user_level) >= levels.index(required)
44

45
    def _validate_arguments(self, tool_name: str, arguments: dict) -> dict:
46
        """校验和清理参数"""
47
        # 实现 SQL 注入防护、XSS 过滤等
48
        validated = {}
49
        for key, value in arguments.items():
50
            if isinstance(value, str):
51
                # 清理危险字符
52
                value = self._sanitize_string(value)
53
            validated[key] = value
54
        return validated
55

56
    def _log(self, tool_name: str, arguments: dict,
57
            status: str, result: any = None):
58
        """记录审计日志"""
59
        self.audit_log.append({
60
            "timestamp": datetime.now().isoformat(),
61
            "tool": tool_name,
62
            "arguments": arguments,
63
            "status": status,
64
            "result": str(result)[:500]  # 截断
65
        })

常见问题 FAQ#

Q1：如何决定何时使用工具调用？

A：考虑以下因素：

任务是否需要外部数据？（如搜索、数据库）
是否需要执行实际操作？（如发送邮件、创建文件）
纯文本推理是否足够？
工具调用的收益是否大于成本？

Q2：工具数量有限制吗？

A：

OpenAI：建议不超过 128 个工具
Anthropic：建议不超过 64 个工具
工具过多会增加选择难度，建议按场景分组

Q3：如何处理工具调用失败？

A：

重试机制：自动重试 2-3 次
参数修复：使用 LLM 分析错误并修正
降级策略：尝试替代工具或方法
用户通知：明确告知失败原因

Q4：如何提高工具调用的准确性？

A：

优化工具描述，提供详细的使用场景
使用枚举限制参数值
提供示例调用
记录成功案例用于 Few-shot

Q5：工具调用有安全风险吗？

A：主要风险包括：

恶意参数注入
未授权的敏感操作
数据泄露

建议措施：

实施权限控制
参数校验和清理
操作审计日志
敏感操作需人工确认

小结#

工具调用是 Agent 的核心能力，让 Agent 从「会说」变成「会做」。

核心要点回顾：

1
┌─────────────────────────────────────────────────────────────┐
2
│                    工具调用核心总结                          │
3
├─────────────────────────────────────────────────────────────┤
4
│                                                             │
5
│  核心原理：LLM 生成结构化参数 → 执行函数 → 返回结果          │
6
│                                                             │
7
│  Schema 设计：清晰命名、详细描述、合理参数、类型安全         │
8
│                                                             │
9
│  选择策略：语义匹配、历史成功率、用户权限                    │
10
│                                                             │
11
│  协同模式：并行调用、链式调用、条件分支                      │
12
│                                                             │
13
│  最佳实践：错误处理、安全控制、审计日志                      │
14
│                                                             │
15
└─────────────────────────────────────────────────────────────┘

下一步学习：

下篇预告#

《Agent 多智能体协作：从单体到群体智能》

深入解析：

多 Agent 协作的必要性
流水线、层级、对等三种协作模式
CrewAI 多 Agent 框架实战
Agent 间通信与协调

本文要点#

一、工具调用的本质#

1.1 为什么需要工具调用？#

1.2 工具调用的基本流程#

1.3 核心概念#

二、Function Calling 原理详解#

2.1 OpenAI Function Calling#

基本使用#

完整的函数调用循环#

2.2 Anthropic Tool Use#

基本使用#

完整实现#

2.3 OpenAI vs Anthropic 对比#

三、Tool Schema 设计最佳实践#

3.1 Schema 设计原则#

3.2 好的 Schema 示例#

3.3 参数设计技巧#

四、工具选择与排序策略#

4.1 tool_choice 参数#

4.2 工具选择策略#

4.3 智能工具选择器#

五、多工具协同模式#

5.1 并行调用#

5.2 工具链式调用#

5.3 条件分支#

六、常见工具类型与实现#

6.1 搜索工具#

6.2 数据库工具#

6.3 API 调用工具#

6.4 代码执行工具#

七、工具调用最佳实践#

7.1 错误处理#

7.2 安全控制#

常见问题 FAQ#

小结#

下篇预告#

参考资料#

支持与分享