Agent 实战：从零构建一个研究助手 Agent

理论学了很多，是时候动手做一个真正的 Agent 了。

本文将带你从零构建一个「研究助手 Agent」，它能自动搜索信息、分析数据、撰写报告——一个真正能帮你干活的生产力工具。

从需求到部署，完整实战。

本文要点#

项目需求分析与设计
技术栈选择与架构
工具集成：搜索、数据库、文件处理
记忆系统实现
多 Agent 协作设计
完整代码实现
部署与监控方案

一、项目需求分析#

1.1 功能需求#

1
┌─────────────────────────────────────────────────────────────┐
2
│                    研究助手 Agent 功能需求                   │
3
├─────────────────────────────────────────────────────────────┤
4
│                                                             │
5
│  核心功能                                                    │
6
│  ├── 信息搜集：搜索网络、查询数据库、读取文档               │
7
│  ├── 数据分析：统计计算、趋势分析、对比分析                 │
8
│  ├── 内容生成：撰写报告、生成摘要、制作图表                 │
9
│  └── 持续学习：记住用户偏好、积累研究经验                   │
10
│                                                             │
11
│  交互方式                                                    │
12
│  ├── 自然语言输入：用户描述研究主题                         │
13
│  ├── 多轮对话：支持追问和细化需求                           │
14
│  ├── 结果导出：生成 PDF、Word、Markdown 格式                │
15
│  └── 进度反馈：实时显示研究进展                             │
16
│                                                             │
17
│  非功能需求                                                  │
18
│  ├── 响应时间：< 30 秒完成简单研究                          │
19
│  ├── 准确性：信息来源可追溯、引用可验证                     │
20
│  ├── 可扩展：易于添加新的数据源和分析工具                   │
21
│  └── 安全性：敏感信息保护、操作日志记录                     │
22
│                                                             │
23
└─────────────────────────────────────────────────────────────┘

1.2 典型使用场景#

flowchart LR A[用户：研究某公司] --> B[搜索公开信息] B --> C[查询财务数据] C --> D[分析竞争格局] D --> E[生成研究报告] F[用户：分析销售趋势] --> G[查询销售数据库] G --> H[统计计算] H --> I[生成图表] I --> J[撰写分析报告]

二、技术栈选择#

2.1 架构设计#

flowchart TB subgraph 用户层 A[Web UI / CLI] end subgraph Agent 层 B[主控 Agent] C[研究员 Agent] D[分析师 Agent] E[编辑 Agent] end subgraph 能力层 F[工具管理器] G[记忆系统] H[向量数据库] end subgraph 数据层 I[搜索 API] J[数据库] K[文件系统] end A --> B B --> C B --> D B --> E C --> F D --> F E --> F F --> I F --> J F --> K B --> G G --> H

2.2 技术选型#

1
┌─────────────────────────────────────────────────────────────┐
2
│                    技术栈选型                                │
3
├─────────────────────────────────────────────────────────────┤
4
│                                                             │
5
│  核心框架                                                    │
6
│  ├── LangChain：Agent 编排和工具管理                        │
7
│  ├── LangGraph：工作流状态管理                              │
8
│  └── OpenAI GPT-4o：主要 LLM                                │
9
│                                                             │
10
│  向量数据库                                                  │
11
│  ├── ChromaDB：本地开发和测试                               │
12
│  └── 可切换到 Milvus/Pinecone：生产部署                     │
13
│                                                             │
14
│  数据存储                                                    │
15
│  ├── SQLite：轻量级数据缓存                                 │
16
│  └── Redis：会话状态管理                                    │
17
│                                                             │
18
│  API 集成                                                    │
19
│  ├── SerperAPI：网络搜索                                    │
20
│  ├── Tavily：深度搜索                                       │
21
│  └── 自定义 API：内部数据源                                 │
22
│                                                             │
23
│  部署运维                                                    │
24
│  ├── FastAPI：REST API 服务                                 │
25
│  ├── Docker：容器化部署                                     │
26
│  └── Prometheus + Grafana：监控告警                         │
27
│                                                             │
28
└─────────────────────────────────────────────────────────────┘

三、项目结构#

1
research-agent/
2
├── src/
3
│   ├── agents/
4
│   │   ├── __init__.py
5
│   │   ├── base.py           # Agent 基类
6
│   │   ├── researcher.py     # 研究员 Agent
7
│   │   ├── analyst.py        # 分析师 Agent
8
│   │   └── editor.py         # 编辑 Agent
9
│   │
10
│   ├── tools/
11
│   │   ├── __init__.py
12
│   │   ├── search.py         # 搜索工具
13
│   │   ├── database.py       # 数据库工具
14
│   │   ├── file_processor.py # 文件处理工具
15
│   │   └── calculator.py     # 计算工具
16
│   │
17
│   ├── memory/
18
│   │   ├── __init__.py
19
│   │   ├── short_term.py     # 短期记忆
20
│   │   ├── long_term.py      # 长期记忆
21
│   │   └── episodic.py       # 情景记忆
22
│   │
23
│   ├── workflows/
24
│   │   ├── __init__.py
25
│   │   └── research_flow.py  # 研究工作流
26
│   │
27
│   ├── utils/
28
│   │   ├── __init__.py
29
│   │   ├── logger.py         # 日志工具
30
│   │   └── config.py         # 配置管理
31
│   │
32
│   └── api/
33
│       ├── __init__.py
34
│       ├── main.py           # FastAPI 入口
35
│       └── routes.py         # API 路由
36
│
37
├── tests/
38
│   └── test_agents.py
39
│
40
├── config/
41
│   ├── settings.yaml         # 配置文件
42
│   └── prompts/              # 提示词模板
43
│
44
├── data/
45
│   └── chroma/               # 向量数据库存储
46
│
47
├── requirements.txt
48
├── Dockerfile
49
└── README.md

四、工具集成实现#

4.1 搜索工具#

1
from typing import List, Dict, Optional
2
from langchain_core.tools import tool
3
import requests
4
import os
5

6
class SearchTools:
7
    """搜索工具集"""
8

9
    def __init__(self):
10
        self.serper_api_key = os.getenv("SERPER_API_KEY")
11
        self.tavily_api_key = os.getenv("TAVILY_API_KEY")
12

13
    @tool
14
    def web_search(self, query: str, num_results: int = 5) -> List[Dict]:
15
        """
16
        搜索网络获取信息。
17

18
        Args:
19
            query: 搜索关键词
20
            num_results: 返回结果数量
21

22
        Returns:
23
            搜索结果列表，包含标题、链接、摘要
24
        """
25
        url = "https://google.serper.dev/search"
26
        headers = {
27
            "X-API-KEY": self.serper_api_key,
28
            "Content-Type": "application/json"
29
        }
30
        payload = {"q": query, "num": num_results}
31

32
        response = requests.post(url, json=payload, headers=headers)
33
        results = response.json().get("organic", [])
34

35
        return [
36
            {
37
                "title": r.get("title", ""),
38
                "link": r.get("link", ""),
39
                "snippet": r.get("snippet", ""),
40
                "position": r.get("position", 0)
41
            }
42
            for r in results[:num_results]
43
        ]
44

45
    @tool
46
    def deep_search(self, query: str, search_depth: str = "basic") -> Dict:
47
        """
48
        深度搜索，获取更全面的信息。
49

50
        Args:
51
            query: 搜索关键词
52
            search_depth: 搜索深度 (basic/advanced)
53

54
        Returns:
55
            包含搜索结果和答案的字典
56
        """
57
        from tavily import TavilyClient
58

59
        client = TavilyClient(api_key=self.tavily_api_key)
60
        result = client.search(
61
            query=query,
62
            search_depth=search_depth,
63
            max_results=10
64
        )
65

66
        return {
67
            "answer": result.get("answer", ""),
68
            "results": result.get("results", []),
69
            "follow_up_questions": result.get("follow_up_questions", [])
70
        }
71

72
    @tool
73
    def fetch_webpage(self, url: str) -> str:
74
        """
75
        获取网页内容。
76

77
        Args:
78
            url: 网页 URL
79

80
        Returns:
81
            网页文本内容
82
        """
83
        from bs4 import BeautifulSoup
84

85
        response = requests.get(url, timeout=30)
86
        soup = BeautifulSoup(response.text, 'html.parser')
87

88
        # 移除脚本和样式
89
        for script in soup(["script", "style"]):
90
            script.decompose()
91

92
        text = soup.get_text(separator='\n', strip=True)
93

94
        # 清理多余空白
95
        lines = [line.strip() for line in text.splitlines() if line.strip()]
96
        return '\n'.join(lines[:200])  # 限制长度
97

98

99
# 创建工具实例
100
search_tools = SearchTools()

4.2 数据库工具#

1
from typing import List, Dict, Any, Optional
2
from langchain_core.tools import tool
3
import sqlite3
4
import json
5

6
class DatabaseTools:
7
    """数据库工具集"""
8

9
    def __init__(self, db_path: str = "./data/research.db"):
10
        self.db_path = db_path
11
        self._init_database()
12

13
    def _init_database(self):
14
        """初始化数据库表"""
15
        conn = sqlite3.connect(self.db_path)
16
        cursor = conn.cursor()
17

18
        # 研究记录表
19
        cursor.execute("""
20
            CREATE TABLE IF NOT EXISTS research_records (
21
                id INTEGER PRIMARY KEY AUTOINCREMENT,
22
                topic TEXT NOT NULL,
23
                query TEXT,
24
                result TEXT,
25
                sources TEXT,
26
                created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
27
            )
28
        """)
29

30
        # 用户偏好表
31
        cursor.execute("""
32
            CREATE TABLE IF NOT EXISTS user_preferences (
33
                id INTEGER PRIMARY KEY AUTOINCREMENT,
34
                user_id TEXT,
35
                preference_key TEXT,
36
                preference_value TEXT,
37
                created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
38
                UNIQUE(user_id, preference_key)
39
            )
40
        """)
41

42
        conn.commit()
43
        conn.close()
44

45
    @tool
46
    def execute_query(self, sql: str) -> List[Dict]:
47
        """
48
        执行 SQL 查询。
49

50
        Args:
51
            sql: SELECT 查询语句
52

53
        Returns:
54
            查询结果列表
55
        """
56
        if not sql.strip().upper().startswith("SELECT"):
57
            return {"error": "仅支持 SELECT 查询"}
58

59
        conn = sqlite3.connect(self.db_path)
60
        conn.row_factory = sqlite3.Row
61

62
        try:
63
            cursor = conn.execute(sql)
64
            results = [dict(row) for row in cursor.fetchall()]
65
            return results
66
        except Exception as e:
67
            return {"error": str(e)}
68
        finally:
69
            conn.close()
70

71
    @tool
72
    def save_research(self, topic: str, query: str, result: str,
73
                     sources: List[str]) -> int:
74
        """
75
        保存研究记录。
76

77
        Args:
78
            topic: 研究主题
79
            query: 查询内容
80
            result: 研究结果
81
            sources: 信息来源列表
82

83
        Returns:
84
            记录 ID
85
        """
86
        conn = sqlite3.connect(self.db_path)
87
        cursor = conn.cursor()
88

89
        cursor.execute("""
90
            INSERT INTO research_records (topic, query, result, sources)
91
            VALUES (?, ?, ?, ?)
92
        """, (topic, query, result, json.dumps(sources)))
93

94
        record_id = cursor.lastrowid
95
        conn.commit()
96
        conn.close()
97

98
        return record_id
99

100
    @tool
101
    def get_research_history(self, topic: Optional[str] = None,
102
                            limit: int = 10) -> List[Dict]:
103
        """
104
        获取研究历史记录。
105

106
        Args:
107
            topic: 可选的主题筛选
108
            limit: 返回记录数量
109

110
        Returns:
111
            历史记录列表
112
        """
113
        conn = sqlite3.connect(self.db_path)
114
        conn.row_factory = sqlite3.Row
115

116
        if topic:
117
            cursor = conn.execute("""
118
                SELECT * FROM research_records
119
                WHERE topic LIKE ?
120
                ORDER BY created_at DESC
121
                LIMIT ?
122
            """, (f"%{topic}%", limit))
123
        else:
124
            cursor = conn.execute("""
125
                SELECT * FROM research_records
126
                ORDER BY created_at DESC
127
                LIMIT ?
128
            """, (limit,))
129

130
        results = [dict(row) for row in cursor.fetchall()]
131
        conn.close()
132

133
        return results
134

135
    @tool
136
    def save_preference(self, user_id: str, key: str, value: str) -> bool:
137
        """保存用户偏好"""
138
        conn = sqlite3.connect(self.db_path)
139
        cursor = conn.cursor()
140

141
        cursor.execute("""
142
            INSERT OR REPLACE INTO user_preferences
143
            (user_id, preference_key, preference_value)
144
            VALUES (?, ?, ?)
145
        """, (user_id, key, value))
146

147
        conn.commit()
148
        conn.close()
149

150
        return True
151

152
    @tool
153
    def get_preferences(self, user_id: str) -> Dict[str, str]:
154
        """获取用户偏好"""
155
        conn = sqlite3.connect(self.db_path)
156
        conn.row_factory = sqlite3.Row
157

158
        cursor = conn.execute("""
159
            SELECT preference_key, preference_value
160
            FROM user_preferences
161
            WHERE user_id = ?
162
        """, (user_id,))
163

164
        preferences = {row["preference_key"]: row["preference_value"]
165
                      for row in cursor.fetchall()}
166
        conn.close()
167

168
        return preferences

4.3 文件处理工具#

1
from typing import List, Dict, Optional
2
from langchain_core.tools import tool
3
import os
4
import json
5
from datetime import datetime
6

7
class FileTools:
8
    """文件处理工具集"""
9

10
    def __init__(self, output_dir: str = "./output"):
11
        self.output_dir = output_dir
12
        os.makedirs(output_dir, exist_ok=True)
13

14
    @tool
15
    def save_report(self, filename: str, content: str,
16
                   format: str = "markdown") -> str:
17
        """
18
        保存研究报告。
19

20
        Args:
21
            filename: 文件名（不含扩展名）
22
            content: 报告内容
23
            format: 输出格式 (markdown/json/txt)
24

25
        Returns:
26
            保存的文件路径
27
        """
28
        ext_map = {
29
            "markdown": ".md",
30
            "json": ".json",
31
            "txt": ".txt"
32
        }
33

34
        ext = ext_map.get(format, ".txt")
35
        filepath = os.path.join(self.output_dir, f"{filename}{ext}")
36

37
        with open(filepath, 'w', encoding='utf-8') as f:
38
            f.write(content)
39

40
        return filepath
41

42
    @tool
43
    def read_file(self, filepath: str) -> str:
44
        """
45
        读取文件内容。
46

47
        Args:
48
            filepath: 文件路径
49

50
        Returns:
51
            文件内容
52
        """
53
        if not os.path.exists(filepath):
54
            return f"错误：文件不存在 {filepath}"
55

56
        with open(filepath, 'r', encoding='utf-8') as f:
57
            return f.read()
58

59
    @tool
60
    def list_files(self, directory: str = None,
61
                  pattern: str = None) -> List[str]:
62
        """
63
        列出目录下的文件。
64

65
        Args:
66
            directory: 目录路径，默认为输出目录
67
            pattern: 文件名模式（支持通配符）
68

69
        Returns:
70
            文件列表
71
        """
72
        dir_path = directory or self.output_dir
73

74
        if not os.path.exists(dir_path):
75
            return []
76

77
        files = []
78
        for f in os.listdir(dir_path):
79
            if pattern:
80
                import fnmatch
81
                if fnmatch.fnmatch(f, pattern):
82
                    files.append(os.path.join(dir_path, f))
83
            else:
84
                files.append(os.path.join(dir_path, f))
85

86
        return sorted(files, key=lambda x: os.path.getmtime(x), reverse=True)
87

88
    @tool
89
    def generate_markdown_report(self, title: str, sections: Dict[str, str],
90
                                 metadata: Dict = None) -> str:
91
        """
92
        生成 Markdown 格式报告。
93

94
        Args:
95
            title: 报告标题
96
            sections: 各章节内容 {章节名: 内容}
97
            metadata: 元数据（作者、日期等）
98

99
        Returns:
100
            Markdown 格式的报告内容
101
        """
102
        lines = []
103

104
        # 标题
105
        lines.append(f"# {title}\n")
106

107
        # 元数据
108
        if metadata:
109
            lines.append("---")
110
            for key, value in metadata.items():
111
                lines.append(f"{key}: {value}")
112
            lines.append("---\n")
113

114
        # 目录
115
        lines.append("## 目录\n")
116
        for i, section_name in enumerate(sections.keys(), 1):
117
            anchor = section_name.lower().replace(" ", "-")
118
            lines.append(f"{i}. [{section_name}](#{anchor})")
119
        lines.append("\n")
120

121
        # 内容
122
        for section_name, content in sections.items():
123
            lines.append(f"## {section_name}\n")
124
            lines.append(content)
125
            lines.append("\n")
126

127
        # 时间戳
128
        lines.append(f"\n---\n*生成时间：{datetime.now().strftime('%Y-%m-%d %H:%M:%S')}*")
129

130
        return "\n".join(lines)

4.4 计算工具#

1
from typing import List, Dict, Union
2
from langchain_core.tools import tool
3
import statistics
4

5
class CalculatorTools:
6
    """计算工具集"""
7

8
    @tool
9
    def calculate(self, expression: str) -> Union[float, str]:
10
        """
11
        执行数学计算。
12

13
        Args:
14
            expression: 数学表达式，如 "2 + 3 * 4"
15

16
        Returns:
17
            计算结果
18
        """
19
        try:
20
            # 安全计算（仅允许数学运算）
21
            allowed_chars = set('0123456789+-*/.() ')
22
            if not all(c in allowed_chars for c in expression):
23
                return "错误：表达式包含非法字符"
24

25
            result = eval(expression)
26
            return result
27
        except Exception as e:
28
            return f"计算错误：{str(e)}"
29

30
    @tool
31
    def analyze_statistics(self, numbers: List[float]) -> Dict:
32
        """
33
        计算统计指标。
34

35
        Args:
36
            numbers: 数值列表
37

38
        Returns:
39
            统计结果字典
40
        """
41
        if not numbers:
42
            return {"error": "数据为空"}
43

44
        return {
45
            "count": len(numbers),
46
            "sum": sum(numbers),
47
            "mean": statistics.mean(numbers),
48
            "median": statistics.median(numbers),
49
            "min": min(numbers),
50
            "max": max(numbers),
51
            "std_dev": statistics.stdev(numbers) if len(numbers) > 1 else 0,
52
            "variance": statistics.variance(numbers) if len(numbers) > 1 else 0
53
        }
54

55
    @tool
56
    def calculate_growth_rate(self, start_value: float,
57
                             end_value: float,
58
                             periods: int = 1) -> Dict:
59
        """
60
        计算增长率。
61

62
        Args:
63
            start_value: 起始值
64
            end_value: 结束值
65
            periods: 周期数
66

67
        Returns:
68
            增长率信息
69
        """
70
        total_growth = (end_value - start_value) / start_value * 100
71
        avg_growth = total_growth / periods
72
        cagr = ((end_value / start_value) ** (1 / periods) - 1) * 100
73

74
        return {
75
            "total_growth_rate": f"{total_growth:.2f}%",
76
            "average_growth_rate": f"{avg_growth:.2f}%",
77
            "cagr": f"{cagr:.2f}%"
78
        }
79

80
    @tool
81
    def compare_values(self, values: Dict[str, float]) -> Dict:
82
        """
83
        对比多个数值。
84

85
        Args:
86
            values: {名称: 数值} 的字典
87

88
        Returns:
89
            对比结果
90
        """
91
        sorted_values = sorted(values.items(), key=lambda x: x[1], reverse=True)
92
        max_name, max_val = sorted_values[0]
93
        min_name, min_val = sorted_values[-1]
94

95
        return {
96
            "ranking": [{"name": k, "value": v} for k, v in sorted_values],
97
            "max": {"name": max_name, "value": max_val},
98
            "min": {"name": min_name, "value": min_val},
99
            "range": max_val - min_val
100
        }

五、记忆系统实现#

5.1 短期记忆#

1
from typing import List, Dict
2
from collections import deque
3

4
class ShortTermMemory:
5
    """短期记忆：对话历史管理"""
6

7
    def __init__(self, max_messages: int = 50, max_tokens: int = 8000):
8
        self.max_messages = max_messages
9
        self.max_tokens = max_tokens
10
        self.messages: deque = deque(maxlen=max_messages)
11
        self.summary = ""
12

13
    def add_message(self, role: str, content: str):
14
        """添加消息"""
15
        self.messages.append({
16
            "role": role,
17
            "content": content,
18
            "token_count": self._estimate_tokens(content)
19
        })
20

21
        # 检查是否需要压缩
22
        if self._get_total_tokens() > self.max_tokens:
23
            self._compress()
24

25
    def get_context(self, include_summary: bool = True) -> List[Dict]:
26
        """获取上下文"""
27
        context = []
28

29
        if include_summary and self.summary:
30
            context.append({
31
                "role": "system",
32
                "content": f"[历史摘要] {self.summary}"
33
            })
34

35
        context.extend(list(self.messages))
36
        return context
37

38
    def clear(self):
39
        """清空记忆"""
40
        self.messages.clear()
41
        self.summary = ""
42

43
    def _estimate_tokens(self, text: str) -> int:
44
        """估算 token 数量"""
45
        # 简单估算：中文约 1.5 字/token，英文约 4 字符/token
46
        return len(text) // 2
47

48
    def _get_total_tokens(self) -> int:
49
        """获取总 token 数"""
50
        return sum(m["token_count"] for m in self.messages)
51

52
    def _compress(self):
53
        """压缩历史消息"""
54
        # 保留最近 10 条，其余生成摘要
55
        if len(self.messages) <= 10:
56
            return
57

58
        to_compress = list(self.messages)[:-10]
59

60
        # 这里可以用 LLM 生成摘要
61
        # 简化处理：直接拼接关键信息
62
        compressed_summary = " | ".join([
63
            f"{m['role']}: {m['content'][:100]}..."
64
            for m in to_compress[-5:]
65
        ])
66

67
        self.summary = f"{self.summary}\n{compressed_summary}" if self.summary else compressed_summary
68

69
        # 只保留最近的消息
70
        self.messages = deque(list(self.messages)[-10:], maxlen=self.max_messages)

5.2 长期记忆#

1
from typing import List, Dict, Optional
2
import chromadb
3
from chromadb.config import Settings
4
from openai import OpenAI
5
import os
6

7
class LongTermMemory:
8
    """长期记忆：向量数据库存储"""
9

10
    def __init__(self, collection_name: str = "research_memory",
11
                 persist_dir: str = "./data/chroma"):
12
        # 初始化 ChromaDB
13
        self.client = chromadb.Client(Settings(
14
            chroma_db_impl="duckdb+parquet",
15
            persist_directory=persist_dir
16
        ))
17

18
        self.collection = self.client.get_or_create_collection(
19
            name=collection_name,
20
            metadata={"hnsw:space": "cosine"}
21
        )
22

23
        self.embedder = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
24

25
    def store(self, content: str, metadata: Dict = None) -> str:
26
        """存储记忆"""
27
        import uuid
28

29
        memory_id = str(uuid.uuid4())
30
        embedding = self._get_embedding(content)
31

32
        self.collection.add(
33
            ids=[memory_id],
34
            embeddings=[embedding],
35
            documents=[content],
36
            metadatas=[metadata or {}]
37
        )
38

39
        return memory_id
40

41
    def recall(self, query: str, n_results: int = 5,
42
               filter_metadata: Dict = None) -> List[Dict]:
43
        """检索相关记忆"""
44
        query_embedding = self._get_embedding(query)
45

46
        results = self.collection.query(
47
            query_embeddings=[query_embedding],
48
            n_results=n_results,
49
            where=filter_metadata,
50
            include=["documents", "metadatas", "distances"]
51
        )
52

53
        memories = []
54
        for i in range(len(results["ids"][0])):
55
            memories.append({
56
                "id": results["ids"][0][i],
57
                "content": results["documents"][0][i],
58
                "metadata": results["metadatas"][0][i],
59
                "distance": results["distances"][0][i]
60
            })
61

62
        return memories
63

64
    def _get_embedding(self, text: str) -> List[float]:
65
        """生成 embedding"""
66
        response = self.embedder.embeddings.create(
67
            model="text-embedding-3-small",
68
            input=text
69
        )
70
        return response.data[0].embedding
71

72
    def store_research_experience(self, topic: str, query: str,
73
                                  result: str, lessons: str = None):
74
        """存储研究经验"""
75
        content = f"""
76
研究主题：{topic}
77
查询内容：{query}
78
研究结果：{result}
79
经验总结：{lessons or '无'}
80
"""
81
        self.store(
82
            content,
83
            metadata={
84
                "type": "research_experience",
85
                "topic": topic,
86
                "timestamp": datetime.now().isoformat()
87
            }
88
        )
89

90
    def get_similar_research(self, topic: str, limit: int = 3) -> List[Dict]:
91
        """获取相似研究"""
92
        return self.recall(
93
            topic,
94
            n_results=limit,
95
            filter_metadata={"type": "research_experience"}
96
        )

六、多 Agent 协作实现#

6.1 Agent 基类#

1
from abc import ABC, abstractmethod
2
from typing import List, Dict, Any, Optional
3
from langchain_openai import ChatOpenAI
4
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage
5
from langchain_core.tools import BaseTool
6

7
class BaseAgent(ABC):
8
    """Agent 基类"""
9

10
    def __init__(self,
11
                 name: str,
12
                 llm: ChatOpenAI,
13
                 tools: List[BaseTool] = None,
14
                 system_prompt: str = None):
15

16
        self.name = name
17
        self.llm = llm
18
        self.tools = tools or []
19
        self.system_prompt = system_prompt or self._default_system_prompt()
20

21
        # 绑定工具
22
        if self.tools:
23
            self.llm_with_tools = self.llm.bind_tools(self.tools)
24
        else:
25
            self.llm_with_tools = self.llm
26

27
    @abstractmethod
28
    def _default_system_prompt(self) -> str:
29
        """默认系统提示词"""
30
        pass
31

32
    @abstractmethod
33
    def process(self, input_data: Any) -> Any:
34
        """处理任务"""
35
        pass
36

37
    def _call_llm(self, messages: List) -> str:
38
        """调用 LLM"""
39
        full_messages = [SystemMessage(content=self.system_prompt)] + messages
40
        response = self.llm_with_tools.invoke(full_messages)
41
        return response
42

43
    def _execute_tools(self, tool_calls: List) -> List[Dict]:
44
        """执行工具调用"""
45
        results = []
46

47
        for tool_call in tool_calls:
48
            tool_name = tool_call["name"]
49
            tool_args = tool_call["args"]
50

51
            # 查找工具
52
            tool = next((t for t in self.tools if t.name == tool_name), None)
53

54
            if tool:
55
                try:
56
                    result = tool.invoke(tool_args)
57
                    results.append({
58
                        "tool": tool_name,
59
                        "result": result,
60
                        "success": True
61
                    })
62
                except Exception as e:
63
                    results.append({
64
                        "tool": tool_name,
65
                        "error": str(e),
66
                        "success": False
67
                    })
68

69
        return results

6.2 研究员 Agent#

1
from typing import List, Dict, Any
2
from langchain_openai import ChatOpenAI
3
from langchain_core.tools import BaseTool
4
from .base import BaseAgent
5

6
class ResearcherAgent(BaseAgent):
7
    """研究员 Agent：负责信息收集"""
8

9
    def __init__(self, llm: ChatOpenAI, tools: List[BaseTool]):
10
        super().__init__(
11
            name="Researcher",
12
            llm=llm,
13
            tools=tools
14
        )
15

16
    def _default_system_prompt(self) -> str:
17
        return """你是一位专业的研究员，负责收集和整理信息。
18

19
你的职责：
20
1. 根据研究主题，确定需要搜集的信息类型
21
2. 使用搜索工具获取相关信息
22
3. 验证信息的可靠性
23
4. 整理和归类收集到的信息
24

25
工作原则：
26
- 信息来源要可靠
27
- 尽可能全面
28
- 标注信息来源
29
- 发现矛盾时要标注"""
30

31
    def process(self, topic: str, depth: str = "normal") -> Dict:
32
        """
33
        执行研究任务。
34

35
        Args:
36
            topic: 研究主题
37
            depth: 研究深度 (quick/normal/deep)
38

39
        Returns:
40
            研究结果
41
        """
42
        # 第一步：规划研究
43
        plan = self._plan_research(topic, depth)
44

45
        # 第二步：执行搜索
46
        collected_info = []
47
        for query in plan["queries"]:
48
            search_result = self._search(query)
49
            collected_info.append(search_result)
50

51
        # 第三步：整理结果
52
        organized = self._organize_info(collected_info)
53

54
        return {
55
            "topic": topic,
56
            "plan": plan,
57
            "collected_info": collected_info,
58
            "organized_info": organized,
59
            "sources": plan["sources"]
60
        }
61

62
    def _plan_research(self, topic: str, depth: str) -> Dict:
63
        """规划研究步骤"""
64
        prompt = f"""
65
研究主题：{topic}
66
研究深度：{depth}
67

68
请规划研究步骤：
69
1. 需要搜索哪些方面的信息？
70
2. 使用什么关键词搜索？
71
3. 预期获取什么类型的数据？
72

73
以 JSON 格式返回：
74
{{
75
    "aspects": ["方面1", "方面2", ...],
76
    "queries": ["搜索词1", "搜索词2", ...],
77
    "expected_data": ["数据类型1", ...]
78
}}
79
"""
80
        response = self.llm.invoke([HumanMessage(content=prompt)])
81
        # 解析 JSON...
82
        return self._parse_plan(response.content)
83

84
    def _search(self, query: str) -> Dict:
85
        """执行搜索"""
86
        messages = [
87
            HumanMessage(content=f"搜索：{query}")
88
        ]
89

90
        response = self._call_llm(messages)
91

92
        # 处理工具调用
93
        if hasattr(response, 'tool_calls') and response.tool_calls:
94
            tool_results = self._execute_tools(response.tool_calls)
95
            return {
96
                "query": query,
97
                "results": tool_results
98
            }
99

100
        return {"query": query, "results": []}
101

102
    def _organize_info(self, collected_info: List) -> Dict:
103
        """整理收集的信息"""
104
        prompt = f"""
105
请整理以下收集到的信息：
106

107
{collected_info}
108

109
要求：
110
1. 按主题分类
111
2. 去除重复信息
112
3. 标注来源
113
4. 突出关键信息
114
"""
115
        response = self.llm.invoke([HumanMessage(content=prompt)])
116
        return {"summary": response.content}

6.3 分析师 Agent#

1
from typing import List, Dict, Any
2
from langchain_openai import ChatOpenAI
3
from langchain_core.tools import BaseTool
4
from .base import BaseAgent
5

6
class AnalystAgent(BaseAgent):
7
    """分析师 Agent：负责数据分析"""
8

9
    def __init__(self, llm: ChatOpenAI, tools: List[BaseTool]):
10
        super().__init__(
11
            name="Analyst",
12
            llm=llm,
13
            tools=tools
14
        )
15

16
    def _default_system_prompt(self) -> str:
17
        return """你是一位专业的数据分析师，负责分析和解读数据。
18

19
你的职责：
20
1. 分析研究数据
21
2. 发现趋势和模式
22
3. 计算关键指标
23
4. 得出分析结论
24

25
分析原则：
26
- 数据驱动
27
- 结论有依据
28
- 考虑多种可能性
29
- 识别数据局限性"""
30

31
    def process(self, research_data: Dict, analysis_type: str = "comprehensive") -> Dict:
32
        """
33
        执行分析任务。
34

35
        Args:
36
            research_data: 研究数据
37
            analysis_type: 分析类型 (quick/comprehensive/deep)
38

39
        Returns:
40
            分析结果
41
        """
42
        # 第一步：理解数据
43
        understanding = self._understand_data(research_data)
44

45
        # 第二步：执行分析
46
        if analysis_type == "quick":
47
            analysis = self._quick_analysis(research_data)
48
        else:
49
            analysis = self._comprehensive_analysis(research_data)
50

51
        # 第三步：生成洞察
52
        insights = self._generate_insights(analysis)
53

54
        return {
55
            "understanding": understanding,
56
            "analysis": analysis,
57
            "insights": insights
58
        }
59

60
    def _quick_analysis(self, data: Dict) -> Dict:
61
        """快速分析"""
62
        prompt = f"""
63
对以下数据进行快速分析，提取关键信息：
64

65
{data}
66

67
请提供：
68
1. 核心发现（3-5 点）
69
2. 关键数据
70
3. 初步结论
71
"""
72
        response = self.llm.invoke([HumanMessage(content=prompt)])
73
        return {"analysis": response.content}
74

75
    def _comprehensive_analysis(self, data: Dict) -> Dict:
76
        """深度分析"""
77
        # 使用工具进行计算
78
        # 生成趋势分析
79
        # 对比分析
80
        pass
81

82
    def _generate_insights(self, analysis: Dict) -> List[str]:
83
        """生成洞察"""
84
        prompt = f"""
85
基于以下分析，生成关键洞察：
86

87
{analysis}
88

89
要求：
90
1. 突出最重要的发现
91
2. 解释发现的意义
92
3. 提出可能的行动建议
93
"""
94
        response = self.llm.invoke([HumanMessage(content=prompt)])
95
        return response.content.split('\n')

6.4 编辑 Agent#

1
from typing import List, Dict, Any
2
from langchain_openai import ChatOpenAI
3
from langchain_core.tools import BaseTool
4
from .base import BaseAgent
5

6
class EditorAgent(BaseAgent):
7
    """编辑 Agent：负责报告撰写"""
8

9
    def __init__(self, llm: ChatOpenAI, tools: List[BaseTool]):
10
        super().__init__(
11
            name="Editor",
12
            llm=llm,
13
            tools=tools
14
        )
15

16
    def _default_system_prompt(self) -> str:
17
        return """你是一位专业的技术作家和编辑，负责撰写研究报告。
18

19
你的职责：
20
1. 组织报告结构
21
2. 撰写清晰的内容
22
3. 确保逻辑连贯
23
4. 优化语言表达
24

25
写作原则：
26
- 结构清晰
27
- 语言简洁
28
- 论点有据
29
- 易于理解"""
30

31
    def process(self, research_result: Dict, analysis_result: Dict,
32
               format: str = "markdown") -> Dict:
33
        """
34
        撰写研究报告。
35

36
        Args:
37
            research_result: 研究结果
38
            analysis_result: 分析结果
39
            format: 输出格式
40

41
        Returns:
42
            报告内容
43
        """
44
        # 第一步：规划报告结构
45
        outline = self._create_outline(research_result, analysis_result)
46

47
        # 第二步：撰写各章节
48
        sections = self._write_sections(outline, research_result, analysis_result)
49

50
        # 第三步：整合和润色
51
        report = self._finalize_report(sections, format)
52

53
        return {
54
            "outline": outline,
55
            "sections": sections,
56
            "report": report
57
        }
58

59
    def _create_outline(self, research: Dict, analysis: Dict) -> List[str]:
60
        """创建报告大纲"""
61
        prompt = f"""
62
根据研究和分析结果，创建报告大纲：
63

64
研究内容：{research}
65
分析结果：{analysis}
66

67
请提供报告大纲，包括：
68
1. 摘要
69
2. 背景介绍
70
3. 研究方法
71
4. 主要发现
72
5. 分析结论
73
6. 建议
74
"""
75
        response = self.llm.invoke([HumanMessage(content=prompt)])
76
        return response.content.split('\n')
77

78
    def _write_sections(self, outline: List, research: Dict, analysis: Dict) -> Dict:
79
        """撰写各章节"""
80
        sections = {}
81

82
        for section in outline:
83
            if section.strip():
84
                prompt = f"""
85
撰写章节：{section}
86

87
参考资料：
88
研究数据：{research}
89
分析结果：{analysis}
90

91
要求：
92
- 内容详实
93
- 数据准确
94
- 逻辑清晰
95
"""
96
                response = self.llm.invoke([HumanMessage(content=prompt)])
97
                sections[section] = response.content
98

99
        return sections
100

101
    def _finalize_report(self, sections: Dict, format: str) -> str:
102
        """整合报告"""
103
        if format == "markdown":
104
            lines = []
105
            for section, content in sections.items():
106
                lines.append(f"## {section}\n")
107
                lines.append(content)
108
                lines.append("\n")
109
            return "\n".join(lines)
110

111
        return str(sections)

七、工作流编排#

1
from typing import Dict, Any
2
from langgraph.graph import StateGraph, END
3
from langchain_openai import ChatOpenAI
4

5
from ..agents.researcher import ResearcherAgent
6
from ..agents.analyst import AnalystAgent
7
from ..agents.editor import EditorAgent
8
from ..tools.search import SearchTools
9
from ..tools.database import DatabaseTools
10
from ..tools.file_processor import FileTools
11
from ..tools.calculator import CalculatorTools
12
from ..memory.short_term import ShortTermMemory
13
from ..memory.long_term import LongTermMemory
14

15
# 定义状态
16
class ResearchState(dict):
17
    """研究工作流状态"""
18
    topic: str
19
    depth: str
20
    research_result: Dict
21
    analysis_result: Dict
22
    report: str
23
    messages: list
24

25
class ResearchWorkflow:
26
    """研究工作流"""
27

28
    def __init__(self, openai_api_key: str):
29
        # 初始化 LLM
30
        self.llm = ChatOpenAI(
31
            model="gpt-4o",
32
            temperature=0.7,
33
            api_key=openai_api_key
34
        )
35

36
        # 初始化工具
37
        self.search_tools = SearchTools()
38
        self.db_tools = DatabaseTools()
39
        self.file_tools = FileTools()
40
        self.calc_tools = CalculatorTools()
41

42
        # 初始化记忆
43
        self.short_term_memory = ShortTermMemory()
44
        self.long_term_memory = LongTermMemory()
45

46
        # 初始化 Agents
47
        self.researcher = ResearcherAgent(
48
            self.llm,
49
            [self.search_tools.web_search, self.search_tools.deep_search]
50
        )
51

52
        self.analyst = AnalystAgent(
53
            self.llm,
54
            [self.calc_tools.calculate, self.calc_tools.analyze_statistics]
55
        )
56

57
        self.editor = EditorAgent(
58
            self.llm,
59
            [self.file_tools.save_report, self.file_tools.generate_markdown_report]
60
        )
61

62
        # 构建工作流图
63
        self.graph = self._build_graph()
64

65
    def _build_graph(self) -> StateGraph:
66
        """构建状态图"""
67
        workflow = StateGraph(ResearchState)
68

69
        # 添加节点
70
        workflow.add_node("research", self._research_node)
71
        workflow.add_node("analyze", self._analyze_node)
72
        workflow.add_node("write", self._write_node)
73
        workflow.add_node("save", self._save_node)
74

75
        # 定义边
76
        workflow.add_edge("research", "analyze")
77
        workflow.add_edge("analyze", "write")
78
        workflow.add_edge("write", "save")
79
        workflow.add_edge("save", END)
80

81
        # 设置入口
82
        workflow.set_entry_point("research")
83

84
        return workflow.compile()
85

86
    def _research_node(self, state: ResearchState) -> ResearchState:
87
        """研究节点"""
88
        result = self.researcher.process(state["topic"], state.get("depth", "normal"))
89
        state["research_result"] = result
90

91
        # 保存到短期记忆
92
        self.short_term_memory.add_message(
93
            "assistant",
94
            f"研究完成：{result['organized_info']['summary']}"
95
        )
96

97
        return state
98

99
    def _analyze_node(self, state: ResearchState) -> ResearchState:
100
        """分析节点"""
101
        result = self.analyst.process(
102
            state["research_result"],
103
            state.get("analysis_type", "comprehensive")
104
        )
105
        state["analysis_result"] = result
106

107
        self.short_term_memory.add_message(
108
            "assistant",
109
            f"分析完成：{result['insights']}"
110
        )
111

112
        return state
113

114
    def _write_node(self, state: ResearchState) -> ResearchState:
115
        """撰写节点"""
116
        result = self.editor.process(
117
            state["research_result"],
118
            state["analysis_result"],
119
            state.get("format", "markdown")
120
        )
121
        state["report"] = result["report"]
122

123
        self.short_term_memory.add_message(
124
            "assistant",
125
            f"报告撰写完成"
126
        )
127

128
        return state
129

130
    def _save_node(self, state: ResearchState) -> ResearchState:
131
        """保存节点"""
132
        # 保存到数据库
133
        self.db_tools.save_research(
134
            topic=state["topic"],
135
            query=state["topic"],
136
            result=state["report"],
137
            sources=state["research_result"].get("sources", [])
138
        )
139

140
        # 保存到长期记忆
141
        self.long_term_memory.store_research_experience(
142
            topic=state["topic"],
143
            query=state["topic"],
144
            result=state["report"]
145
        )
146

147
        # 保存文件
148
        filepath = self.file_tools.save_report(
149
            filename=f"research_{state['topic'][:20]}",
150
            content=state["report"],
151
            format="markdown"
152
        )
153

154
        state["output_file"] = filepath
155

156
        return state
157

158
    def run(self, topic: str, depth: str = "normal",
159
            analysis_type: str = "comprehensive",
160
            format: str = "markdown") -> Dict:
161
        """
162
        执行研究工作流。
163

164
        Args:
165
            topic: 研究主题
166
            depth: 研究深度
167
            analysis_type: 分析类型
168
            format: 输出格式
169

170
        Returns:
171
            研究结果
172
        """
173
        initial_state = ResearchState(
174
            topic=topic,
175
            depth=depth,
176
            analysis_type=analysis_type,
177
            format=format,
178
            messages=[]
179
        )
180

181
        final_state = self.graph.invoke(initial_state)
182

183
        return {
184
            "topic": topic,
185
            "report": final_state["report"],
186
            "research_result": final_state["research_result"],
187
            "analysis_result": final_state["analysis_result"],
188
            "output_file": final_state.get("output_file")
189
        }

八、API 服务#

1
from fastapi import FastAPI, HTTPException, BackgroundTasks
2
from fastapi.middleware.cors import CORSMiddleware
3
from pydantic import BaseModel
4
from typing import Optional, List
5
import os
6
from dotenv import load_dotenv
7

8
from ..workflows.research_flow import ResearchWorkflow
9

10
load_dotenv()
11

12
app = FastAPI(
13
    title="Research Agent API",
14
    description="AI 研究助手 API",
15
    version="1.0.0"
16
)
17

18
# CORS
19
app.add_middleware(
20
    CORSMiddleware,
21
    allow_origins=["*"],
22
    allow_credentials=True,
23
    allow_methods=["*"],
24
    allow_headers=["*"],
25
)
26

27
# 初始化工作流
28
workflow = ResearchWorkflow(os.getenv("OPENAI_API_KEY"))
29

30

31
# 请求模型
32
class ResearchRequest(BaseModel):
33
    topic: str
34
    depth: Optional[str] = "normal"
35
    analysis_type: Optional[str] = "comprehensive"
36
    format: Optional[str] = "markdown"
37

38

39
class ResearchResponse(BaseModel):
40
    success: bool
41
    topic: str
42
    report: Optional[str] = None
43
    output_file: Optional[str] = None
44
    error: Optional[str] = None
45

46

47
# 任务存储
48
tasks = {}
49

50

51
@app.post("/api/research", response_model=ResearchResponse)
52
async def create_research(request: ResearchRequest, background_tasks: BackgroundTasks):
53
    """创建研究任务"""
54
    import uuid
55

56
    task_id = str(uuid.uuid4())
57

58
    # 后台执行
59
    background_tasks.add_task(
60
        run_research_task,
61
        task_id,
62
        request
63
    )
64

65
    return ResearchResponse(
66
        success=True,
67
        topic=request.topic
68
    )
69

70

71
@app.get("/api/research/{task_id}")
72
async def get_research(task_id: str):
73
    """获取研究结果"""
74
    if task_id not in tasks:
75
        raise HTTPException(status_code=404, detail="Task not found")
76

77
    return tasks[task_id]
78

79

80
@app.get("/api/history")
81
async def get_history(limit: int = 10):
82
    """获取研究历史"""
83
    from ..tools.database import DatabaseTools
84
    db = DatabaseTools()
85
    return db.get_research_history(limit=limit)
86

87

88
def run_research_task(task_id: str, request: ResearchRequest):
89
    """执行研究任务"""
90
    try:
91
        result = workflow.run(
92
            topic=request.topic,
93
            depth=request.depth,
94
            analysis_type=request.analysis_type,
95
            format=request.format
96
        )
97

98
        tasks[task_id] = {
99
            "status": "completed",
100
            "result": result
101
        }
102
    except Exception as e:
103
        tasks[task_id] = {
104
            "status": "failed",
105
            "error": str(e)
106
        }
107

108

109
if __name__ == "__main__":
110
    import uvicorn
111
    uvicorn.run(app, host="0.0.0.0", port=8000)

九、部署与监控#

9.1 Docker 配置#

1
# Dockerfile
2

3
FROM python:3.11-slim
4

5
WORKDIR /app
6

7
# 安装依赖
8
COPY requirements.txt .
9
RUN pip install --no-cache-dir -r requirements.txt
10

11
# 复制代码
12
COPY . .
13

14
# 创建数据目录
15
RUN mkdir -p /app/data /app/output
16

17
# 暴露端口
18
EXPOSE 8000
19

20
# 启动命令
21
CMD ["python", "-m", "src.api.main"]

1
version: "3.8"
2

3
services:
4
  research-agent:
5
    build: .
6
    ports:
7
      - "8000:8000"
8
    environment:
9
      - OPENAI_API_KEY=${OPENAI_API_KEY}
10
      - SERPER_API_KEY=${SERPER_API_KEY}
11
      - TAVILY_API_KEY=${TAVILY_API_KEY}
12
    volumes:
13
      - ./data:/app/data
14
      - ./output:/app/output
15
    depends_on:
16
      - redis
17

18
  redis:
19
    image: redis:alpine
20
    ports:
21
      - "6379:6379"
22

23
  prometheus:
24
    image: prom/prometheus
25
    ports:
26
      - "9090:9090"
27
    volumes:
28
      - ./prometheus.yml:/etc/prometheus/prometheus.yml

9.2 监控配置#

1
from prometheus_client import Counter, Histogram, Gauge
2
import time
3
from functools import wraps
4

5
# 定义指标
6
RESEARCH_COUNT = Counter(
7
    'research_total',
8
    'Total number of research tasks'
9
)
10

11
RESEARCH_DURATION = Histogram(
12
    'research_duration_seconds',
13
    'Time spent on research tasks',
14
    buckets=[10, 30, 60, 120, 300, 600]
15
)
16

17
ACTIVE_RESEARCH = Gauge(
18
    'active_research',
19
    'Number of active research tasks'
20
)
21

22
TOOL_CALLS = Counter(
23
    'tool_calls_total',
24
    'Total number of tool calls',
25
    ['tool_name', 'status']
26
)
27

28

29
def monitor_research(func):
30
    """研究任务监控装饰器"""
31
    @wraps(func)
32
    def wrapper(*args, **kwargs):
33
        ACTIVE_RESEARCH.inc()
34
        RESEARCH_COUNT.inc()
35

36
        start_time = time.time()
37
        try:
38
            result = func(*args, **kwargs)
39
            return result
40
        finally:
41
            duration = time.time() - start_time
42
            RESEARCH_DURATION.observe(duration)
43
            ACTIVE_RESEARCH.dec()
44

45
    return wrapper
46

47

48
def track_tool_call(tool_name: str, success: bool):
49
    """记录工具调用"""
50
    status = "success" if success else "error"
51
    TOOL_CALLS.labels(tool_name=tool_name, status=status).inc()

十、使用示例#

10.1 命令行使用#

1
import asyncio
2
from src.workflows.research_flow import ResearchWorkflow
3
import os
4

5
async def main():
6
    workflow = ResearchWorkflow(os.getenv("OPENAI_API_KEY"))
7

8
    # 执行研究
9
    result = workflow.run(
10
        topic="AI Agent 在企业中的应用趋势",
11
        depth="deep",
12
        analysis_type="comprehensive"
13
    )
14

15
    print("=" * 50)
16
    print("研究报告")
17
    print("=" * 50)
18
    print(result["report"])
19
    print("=" * 50)
20
    print(f"输出文件: {result['output_file']}")
21

22
if __name__ == "__main__":
23
    asyncio.run(main())

10.2 API 调用#

1
# 创建研究任务
2
curl -X POST http://localhost:8000/api/research \
3
  -H "Content-Type: application/json" \
4
  -d '{
5
    "topic": "2024 年 AI 行业发展趋势",
6
    "depth": "normal",
7
    "analysis_type": "comprehensive"
8
  }'
9

10
# 获取结果
11
curl http://localhost:8000/api/research/{task_id}
12

13
# 获取历史
14
curl http://localhost:8000/api/history?limit=10

常见问题 FAQ#

Q1：如何处理大量搜索请求？

A：使用异步处理和缓存：

搜索结果缓存到 Redis
使用后台任务队列
限制并发请求数

Q2：如何提高报告质量？

A：

增加信息来源验证
使用更强的模型（GPT-4）
多轮迭代优化
添加人工审核环节

Q3：如何控制成本？

A：

使用更便宜的模型处理简单任务
缓存常用查询结果
限制搜索深度和次数
监控 token 使用量

Q4：如何扩展新的数据源？

A：

创建新的工具类
实现 @tool 装饰的函数
在 Agent 中注册工具
更新工作流配置

小结#

本文从零构建了一个完整的研究助手 Agent，涵盖：

1
┌─────────────────────────────────────────────────────────────┐
2
│                    项目总结                                  │
3
├─────────────────────────────────────────────────────────────┤
4
│                                                             │
5
│  架构设计：多 Agent 协作 + 状态机工作流                      │
6
│                                                             │
7
│  工具集成：搜索、数据库、文件、计算四大类                    │
8
│                                                             │
9
│  记忆系统：短期对话记忆 + 长期向量存储                       │
10
│                                                             │
11
│  API 服务：FastAPI + 后台任务 + Docker 部署                 │
12
│                                                             │
13
│  可观测性：Prometheus 指标 + 日志记录                        │
14
│                                                             │
15
└─────────────────────────────────────────────────────────────┘

这是一个可运行、可扩展的生产级 Agent 项目框架。

下篇预告#

《Agent 未来展望：AGI 之路》

探讨 Agent 技术的未来发展方向和挑战。