PaddleOCR-VL MCP 使用指南
更新时间:2025-11-28
背景说明
- 百度千帆提供PaddleOCR-VL服务,接口文档参考:https://cloud.baidu.com/doc/qianfan-api/s/zmho8omz3
- 同时也提供了PaddleOCR-VL的官方McpServer,GitHub 地址参考:https://github.com/PaddlePaddle/PaddleOCR/tree/main/mcp_server
前提准备
需要获取千帆平台 API-Key,可以登录平台创建:https://console.bce.baidu.com/qianfan/ais/console/apiKey。
使用指南
- 本文以 cherry studio 为例进行说明,可以无缝迁移至 cursor 等平台。
- 在 cherry studio 当中添加 mcp,以 json 形式创建,json 如下,注意主要替换成你的
qianfan-api-key。
JSON
1{
2 "mcpServers": {
3 "Qianfan-PaddleOCR-VL": {
4 "type": "stdio",
5 "description": "",
6 "command": "uvx",
7 "args": [
8 "--from",
9 "paddleocr-mcp",
10 "paddleocr_mcp"
11 ],
12 "env": {
13 "PADDLEOCR_MCP_PIPELINE": "PaddleOCR-VL",
14 "PADDLEOCR_MCP_PPOCR_SOURCE": "qianfan",
15 "PADDLEOCR_MCP_SERVER_URL": "https://qianfan.baidubce.com/v2/ocr",
16 "PADDLEOCR_MCP_QIANFAN_API_KEY": "qianfan-api-key"
17 }
18 }
19 }
20}
- 启用这个 mcp server,查看工具信息,如下图所示:

- 创建完毕以后,在 cherry studio 对话框当中选中Qianfan-PaddleOCR-VL这个工具,然后输入命令:
Bash
1识别图片:https://pplines-online.bj.bcebos.com/deploy/official/paddleocr/pp-ocr-vl//dcce4b6d-1a12-4741-b571-bd27cb574200/input_img_0.jpg?authorization=bce-auth-v1%2F5cfe9a5e1454405eb2a975c43eace6ec%2F2025-10-24T10%3A16%3A01Z%2F-1%2F%2F34dbe5163f75e0db030ba8a81f3ecdae00e7be74e052ac72ac2e57e0953de954
- 整体返回结果如下

