请求说明 请求示例 HTTP 方法: POST 请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/pen URL参数: 参数 值 access_token 通过API Key和Secret Key获取的access_token,参考“ Access Token获取 ” Header如下: 参数 值 Content-Type application/x-www-form-urlencoded
4096px 优先级 :image > url > pdf_file > ofd_file,当image、url字段存在时,pdf_file字段失效 pdf_file_num 否 string - 需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 ofd_file 和 image/url/pdf_file 四选一 string
请求说明 请求示例 HTTP 方法: POST 请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/paper_cut_edu URL参数: 参数 值 access_token 通过API Key和Secret Key获取的access_token,参考“ Access Token获取 ” Header如下: 参数 值 Content-Type application
example_data/ai-paper.pdf ) documents = loader.load() 5、切片 初始化vectorstore,使用PyMuPDFLoader加载PDF文件 from langchain.text_splitter import RecursiveCharacterTextSplitter text_splitter = RecursiveCharacterTextSplitter
doc-egdc1iziztwmech2.pdf?
请求示例 HTTP方法: POST 请求URL: https://aip.baidubce.com/rpc/2.0/wenxin/v1/extreme/textToImage URL参数: 参数 值 access_token 通过API Key和Secret Key获取的access_token,参考“ Access Token获取 ” Header如下: 参数 值 Content-Type application
dataset_group_id : 13813 , dataset_name : pdf_quality_bad } , { dataset_group_id : 13800 , dataset_name : pdf_quality3 } , { dataset_group_id : 13798 , dataset_name : pdf_quality2
pdf_file,当image字段存在时,url字段失效 请注意关闭URL防盗链 pdf_file 和 image/url 三选一 string - PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过10M,最短边至少15px,最长边最大8192px 优先级 :image > url > pdf_file,当image、url字段存在时,pdf_file
image > url > pdf_file > ofd_file,当image、url字段存在时,pdf_file字段失效 pdf_file_num 否 string - 需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 ofd_file 和 image/url/pdf_file 四选一 string - OFD文件,
exceeds the number of pdf pages 参数pdf_file_num大于PDF文件实际页数 216401 Create task failed 提交请求失败 216402 Query task failed 获取结果失败 216603 Check pdf page num failed 获取PDF文件页数失败,请检查PDF文件以及base64编码 216604 Insufficient