DeepSeek-OCR
更新时间:2025-12-13
接口文档
DeepSeek-OCR:https://cloud.baidu.com/doc/qianfan-api/s/6mhelwygh
使用指南
prompt指令
deepseek 官方提供 6 个示例指令,参考如下:
- 将文档内容转换为 markdown 格式:
<image>\n<|grounding|>Convert the document to markdown. - 对该图像进行文本识别:
<image>\n<|grounding|>OCR this image. - 不考虑版式,直接提取所有文本:
<image>\nFree OCR. - 解析文档中的图形或表格内容:
<image>\nParse the figure. - 详细描述图片内容:
<image>\nDescribe this image in detail. - 在图像中定位 <|ref|>xxxx<|/ref|> 的位置:
<image>\nLocate <|ref|>替换为需要定位的文本<|/ref|> in the image.
文档转Markdown
请求
Bash
1curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer your-api-key' \
4--data '{
5 "model": "deepseek-ocr",
6 "messages": [
7 {
8 "role": "user",
9 "content": [
10 {
11 "type": "text",
12 "text": "<image>\n<|grounding|>Convert the document to markdown."
13 },
14 {
15 "type": "image_url",
16 "image_url": {
17 "url": "https://pplines-online.bj.bcebos.com/deploy/official/paddleocr/pp-ocr-vl//7eb9ea58-fab4-447c-a9ca-d129e2802d5f/input_img_0.jpg?authorization=bce-auth-v1%2F5cfe9a5e1454405eb2a975c43eace6ec%2F2025-10-24T10%3A16%3A02Z%2F-1%2F%2Fa37912ea16e6d8c45e7eafab9d5631155c0a0351b4d6767ab600267c991aac98"
18 }
19 }
20 ]
21 }
22 ]
23}'
返回
JSON
1{
2 "id": "as-r9xyycc6up",
3 "object": "chat.completion",
4 "created": 1765590651,
5 "model": "deepseek-ocr",
6 "choices": [
7 {
8 "index": 0,
9 "message": {
10 "role": "assistant",
11 "content": "<|ref|>title<|/ref|><|det|>[[206, 132, 790, 157]]<|/det|>\n# DeepSeek-OCR: Contexts Optical Compression \n\n<|ref|>text<|/ref|><|det|>[[350, 187, 647, 203]]<|/det|>\nHaoran Wei, Yaofeng Sun, Yukun Li \n\n<|ref|>text<|/ref|><|det|>[[444, 215, 551, 230]]<|/det|>\nDeepSeek- AI \n\n<|ref|>sub_title<|/ref|><|det|>[[450, 263, 548, 283]]<|/det|>\n## Abstract \n\n<|ref|>text<|/ref|><|det|>[[115, 306, 883, 564]]<|/det|>\nWe present DeepSeek- OCR as an initial investigation into the feasibility of compressing long contexts via optical 2D mapping. DeepSeek- OCR consists of two components: DeepEncoder and DeepSeek3B- MoE- A570M as the decoder. Specifically, DeepEncoder serves as the core engine, designed to maintain low activations under high- resolution input while achieving high compression ratios to ensure an optimal and manageable number of vision tokens. Experiments show that when the number of text tokens is within 10 times that of vision tokens (i.e., a compression ratio \\(< 10x\\) ), the model can achieve decoding (OCR) precision of \\(97\\%\\) . Even at a compression ratio of \\(20x\\) , the OCR accuracy still remains at about \\(60\\%\\) . This shows considerable promise for research areas such as historical long- context compression and memory forgetting mechanisms in LLMs. Beyond this, DeepSeek- OCR also demonstrates high practical value. On OmniDocBench, it surpasses GOT- OCR2.0 (256 tokens/page) using only 100 vision tokens, and outperforms MinerU2.0 ( \\(6000+\\) tokens per page on average) while utilizing fewer than 800 vision tokens. In production, DeepSeek- OCR can generate training data for LLMs/VLMs at a scale of \\(200k+\\) pages per day (a single A100- 40G). Codes and model weights are publicly accessible at http://github.com/deepseek- ai/DeepSeek- OCR. \n\n<|ref|>image<|/ref|><|det|>[[137, 582, 868, 812]]<|/det|>\n<|ref|>image_caption<|/ref|><|det|>[[115, 827, 883, 892]]<|/det|>\n<center>Figure 1 | Figure (a) shows the compression ratio (number of text tokens in ground truth/number of vision tokens model used) testing on Fox [21] benchmark; Figure (b) shows performance comparisons on OmniDocBench [27]. DeepSeek-OCR can achieve state-of-the-art performance among end-to-end models enjoying the fewest vision tokens. </center>"
12 },
13 "finish_reason": "stop",
14 "flag": 0
15 }
16 ],
17 "usage": {
18 "prompt_tokens": 21,
19 "completion_tokens": 674,
20 "total_tokens": 695
21 }
22}
通用OCR
请求
Bash
1curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer your-api-key' \
4--data '{
5 "model": "deepseek-ocr",
6 "messages": [
7 {
8 "role": "user",
9 "content": [
10 {
11 "type": "text",
12 "text": "<image>\n<|grounding|>OCR this image."
13 },
14 {
15 "type": "image_url",
16 "image_url": {
17 "url": "https://pplines-online.bj.bcebos.com/deploy/official/paddleocr/pp-ocr-vl//7eb9ea58-fab4-447c-a9ca-d129e2802d5f/input_img_0.jpg?authorization=bce-auth-v1%2F5cfe9a5e1454405eb2a975c43eace6ec%2F2025-10-24T10%3A16%3A02Z%2F-1%2F%2Fa37912ea16e6d8c45e7eafab9d5631155c0a0351b4d6767ab600267c991aac98"
18 }
19 }
20 ]
21 }
22 ]
23}'
返回
JSON
1{
2 "id": "as-z1c5yi3jcf",
3 "object": "chat.completion",
4 "created": 1765593203,
5 "model": "deepseek-ocr",
6 "choices": [
7 {
8 "index": 0,
9 "message": {
10 "role": "assistant",
11 "content": "<|ref|>助力双方交往<|/ref|><|det|>[[90, 25, 460, 88]]<|/det|>\n<|ref|>搭建友谊桥梁<|/ref|><|det|>[[530, 25, 904, 88]]<|/det|>\n<|ref|>本报记者沈小晓任彦黄培昭<|/ref|><|det|>[[390, 115, 608, 130]]<|/det|>\n<|ref|>身着中国传统民族服装的丘立特里亚青<|/ref|><|det|>[[29, 144, 240, 159]]<|/det|>\n<|ref|>丘立特里亚高等教育与研究院合作建立,开<|/ref|><|det|>[[260, 144, 485, 159]]<|/det|>\n<|ref|>年依次登台表演中国民族舞、现代舞、扇子舞<|/ref|><|det|>[[7, 163, 240, 178]]<|/det|>\n<|ref|>设了中国语言课程和中国文化课程,注册学<|/ref|><|det|>[[260, 163, 485, 178]]<|/det|>\n<|ref|>等,曼妙的舞姿赢得现场观众阵阵掌声。这<|/ref|><|det|>[[7, 182, 240, 196]]<|/det|>\n<|ref|>生2万余人次。10余年来,丘特瓦陀已成为<|/ref|><|det|>[[260, 182, 485, 196]]<|/det|>\n<|ref|>是目前丘立特里亚高等教育与研究院孔子学<|/ref|><|det|>[[7, 201, 240, 215]]<|/det|>\n<|ref|>当地民众了解中国的一扇窗口。<|/ref|><|det|>[[260, 201, 415, 215]]<|/det|>\n<|ref|>院(以下简称“丘特瓦陀\")举办“喜迎新年\"中国<|/ref|><|det|>[[6, 219, 240, 234]]<|/det|>\n<|ref|>黄鸣飞表示,随着来学习中文的人日益<|/ref|><|det|>[[280, 219, 485, 234]]<|/det|>\n<|ref|>歌舞比赛的场景。<|/ref|><|det|>[[6, 238, 95, 253]]<|/det|>\n<|ref|>增多,阿斯马拉大学教学点已难以满足教学<|/ref|><|det|>[[260, 238, 485, 253]]<|/det|>\n<|ref|>中国和丘立特里亚传统友谊深厚。近年<|/ref|><|det|>[[29, 256, 240, 271]]<|/det|>\n<|ref|>需要。2024年4月,由中企蜀道集团所属四<|/ref|><|det|>[[260, 256, 485, 271]]<|/det|>\n<|ref|>来,在高质量共建“一带一路”框架下,中厄两<|/ref|><|det|>[[6, 275, 240, 290]]<|/det|>\n<|ref|>川路桥承建的孔院教学楼项目在阿斯马拉开<|/ref|><|det|>[[260, 275, 485, 290]]<|/det|>\n<|ref|>国人文交流不断深化,互利合作的民意基础<|/ref|><|det|>[[6, 293, 240, 308]]<|/det|>\n<|ref|>工建设,预计今年上半年竣工,建成后将为厄<|/ref|><|det|>[[260, 293, 485, 308]]<|/det|>\n<|ref|>日益深厚。<|/ref|><|det|>[[6, 312, 59, 327]]<|/det|>\n<|ref|>特瓦陀提供全新的办学场地。<|/ref|><|det|>[[260, 312, 405, 327]]<|/det|>\n<|ref|>“学好中文,我们的<|/ref|><|det|>[[57, 336, 222, 355]]<|/det|>\n<|ref|>“在中国学习的经历<|/ref|><|det|>[[303, 336, 470, 355]]<|/det|>\n<|ref|>未来不是梦”<|/ref|><|det|>[[18, 360, 120, 379]]<|/det|>\n<|ref|>让我看到更广阔的世界”<|/ref|><|det|>[[272, 360, 465, 379]]<|/det|>\n<|ref|>“鲜花曾告诉我你怎样走过,大地知道你<|/ref|><|det|>[[29, 393, 240, 408]]<|/det|>\n<|ref|>多年来,丘立特里亚广大赴华留学生和<|/ref|><|det|>[[280, 393, 485, 408]]<|/det|>\n<|ref|>心中的每一个角落·…\"丘立特里亚阿斯马拉<|/ref|><|det|>[[7, 412, 240, 427]]<|/det|>\n<|ref|>培训人员积极投身国家建设,成为助力该国<|/ref|><|det|>[[260, 412, 485, 427]]<|/det|>\n<|ref|>大学综合楼二层,一阵优美的歌声在走廊里回<|/ref|><|det|>[[7, 431, 240, 445]]<|/det|>\n<|ref|>发展的人才和币中友好的见证者和推动者。<|/ref|><|det|>[[260, 431, 475, 445]]<|/det|>\n<|ref|>响。循着熟悉的旋律轻轻推开一间教室的门,<|/ref|><|det|>[[6, 449, 240, 464]]<|/det|>\n<|ref|>在丘立特里亚全国妇女联盟工作的约翰<|/ref|><|det|>[[280, 449, 485, 464]]<|/det|>\n<|ref|>学生们正跟着老师学唱中文歌曲(同一首歌)。<|/ref|><|det|>[[6, 468, 235, 483]]<|/det|>\n<|ref|>娜·特韦尔德·凯莱塔就是其中一位。她曾在<|/ref|><|det|>[[260, 468, 485, 483]]<|/det|>\n<|ref|>这是丘特瓦陀阿斯马拉大学教学点的一<|/ref|><|det|>[[29, 487, 240, 501]]<|/det|>\n<|ref|>中华女子学院攻读硕士学位,研究方向是女<|/ref|><|det|>[[260, 487, 485, 501]]<|/det|>\n<|ref|>节中文歌曲课。为了让学生们更好地理解歌<|/ref|><|det|>[[6, 505, 240, 520]]<|/det|>\n<|ref|>性领导力与社会发展。其间,她实地走访中国<|/ref|><|det|>[[260, 505, 485, 520]]<|/det|>\n<|ref|>词大意,老师尤斯拉·穆罕默德萨尔·侯赛因逐<|/ref|><|det|>[[6, 524, 240, 539]]<|/det|>\n<|ref|>多个地区,获得了观察中国社会发展的第一<|/ref|><|det|>[[260, 524, 485, 539]]<|/det|>\n<|ref|>字翻译和解释歌词。随着伴奏声响起,学生们<|/ref|><|det|>[[6, 543, 240, 558]]<|/det|>\n<|ref|>手资料。<|/ref|><|det|>[[260, 543, 303, 558]]<|/det|>\n<|ref|>中国驻丘立特里亚大使馆供图<|/ref|><|det|>[[820, 536, 972, 550]]<|/det|>\n<|ref|>边唱边随着节拍摇动身体,现场气氛热烈。<|/ref|><|det|>[[6, 561, 215, 576]]<|/det|>\n<|ref|>谈起在中国求学的经历,约翰娜记忆犹<|/ref|><|det|>[[280, 561, 485, 576]]<|/det|>\n<|ref|>“这是中文歌曲初级班,共有32人。学<|/ref|><|det|>[[29, 580, 240, 595]]<|/det|>\n<|ref|>新:“中国的发展在当今世界是独一无二的。<|/ref|><|det|>[[260, 580, 485, 595]]<|/det|>\n<|ref|>“不管远近都是客人,请不用客气;相约<|/ref|><|det|>[[530, 570, 744, 585]]<|/det|>\n<|ref|>瓦的北红海省博物馆。<|/ref|><|det|>[[760, 570, 872, 585]]<|/det|>\n<|ref|>生大部分来自首都阿斯马拉的中小学,年龄<|/ref|><|det|>[[6, 599, 240, 614]]<|/det|>\n<|ref|>沿着中国特色社会主义道路坚定前行,中国<|/ref|><|det|>[[260, 599, 485, 614]]<|/det|>\n<|ref|>好了在一起,我们欢迎你…·”在一场中厄青<|/ref|><|det|>[[505, 589, 744, 604]]<|/det|>\n<|ref|>博物馆二层陈列着一个发掘自阿杜利<|/ref|><|det|>[[782, 589, 989, 604]]<|/det|>\n<|ref|>最小的仅有6岁。”尤斯拉告诉记者。<|/ref|><|det|>[[6, 617, 181, 632]]<|/det|>\n<|ref|>创造了发展奇迹,这一切都离不开中国共产党<|/ref|><|det|>[[260, 617, 485, 632]]<|/det|>\n<|ref|>年联谊活动上,四川路桥中方员工同当地大<|/ref|><|det|>[[505, 608, 744, 623]]<|/det|>\n<|ref|>斯古城的中国古代陶制酒器,罐身上写着<|/ref|><|det|>[[760, 608, 989, 623]]<|/det|>\n<|ref|>尤斯拉今年23岁,是丘立特里亚一所公立<|/ref|><|det|>[[29, 636, 240, 651]]<|/det|>\n<|ref|>的领导。中国的发展经验值得许多国家学习<|/ref|><|det|>[[260, 636, 485, 651]]<|/det|>\n<|ref|>学生合唱《北京欢迎你》。丘立特里亚技术学<|/ref|><|det|>[[505, 628, 744, 643]]<|/det|>\n<|ref|>“万”“和”“禅”“山”等汉字。“这件文物证<|/ref|><|det|>[[760, 628, 989, 643]]<|/det|>\n<|ref|>学校的艺术老师。她12岁开始在厄特瓦学院<|/ref|><|det|>[[6, 655, 240, 670]]<|/det|>\n<|ref|>借鉴。”<|/ref|><|det|>[[260, 655, 301, 670]]<|/det|>\n<|ref|>院计算机科学与工程专业学生鲁夫塔·谢拉<|/ref|><|det|>[[505, 647, 744, 662]]<|/det|>\n<|ref|>明,很早以前我们就通过海上丝绸之路进行<|/ref|><|det|>[[760, 647, 989, 662]]<|/det|>\n<|ref|>习中文,在2017年第十届“汉语桥”世界中学生<|/ref|><|det|>[[6, 673, 240, 688]]<|/det|>\n<|ref|>正在西南大学学习的丘立特里亚博士生<|/ref|><|det|>[[280, 673, 485, 688]]<|/det|>\n<|ref|>是其中一名演唱者,她很早便在孔院学习中<|/ref|><|det|>[[505, 666, 744, 681]]<|/det|>\n<|ref|>贸易往来与文化交流。这也是丘立特里亚<|/ref|><|det|>[[760, 666, 989, 681]]<|/det|>\n<|ref|>中文比赛中获得丘立特里亚赛区第一名,并和<|/ref|><|det|>[[6, 692, 240, 707]]<|/det|>\n<|ref|>穆卢盖塔·泽穆伊对中国怀有深厚感情。8<|/ref|><|det|>[[260, 692, 485, 707]]<|/det|>\n<|ref|>文,一直在为去中国留学作准备。“这句歌词<|/ref|><|det|>[[505, 685, 744, 700]]<|/det|>\n<|ref|>与中国友好交往历史的有力证明。”北红海<|/ref|><|det|>[[760, 685, 989, 700]]<|/det|>\n<|ref|>同伴代表丘立特里亚前往中国参加决赛,获得<|/ref|><|det|>[[6, 711, 240, 725]]<|/det|>\n<|ref|>年前,在北京师范大学获得硕士学位后,穆卢<|/ref|><|det|>[[260, 711, 485, 725]]<|/det|>\n<|ref|>是我们两国人民友谊的生动写照。无论是投<|/ref|><|det|>[[505, 704, 744, 719]]<|/det|>\n<|ref|>省博物馆研究与文献部负责人伊萨亚斯·特<|/ref|><|det|>[[760, 704, 989, 719]]<|/det|>\n<|ref|>团体优胜奖。2022年起,尤斯拉开始在厄特瓦<|/ref|><|det|>[[6, 729, 240, 744]]<|/det|>\n<|ref|>盖塔在社交媒体上写下这样一段话:“这是我<|/ref|><|det|>[[260, 729, 485, 744]]<|/det|>\n<|ref|>身于丘立特里亚基础设施建设的中金员工,<|/ref|><|det|>[[505, 723, 744, 738]]<|/det|>\n<|ref|>斯法兹吉说。<|/ref|><|det|>[[760, 723, 824, 738]]<|/det|>\n<|ref|>院兼职教授中文歌曲,每周末两个课时。”中国<|/ref|><|det|>[[6, 748, 240, 763]]<|/det|>\n<|ref|>人生的重要一步,自此我拥有了一双坚固的<|/ref|><|det|>[[260, 748, 485, 763]]<|/det|>\n<|ref|>还是在中国留学的丘立特里亚学子,两国人<|/ref|><|det|>[[505, 742, 744, 757]]<|/det|>\n<|ref|>丘立特里亚国家博物馆考古学和人类学<|/ref|><|det|>[[782, 742, 989, 757]]<|/det|>\n<|ref|>文化博大精深,我希望我的学生们能够通过中<|/ref|><|det|>[[6, 767, 240, 782]]<|/det|>\n<|ref|>鞋子,赋予我穿越荆棘的力量。”<|/ref|><|det|>[[260, 767, 419, 782]]<|/det|>\n<|ref|>民携手努力,必将推动两国关系不断向前发<|/ref|><|det|>[[505, 761, 744, 776]]<|/det|>\n<|ref|>研究员菲尔蒙·特韦尔德十分喜爱中国文<|/ref|><|det|>[[760, 761, 989, 776]]<|/det|>\n<|ref|>文歌曲更好地理解中国文化。”她说。<|/ref|><|det|>[[6, 786, 181, 801]]<|/det|>\n<|ref|>“姐姐,你想去中国吗?”“非常想!我想<|/ref|><|det|>[[29, 805, 240, 820]]<|/det|>\n<|ref|>穆卢盖塔密切关注中国在经济、科技、教<|/ref|><|det|>[[280, 785, 485, 800]]<|/det|>\n<|ref|>育等领域的发展,“中国在科研等方面的实力<|/ref|><|det|>[[260, 804, 485, 819]]<|/det|>\n<|ref|>丘立特里亚高等教育委员会主任助理萨<|/ref|><|det|>[[530, 800, 744, 815]]<|/det|>\n<|ref|>化。他表示:“学习彼此的语言和文化,将帮<|/ref|><|det|>[[760, 800, 989, 815]]<|/det|>\n<|ref|>化。他表示:“学习彼此的语言和文化,将帮<|/ref|><|det|>[[760, 780, 989, 795]]<|/det|>\n<|ref|>助尼中两国人民更好地理解彼此,助力双方<|/ref|><|det|>[[760, 799, 989, 814]]<|/det|>\n<|ref|>去看故宫、爬长城。”尤斯拉的学生中有一对<|/ref|><|det|>[[6, 825, 240, 840]]<|/det|>\n<|ref|>与日俱增。在中国学习的经历让我看到更广<|/ref|><|det|>[[260, 825, 485, 840]]<|/det|>\n<|ref|>马瑞表示:“每年我们都会组织学生到中国访<|/ref|><|det|>[[505, 819, 744, 834]]<|/det|>\n<|ref|>交往,搭建友谊桥梁。”<|/ref|><|det|>[[760, 819, 876, 834]]<|/det|>\n<|ref|>能歌善舞的姐妹,姐姐露姬今年15岁,妹妹<|/ref|><|det|>[[6, 844, 240, 859]]<|/det|>\n<|ref|>阔的世界,从中受益匪浅。”<|/ref|><|det|>[[260, 844, 395, 859]]<|/det|>\n<|ref|>月,目前有超过5000名丘立特里亚学生<|/ref|><|det|>[[505, 838, 744, 853]]<|/det|>\n<|ref|>丘立特里亚国家博物馆馆长塔吉丁·努<|/ref|><|det|>[[782, 838, 989, 853]]<|/det|>\n<|ref|>莉娅14岁,两人都已在厄特瓦学院习多年,妹妹<|/ref|><|det|>[[6, 863, 240, 878]]<|/det|>\n<|ref|>23岁的莉迪亚·埃斯蒂法诺斯已在厄特<|/ref|><|det|>[[280, 863, 485, 878]]<|/det|>\n<|ref|>在中国留学。学习中国的教育经验,有助于<|/ref|><|det|>[[505, 857, 744, 872]]<|/det|>\n<|ref|>里达姆·优素福曾多次访问中国,对中华文明<|/ref|><|det|>[[760, 857, 989, 872]]<|/det|>\n<|ref|>中文说得格外流利。<|/ref|><|det|>[[6, 882, 101, 897]]<|/det|>\n<|ref|>瓦学院学习3年,在中国书法、中国画等方面表<|/ref|><|det|>[[260, 882, 485, 897]]<|/det|>\n<|ref|>提升丘立特里亚的教育水平。”<|/ref|><|det|>[[505, 876, 664, 891]]<|/det|>\n<|ref|>的传承与创新、现代化博物馆的建设与发展<|/ref|><|det|>[[760, 876, 989, 891]]<|/det|>\n<|ref|>露娅对记者说:“这些年来,怀着对中文<|/ref|><|det|>[[29, 901, 240, 916]]<|/det|>\n<|ref|>现十分优秀,在2024年丘立特里亚赛区约<|/ref|><|det|>[[260, 901, 485, 916]]<|/det|>\n<|ref|>“共同向世界展示非<|/ref|><|det|>[[550, 901, 720, 919]]<|/det|>\n<|ref|>印象深刻。”中国博物馆不仅有许多保存完好<|/ref|><|det|>[[760, 895, 989, 910]]<|/det|>\n<|ref|>和中国文化的热爱,我们姐妹俩始终相互鼓<|/ref|><|det|>[[6, 920, 240, 935]]<|/det|>\n<|ref|>“汉语桥”比赛中获得一等奖。莉迪亚说:“学<|/ref|><|det|>[[260, 920, 485, 935]]<|/det|>\n<|ref|>洲和亚洲的灿烂文明”<|/ref|><|det|>[[515, 923, 701, 941]]<|/det|>\n<|ref|>的传承与创新、现代化博物馆的建设与发展<|/ref|><|det|>[[760, 914, 989, 929]]<|/det|>\n<|ref|>助人们更好理解中华文明。”塔吉丁说,“厄<|/ref|><|det|>[[760, 933, 989, 948]]<|/det|>\n<|ref|>励,一起学习。我们的中文一天比一天好,还<|/ref|><|det|>[[6, 939, 240, 954]]<|/det|>\n<|ref|>孔子对中文和中国的文化非常重视,对中文<|/ref|><|det|>[[260, 939, 485, 954]]<|/det|>\n<|ref|>中国驻丘立特里亚大使馆供图<|/ref|><|det|>[[820, 949, 972, 963]]<|/det|>\n<|ref|>会得格外流利。<|/ref|><|det|>[[6, 958, 81, 973]]<|/det|>\n<|ref|>现十分优秀,在2024年丘立特里亚赛区的<|/ref|><|det|>[[260, 958, 485, 973]]<|/det|>\n<|ref|>尤斯拉说:“中国传统文化博大精深,对中文<|/ref|><|det|>[[760, 961, 989, 976]]<|/det|>\n<|ref|>露娅对记者说:“这些年来,怀着对中文<|/ref|><|det|>[[29, 978, 240, 992]]<|/det|>\n<|ref|>也喜欢中国的服饰,希望未来能去中国学习,<|/ref|><|det|>[[260, 978, 485, 992]]<|/det|>\n<|ref|>从阿斯马拉出发,沿着蜿蜒曲折的盘山<|/ref|><|det|>[[530, 972, 744, 987]]<|/det|>\n<|ref|>的传统文化,充分运用先进科技手段进行展示,<|/ref|><|det|>[[760, 978, 989, 992]]<|/det|>\n<|ref|>并学习中文和中国的文化,希望将来能去中国学<|/ref|><|det|>[[6, 996, 240, 11]]<|/det|>\n<|ref|>孔子对中文和中国的文化非常重视,对中文<|/ref|><|det|>[[6, 995, 240, 10]]<|/det|>\n<|ref|>的中国朋友。”<|/ref|><|det|>[[260, 996, 331, 011]]<|/det|>\n<|ref|>中国的发展。”<|/ref|><|det|>[[260, 986, 331, 997]]<|/det|>\n<|ref|>过,作者来到位于丘立特里亚港口城市马萨<|/ref|><|det|>[[505, 990, 744, 997]]<|/det|>\n<|ref|>烂文明。”<|/ref|><|det|>[[760, 986, 804, 997]]<|/det|>"
12 },
13 "finish_reason": "stop",
14 "flag": 0
15 }
16 ],
17 "usage": {
18 "prompt_tokens": 18,
19 "completion_tokens": 6116,
20 "total_tokens": 6134
21 }
22}
无布局提取
请求
Bash
1curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer your-api-key' \
4--data '{
5 "model": "deepseek-ocr",
6 "messages": [
7 {
8 "role": "user",
9 "content": [
10 {
11 "type": "text",
12 "text": "<image>\nFree OCR."
13 },
14 {
15 "type": "image_url",
16 "image_url": {
17 "url": "https://pplines-online.bj.bcebos.com/deploy/official/paddleocr/pp-ocr-vl//7eb9ea58-fab4-447c-a9ca-d129e2802d5f/input_img_0.jpg?authorization=bce-auth-v1%2F5cfe9a5e1454405eb2a975c43eace6ec%2F2025-10-24T10%3A16%3A02Z%2F-1%2F%2Fa37912ea16e6d8c45e7eafab9d5631155c0a0351b4d6767ab600267c991aac98"
18 }
19 }
20 ]
21 }
22 ]
23}'
返回
JSON
1{
2 "id": "as-1epkq0dbis",
3 "object": "chat.completion",
4 "created": 1765593345,
5 "model": "deepseek-ocr",
6 "choices": [
7 {
8 "index": 0,
9 "message": {
10 "role": "assistant",
11 "content": "# 助力双方交往 搭建友谊桥梁\n\n本报记者 沈小晓 任 彦 黄培昭\n\n身看中国传统民族服装的厄立特里亚青年依次登台表演中国民族舞、现代舞、扇子舞等,曼妙的舞姿赢得现场观众阵阵掌声。这是日前厄立特里亚高等教育与研究院孔子学院(以下简称“厄特瓦院”)举办“喜迎新年”中国歌舞比赛的场景。\n\n中国和厄立特里亚传统友谊深厚。近年来,在高质量共建“一带一路”框架下,中厄两国人文交流不断深化,互利合作的民意基础日益深厚。\n\n## “学好中文,我们的未来不是梦”\n\n“鲜花曾告诉我你怎样走过,大地知道你心中的每一个角落……”厄立特里亚阿斯马拉大学综合楼二层,一阵优美的歌声在走廊里回响。循着熟悉的旋律轻轻推开一间教室的门,学生们正跟着老师学唱中文歌曲《同一首歌》。\n\n这是厄特瓦院阿斯马拉大学教学点的一节中文歌曲课。为了让学生们更好地理解歌词大意,老师尤斯拉·穆罕默德萨尔·侯赛因逐字翻译和解释歌词。随着伴奏声响起,学生们边唱边随着节拍摇动身体,现场气氛热烈。\n\n“这是中文歌曲初级班,共有32人。学生大部分来自首都阿斯马拉的中小学,年龄最小的仅有6岁。”尤斯拉告诉记者。\n\n尤斯拉今年23岁,是厄立特里亚一所公立学校的艺术老师。她12岁开始在厄特瓦学院学习中文,在2017年第十届“汉语桥”世界中学生中文比赛中获得厄立特里亚赛区第一名,并和同伴代表厄立特里亚前往中国参加决赛,获得团体优胜奖。2022年起,尤斯拉开始在厄特瓦院兼职教授中文歌曲,每周末两个课时。“中国文化博大精深,我希望我的学生们能够通过中文歌曲更好地理解中国文化。”她说。\n\n“姐姐,你想去中国吗?”“非常想!我想去看故宫、爬长城。”尤斯拉的学生中有一对能歌善舞的姐妹,姐姐露姬今年15岁,妹妹莉娅14岁,两人都已在厄特瓦学院学习多年,中文说得格外流利。\n\n露姬对记者说:“这些年来,怀着对中文和中国文化的热爱,我们姐妹俩始终相互鼓励,一起学习。我们的中文一天比一天好,还学会了中文歌和中国舞。我们一定要到中国去。学好中文,我们的未来不是梦!”\n\n据厄特瓦院中方院长黄鸣飞介绍,这所学院成立于2013年3月,由贵州财经大学和\n\n厄立特里亚高等教育与研究院合作建立,开设了中国语言课程和中国文化课程,注册学生2万余人次。10余年来,厄特瓦院已成为当地民众了解中国的一扇窗口。\n\n黄鸣飞表示,随着来学习中文的人日益增多,阿斯马拉大学教学点已难以满足教学需要。2024年4月,由中企蜀道集团所属四川路桥承建的孔院教学楼项目在阿斯马拉开工建设,预计今年上半年竣工,建成后将为厄特瓦院提供全新的办学场地。\n\n## “在中国学习的经历让我看到更广阔的世界”\n\n多年来,厄立特里亚广大赴华留学生和培训人员积极投身国家建设,成为助力该国发展的人才和中厄友好的见证者和推动者。\n\n在厄立特里亚全国妇女联盟工作的约翰娜·特韦尔德·凯莱塔就是其中一位。她曾在中华女子学院攻读硕士学位,研究方向是女性领导力与社会发展。其间,她实地走访中国多个地区,获得了观察中国社会发展的第一手资料。\n\n谈起在中国求学的经历,约翰娜记忆犹新:“中国的发展在当今世界是独一无二的。沿着中国特色社会主义道路坚定前行,中国创造了发展奇迹,这一切都离不开中国共产党领导。中国的发展经验值得许多国家学习借鉴。”\n\n正在西南大学学习的厄立特里亚博士生穆卢盖塔·泽穆伊对中国怀有深厚感情。8年前,在北京师范大学获得硕士学位后,穆卢盖塔在社交媒体上写下这样一段话:“这是我人生的重要一步,自此我拥有了一双坚固的鞋子,赋予我穿越荆棘的力量。”\n\n穆卢盖塔密切关注中国在经济、科技、教育等领域的发展,“中国在科研等方面的实力与日俱增。在中国学习的经历让我看到更广阔的世界,从中受益匪浅。”\n\n23岁的莉迪亚·埃斯蒂法诺斯已在厄特瓦院学习3年,在中国书法、中国画等方面表现十分优秀,在2024年厄立特里亚赛区的“汉语桥”比赛中获得一等奖。莉迪亚说:“学习中国书法让我的内心变得安宁和纯粹。我也喜欢中国的服饰,希望未来能去中国学习,把中国不同民族元素融入服装设计中,创作出更多精美作品,也把厄特文化分享给更多的中国朋友。”\n\n在厄立特里亚不久前举办的第六届中国风筝文化节上,当地小学生体验风筝制作。\n\n中国驻厄立特里亚大使馆供图\n\n“不管远近都是客人,请不用客气;相约好了在一起,我们欢迎你……”在一场中厄青年联谊活动上,四川路桥中方员工同当地大学生合唱《北京欢迎你》。厄立特里亚技术学院计算机科学与工程专业学生鲁夫塔·谢拉是其中一名演唱者,她很早便在孔院学习中文,一直在为去中国留学作准备。“这句歌词是我们两国人民友谊的生动写照。无论是投身于厄立特里亚基础设施建设的中企员工,还是在中国留学的厄立特里亚学子,两国人民携手努力,必将推动两国关系不断向前发展。”鲁夫塔说。\n\n厄立特里亚高等教育委员会主任助理萨马瑞表示:“每年我们都会组织学生到中国访问学习,目前有超过5000名厄立特里亚学生在中国留学。学习中国的教育经验,有助于提升厄立特里亚的教育水平。”\n\n## “共同向世界展示非洲和亚洲的灿烂文明”\n\n从阿斯马拉出发,沿着蜿蜒曲折的盘山公路一路向东寻找丝路印迹。驱车两个小时,记者来到位于厄立特里亚港口城市马萨\n\n瓦的北红海省博物馆。\n\n博物馆二层陈列着一个发掘自阿杜利斯古城的中国古代陶制酒器,罐身上写着“万”和“禅”“山”等汉字。“这件文物证明,很早以前我们就通过海上丝绸之路进行贸易往来与文化交流。这也是厄立特里亚与中国友好交往历史的有力证明。”北红海省博物馆研究与文献部负责人伊萨亚斯·特斯法兹吉说。\n\n厄立特里亚国家博物馆考古学和人类学研究员菲尔蒙·特韦尔德十分喜爱中国文化。他表示:“学习彼此的语言和文化,将帮助厄中两国人民更好地理解彼此,助力双方交往,搭建友谊桥梁。”\n\n厄立特里亚国家博物馆馆长塔吉丁·努里达姆·优素福曾多次访问中国,对中华文明的传承与创新、现代化博物馆的建设与发展印象深刻。“中国博物馆不仅有许多保存完好的文物,还充分运用先进科技手段进行展示,帮助人们更好理解中华文明。”塔吉丁说,“厄立特里亚与中国都拥有悠久的文明,始终相互理解、相互尊重。我希望未来与中国同行加强合作,共同向世界展示非洲和亚洲的灿烂文明。”\n\n在厄立特里亚,"
12 },
13 "finish_reason": "stop",
14 "flag": 0
15 }
16 ],
17 "usage": {
18 "prompt_tokens": 11,
19 "completion_tokens": 1501,
20 "total_tokens": 1512
21 }
22}
图表解析
请求
Bash
1curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer your-api-key' \
4--data '{
5 "model": "deepseek-ocr",
6 "messages": [
7 {
8 "role": "user",
9 "content": [
10 {
11 "type": "text",
12 "text": "<image>\nParse the figure."
13 },
14 {
15 "type": "image_url",
16 "image_url": {
17 "url": "https://merterbak-deepseek-ocr-demo.hf.space/gradio_api/file=/tmp/gradio/334d06d28393091610ed3878925a79b6335794b207760fc177b43011cc56609b/ocr.jpg"
18 }
19 }
20 ]
21 }
22 ]
23}'
返回
JSON
1{
2 "id": "as-nb64mygu62",
3 "object": "chat.completion",
4 "created": 1765593384,
5 "model": "deepseek-ocr",
6 "choices": [
7 {
8 "index": 0,
9 "message": {
10 "role": "assistant",
11 "content": "这是一张关于“助力双方交往 搭建友谊桥梁”的图片报道。图片中展示了几位身穿传统服饰的年轻人正在进行交流和学习活动。\n\n图片的左上角有一行大字标题:“助力双方交往 搭建友谊桥梁”。标题下方是两位年轻人的照片,他们坐在一张桌子旁,似乎在进行讨论或学习。其中一位年轻女性穿着白色上衣,黑色裤子,头发扎成一个马尾辫;另一位年轻男性穿着深色上衣,白色裤子,头发也扎成一个马尾辫。\n\n图片的右侧有一段文字说明,介绍了图片中的人物背景和他们所参与的活动内容。这段文字说明了图片的主题,即通过帮助双方交流和学习,增进彼此之间的了解和友谊。\n\n图片的左下角还有一段较小的文字,进一步描述了图片中的人物和他们所参与的活动内容。这段文字说明了图片中的人物背景和他们所参与的活动内容。\n\n总的来说,这张图片主要展示了两个年轻人之间的互动和学习活动,强调了通过帮助双方交流和学习,增进彼此之间的了解和友谊的主题。"
12 },
13 "finish_reason": "stop",
14 "flag": 0
15 }
16 ],
17 "usage": {
18 "prompt_tokens": 12,
19 "completion_tokens": 199,
20 "total_tokens": 211
21 }
22}
图像描述
请求
Bash
1curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer your-api-key' \
4--data '{
5 "model": "deepseek-ocr",
6 "messages": [
7 {
8 "role": "user",
9 "content": [
10 {
11 "type": "text",
12 "text": "<image>\nDescribe this image in detail."
13 },
14 {
15 "type": "image_url",
16 "image_url": {
17 "url": "https://pplines-online.bj.bcebos.com/deploy/official/paddleocr/pp-ocr-vl//7eb9ea58-fab4-447c-a9ca-d129e2802d5f/input_img_0.jpg?authorization=bce-auth-v1%2F5cfe9a5e1454405eb2a975c43eace6ec%2F2025-10-24T10%3A16%3A02Z%2F-1%2F%2Fa37912ea16e6d8c45e7eafab9d5631155c0a0351b4d6767ab600267c991aac98"
18 }
19 }
20 ]
21 }
22 ]
23}'
返回
JSON
1{
2 "id": "as-6tujhpncnq",
3 "object": "chat.completion",
4 "created": 1765593435,
5 "model": "deepseek-ocr",
6 "choices": [
7 {
8 "index": 0,
9 "message": {
10 "role": "assistant",
11 "content": "This image is divided into three main sections:\n\n1. **Top Section**:\n - The title reads \"助力双方交往\" (Assisting Both Sides to Interact) on top left.\n - On the right side under the same heading, another line says \"搭建友谊桥梁\" (Building Friendship Bridges).\n\n2. **Middle Section - Left Side**:\n - This section contains Chinese texts discussing various aspects related to international relations between China and other countries.\n\n3. **Middle Section - Right Side**:\n - There's also some English text that translates roughly to something like \"In the past year alone, more than ten million people have visited our country through our official websites.\"\n\n4. **Bottom Section**:\n - Contains additional details about the author’s experience working abroad and how they helped build bridges across different cultures.\n\n5. **Visual Elements**:\n - A photo showing four individuals sitting around a table engaged in conversation during what appears to be a discussion session.\n \n6. **Text Style & Layout**:\n - The layout includes both bold headings (\"助力双方交往\", \"搭建友谊桥梁\") followed by smaller subheadings which provide detailed explanations beneath them.\n - Textual elements include quotes within quotes indicating direct quotations from experts' opinions regarding international relations and cultural exchange programs.\n\n7. **Aesthetic Details**:\n - The overall design uses clean lines and minimalistic fonts typical of professional reports or articles found in academic journals or business publications.\n \n8. **Language Used**:\n - Predominantly written in Simplified Chinese Characters used primarily in Mainland China.\n\n9. **Image Type**:\n - It looks like a scanned document page containing multiple columns filled with dense text blocks alongside visual aids including photographs depicting human interactions relevant to the topic discussed.\n\n10. **Additional Information Provided By Image Caption**:\n - The caption mentions specific statistics relating to the number of visitors who visited China via official websites over one year period.\n \n11. **Visual Context**:\n - The presence of photos suggests these images might serve illustrative purposes alongside the written material provided throughout the article/document. \n\n12. **Overall Theme And Purpose**:\n - The primary theme revolves around fostering better understanding among nations via improved communication channels facilitated by modern technology—specifically focusing on how digital platforms can enhance cross-cultural dialogues leading towards stronger diplomatic ties globally."
12 },
13 "finish_reason": "stop",
14 "flag": 0
15 }
16 ],
17 "usage": {
18 "prompt_tokens": 14,
19 "completion_tokens": 478,
20 "total_tokens": 492
21 }
22}
文本定位
请求
Bash
1curl --location 'https://qianfan.baidubce.com/v2/chat/completions' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer your-api-key' \
4--data '{
5 "model": "deepseek-ocr",
6 "messages": [
7 {
8 "role": "user",
9 "content": [
10 {
11 "type": "text",
12 "text": "<image>\nLocate <|ref|>了解中国的一扇窗口<|/ref|> in the image."
13 },
14 {
15 "type": "image_url",
16 "image_url": {
17 "url": "https://pplines-online.bj.bcebos.com/deploy/official/paddleocr/pp-ocr-vl//7eb9ea58-fab4-447c-a9ca-d129e2802d5f/input_img_0.jpg?authorization=bce-auth-v1%2F5cfe9a5e1454405eb2a975c43eace6ec%2F2025-10-24T10%3A16%3A02Z%2F-1%2F%2Fa37912ea16e6d8c45e7eafab9d5631155c0a0351b4d6767ab600267c991aac98"
18 }
19 }
20 ]
21 }
22 ]
23}'
返回
JSON
1{
2 "id": "as-vhy4egbc9b",
3 "object": "chat.completion",
4 "created": 1765593525,
5 "model": "deepseek-ocr",
6 "choices": [
7 {
8 "index": 0,
9 "message": {
10 "role": "assistant",
11 "content": "<|ref|>title<|/ref|><|det|>[[87, 20, 908, 92]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[390, 112, 609, 130]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 140, 234, 248]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 250, 234, 319]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 140, 480, 213]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 215, 480, 319]]<|/det|> \n\n<|ref|>title<|/ref|><|det|>[[16, 333, 222, 380]]<|/det|> \n\n<|ref|>title<|/ref|><|det|>[[270, 333, 468, 380]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 392, 234, 478]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 480, 234, 564]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 566, 234, 620]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 621, 234, 777]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 779, 234, 865]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[6, 867, 234, 952]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[7, 954, 234, 988]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 392, 480, 444]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 446, 480, 546]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 549, 480, 652]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 654, 480, 757]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 759, 480, 828]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[251, 830, 480, 985]]<|/det|> \n\n<|ref|>image<|/ref|><|det|>[[508, 132, 985, 500]]<|/det|>\n<|ref|>image_caption<|/ref|><|det|>[[531, 512, 960, 528]]<|/det|> \n\n<|ref|>title<|/ref|><|det|>[[817, 530, 974, 546]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[508, 567, 736, 777]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[508, 779, 736, 866]]<|/det|> \n\n<|ref|>title<|/ref|><|det|>[[520, 879, 724, 926]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[508, 936, 736, 985]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[757, 567, 875, 582]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[757, 584, 985, 722]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[757, 724, 985, 820]]<|/det|> \n\n<|ref|>text<|/ref|><|det|>[[757, 821, 985, 985]]<|/det|>"
12 },
13 "finish_reason": "stop",
14 "flag": 0
15 }
16 ],
17 "usage": {
18 "prompt_tokens": 30,
19 "completion_tokens": 1120,
20 "total_tokens": 1150
21 }
22}
评价此篇文章
