AgentOCR
简介
-
AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目
-
本项目目前包含 Python Package 【AgentOCR】 和 OCR 标注软件 【AgentOCRLabeling】
使用指南
-
Python Package:
-
快速安装:
# 安装 AgentOCR $ pip install agentocr # 根据设备平台安装合适版本的 ONNXRuntime $ pip install onnxruntime
-
简单调用:
# 导入 OCRSystem 模块 from agentocr import OCRSystem # 初始化 OCR 模型 ocr = OCRSystem(config='ch') # 使用模型对图像进行 OCR 识别 results = ocr.ocr('test.jpg')
-
服务器部署:
-
启动 AgentOCR Server 服务
$ agentocr server
-
Python 调用
import cv2 import json import base64 import requests # 图片 Base64 编码 def cv2_to_base64(image): data = cv2.imencode('.jpg', image)[1] image_base64 = base64.b64encode(data.tobytes()).decode('UTF-8') return image_base64 # 读取图片 image = cv2.imread('test.jpg') image_base64 = cv2_to_base64(image) # 构建请求数据 data = { 'image': image_base64 } # 发送请求 url = "http://127.0.0.1:5000/ocr" r = requests.post(url=url, data=json.dumps(data)) # 打印预测结果 print(r.json())
-
-
Jupyter Notebook:【快速使用】
-
更多安装使用细节请参考:【Package 使用指南】
-
多语言支持
-
目前预置了如下语言的配置文件,可通过语言缩写直接调用该配置文件:
语种 描述 缩写 语种 描述 缩写 中文 chinese and english ch 保加利亚文 Bulgarian bg 英文 english en 乌克兰文 Ukranian uk 法文 french fr 白俄罗斯文 Belarusian be 德文 german german 泰卢固文 Telugu te 日文 japan japan 阿巴扎文 Abaza abq 韩文 korean korean 泰米尔文 Tamil ta 中文繁体 chinese traditional cht 南非荷兰文 Afrikaans af 意大利文 Italian it 阿塞拜疆文 Azerbaijani az 西班牙文 Spanish es 波斯尼亚文 Bosnian bs 葡萄牙文 Portuguese pt 捷克文 Czech cs 俄罗斯文 Russia ru 威尔士文 Welsh cy 阿拉伯文 Arabic ar 丹麦文 Danish da 印地文 Hindi hi 爱沙尼亚文 Estonian et 维吾尔 Uyghur ug 爱尔兰文 Irish ga 波斯文 Persian fa 克罗地亚文 Croatian hr 乌尔都文 Urdu ur 匈牙利文 Hungarian hu 塞尔维亚文(latin) Serbian(latin) rs_latin 印尼文 Indonesian id 欧西坦文 Occitan oc 冰岛文 Icelandic is 马拉地文 Marathi mr 库尔德文 Kurdish ku 尼泊尔文 Nepali ne 立陶宛文 Lithuanian lt 塞尔维亚文(cyrillic) Serbian(cyrillic) rs_cyrillic 拉脱维亚文 Latvian lv 毛利文 Maori mi 达尔瓦文 Dargwa dar 马来文 Malay ms 因古什文 Ingush inh 马耳他文 Maltese mt 拉克文 Lak lbe 荷兰文 Dutch nl 莱兹甘文 Lezghian lez 挪威文 Norwegian no 塔巴萨兰文 Tabassaran tab 波兰文 Polish pl 比尔哈文 Bihari bh 罗马尼亚文 Romanian ro 迈蒂利文 Maithili mai 斯洛伐克文 Slovak sk 昂加文 Angika ang 斯洛文尼亚文 Slovenian sl 孟加拉文 Bhojpuri bho 阿尔巴尼亚文 Albanian sq 摩揭陀文 Magahi mah 瑞典文 Swedish sv 那格浦尔文 Nagpur sck 西瓦希里文 Swahili sw 尼瓦尔文 Newari new 塔加洛文 Tagalog tl 保加利亚文 Goan Konkani gom 土耳其文 Turkish tr 沙特阿拉伯文 Saudi Arabia sa 乌兹别克文 Uzbek uz 阿瓦尔文 Avar ava 越南文 Vietnamese vi 阿瓦尔文 Avar ava 蒙古文 Mongolian mn 阿迪赫文 Adyghe ady
预训练模型
-
检测模型:
Model Name Model Type Pretrained Model ch_ppocr_mobile_v2.0_det det Download ch_ppocr_server_v2.0_det det Download en_ppocr_mobile_v2.0_det det Download en_ppocr_mobile_v2.0_table_det det Download -
分类模型:
Model Name Model Type Pretrained Model ch_ppocr_mobile_v2.0_cls cls Download -
识别模型:
Model Name Model Type Pretrained Model ch_ppocr_mobile_v2.0_rec rec Download ch_ppocr_server_v2.0_rec rec Download ka_ppocr_mobile_v2.0_rec rec Download te_ppocr_mobile_v2.0_rec rec Download ta_ppocr_mobile_v2.0_rec rec Download cht_ppocr_mobile_v2.0_rec rec Download japan_ppocr_mobile_v2.0_rec rec Download latin_ppocr_mobile_v2.0_rec rec Download arabic_ppocr_mobile_v2.0_rec rec Download korean_ppocr_mobile_v2.0_rec rec Download french_ppocr_mobile_v2.0_rec rec Download german_ppocr_mobile_v2.0_rec rec Download cyrillic_ppocr_mobile_v2.0_rec rec Download en_ppocr_mobile_v2.0_table_rec rec Download en_ppocr_mobile_v2.0_number_rec rec Download devanagari_ppocr_mobile_v2.0_rec rec Download