1 Star 0 Fork 866

wen / PaddleOCR

forked from PaddlePaddle / PaddleOCR 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README_हिन्द.md 21.17 KB
一键复制 编辑 原始数据 按行查看 历史
Leif 提交于 2022-10-25 18:18 . update README_Ру́сский_язы́к

English | 简体中文 | हिन्दी | 日本語 | 한국인 | Pу́сский язы́к

प्रस्तावना

पैडलओसीआर का उद्देश्य बहुभाषी,शानदार , ओसीआर और व्यावहारिक ओसीआरउपकरण बनाना है जो यूजर्स को बेहतर मॉडलों के लिए प्रशिक्षित करने और उन्हें व्यवहार में लागू करने में मदद करते हैं।

📣 हाल के अद्यतन

  • 🔥2022.8.24 रिलीज Paddleओसीआर रिलीज/2.6

    • रिलीज PP-Structurev2,फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए लेआउट रिकवरी और पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड;
    • लेआउट एनालाइस ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है;
    • टेबल रिकोगनाइजेशन ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है;
    • की इंफॉर्मेशन एक्स्ट्रेक्शन ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है।
  • 🔥2022.7 रिलीज ओसीआर दृश्य आवेदन संग्रह

    • रिलीज 9 वर्टिकल मॉडल जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं।
  • 🔥2022.5.9 रिलीज Paddleओसीआर रिलीज/2.5

    • रिलीज PP-OCRv3: तुलनात्मक स्पीड के साथ, चाइनीज शीन्स का प्रभाव PP-ओसीआर v2 की तुलना में 5% की और वृद्धि हुयी है इंगलिस शीन्स के प्रभाव में 11% का सुधार हुआ है, और 80 भाषाओं के बहुभाषी मॉडलों की औसत पहचान सटीकता में 5% से अधिक सुधार हुआ है।

    • रिलीज़ PPOCRLabelv2: टेबल टेबल रिकोगनाइजेशन टास्क की इंफॉर्मेशन एक्स्ट्रेक्शन टास्क और अनियमित टेक्सट इमेज के लिए एनोटेशन फ़ंक्शन एड करे।

    • इंटरएक्टिव ई-बुक जारी करें "ओसीआर में गोता लगाएँ", ओसीआर पूर्ण स्टैक तकनीक के अत्याधुनिक सिद्धांत और कोड प्रेक्टिस को कवर करता है।

  • और अधिक

🌟 विशेषताएँ

Paddleओसीआर से संबंधित विभिन्न प्रकार के अत्याधुनिक एल्गोरिथ्म को सपोर्ट करता है, और विकसित औद्योगिक विशेष रुप से प्रदर्शित मॉडल/समाधान PP- OCR और PP-Structure इस आधार पर और डेटा प्रोडक्शन की पूरी प्रोसेस के माध्यम से प्राप्त करें, मॉडल ट्रेनिंग, दबाव, अनुमान और तैनाती।

⚡ शीघ्र अनुभव

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=hi

यदि आपके पास पायथन एनवायरनमेंट नहीं है, कृपया फॉलो कीजिए एनवायरनमेंट प्रिपेरेशन. हम अनुशंसा करते हैं कि आप इसके साथ शुरुआत करें ट्यूटोरियल.

📚 ई-बुक: ओसीआर में गोता लगाएँ

👫 समुदाय

अंतरराष्ट्रीय डेवलपर्स के लिए, हम सम्मान करते हैं [पैडलओसीआर चर्चाएँ] (https://github.com/PaddlePaddle/PaddleOCR/discussions) हमारे अंतरराष्ट्रीय कम्युनिटी मंच के रूप में। यहां सभी विचारों और प्रश्नों पर अंग्रेजी में चर्चा की जा सकती है।

🛠️ PP-ओसीआर श्रृंखला मॉडल सूची

मॉडल प्रस्तावना मॉडल नाम रिकमेंडिड सीन डिटेक्शन मॉडल रिकोगनाइजेशन मॉडल
हिन्दी:हिन्दी अल्ट्रा-लाइटवेट PP-ओसीआरv3 सिस्टम (9.9M) devanagari_PP-ओसीआरv3_xx मोबाइल और सर्वर इन्फरन्स मॉडल / प्रशिक्षितमॉडल इन्फरन्समॉडल / प्रशिक्षित मॉडल
इंग्लिश अल्ट्रा- लाइट वेट PP-ओसीआरv3 मॉडल (13.4M) en_PP-ओसीआरv3_xx मोबाइल और सर्वर इन्फरन्स मॉडल / प्रशिक्षितमॉडल इन्फरन्समॉडल / प्रशिक्षित मॉडल
चाइनीस और इंग्लिश अल्ट्रा- लाइट वेट PP-ओसीआरv3 मॉडल(16.2M) ch_PP-ओसीआरv3_xx मोबाइल और सर्वर इन्फरन्स मॉडल / प्रशिक्षित मॉडल प्रशिक्षित मॉडल / प्रशिक्षित मॉडल

📖 ट्यूटोरियल

🇺🇳 नई भाषा अनुरोधों के लिए संयुक्त राष्ट्र दिशानिर्देश

अगर आप एक नए भाषा मॉडल का अनुरोध करना चाहते हैं, तो कृपया बहुभाषी मॉडल अपग्रेड के लिए वोट करें में वोट करें। हम नियमित रूप से परिणाम के अनुसार मॉडल को अपग्रेड करेंगे। अपने दोस्तों को एक साथ वोट करने के लिए आमंत्रित करें!

यदि आपको एक नए भाषा मॉडल को प्रशिक्षित करने अपने परिदृश्य के आधार पर, तो यह बहुभाषी मॉडल ट्रेनिंग प्रोजेक्ट ट्रेनिंग ट्यूटोरियल आपको डेटासेट तैयार करने में मदद करेगा और आपको स्टेप बाए स्टेप पूरा प्रोसेस दिखाएगा

मूल बहुभाषी ओसीआर विकास योजना अभी भी आपको बहुत सारे उपयोगी संग्रह और शब्दकोश दिखाता है

👀 विज़ुअलाइज़ेशन अधिक

PP-OCRv3 बहुभाषी मॉडल
PP-OCRv3 अंग्रेजी मॉडल
PP-OCRv3 चीनी मॉडल
PP-Structurev2 1. लेआउट एनालाइस + टेबल रिकोगनाइजेशन
2. SER (सिमेंटिक एंटिटी रिकोगनाइजेशन)
3. RE (रिलेशन एक्सट्रैक्शन)

📄 लाइसेंस

इस प्रोजेक्ट को इन परियोजना के तहत जारी किया गया है Apache 2.0 license

Python
1
https://gitee.com/helloxxproject/PaddleOCR.git
git@gitee.com:helloxxproject/PaddleOCR.git
helloxxproject
PaddleOCR
PaddleOCR
release/2.6

搜索帮助

53164aa7 5694891 3bd8fe86 5694891