https://github.com/Ucas-HaoranWei/GOT-OCR2.0
一个端到端的开源 OCR 模型,号称 OCR 2.0!
基于 QWen2 0.5B 模型
支持场景文本、文档、音符、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
效果据说不错,值得试试
一个端到端的开源 OCR 模型,号称 OCR 2.0!
基于 QWen2 0.5B 模型
支持场景文本、文档、音符、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
效果据说不错,值得试试