快捷导航
ai资讯
特地针对高速、切确的文本检测



  这对于布局化数据提取和内容阐发是环节要求。定位:PP-OCRv5 旨正在供给切确的文本行鸿沟框坐标,切确的文本检测和识别,处理了大型 VLMs 的切确文本定位和鸿沟框精度局限性问题。它供给了一种多言语支撑:该模子支撑五种文字类型 ——简体中文、繁体中文、英文、日文和拼音,PP-OCRv5 通过连结模块化、两阶段的流程,其挪动版本正在英特尔 Xeon Gold 6271C CPU 上每秒可处置跨越 370 个字符。PP-OCRv5 是一个为缓解大型视觉言语模子(VLMs)局限性而设想的公用 OCR 模子,百度引见称,效率:该模子参数量仅为 0.07B,可以或许正在 CPU 和边缘设备上实现更高机能!



 

上一篇:摸索可复制、可推广的模式
下一篇:硬件层面却“巴别塔”


服务电话:400-992-1681

服务邮箱:wa@163.com

公司地址:贵州省贵阳市观山湖区金融城MAX_A座17楼

备案号:网站地图

Copyright © 2021 贵州J9直营集团官方网站信息技术有限公司 版权所有 | 技术支持:J9直营集团官方网站

  • 扫描关注J9直营集团官方网站信息

  • 扫描关注J9直营集团官方网站信息