2026FIFA世界杯中国官网 百度文心生息模子 PaddleOCR-VL-1.6 发布, 空洞性能登顶人人 OCR 榜单

近日,百度追究对外发布新一代文档识别模子PaddleOCR-VL-1.6。据官方公布的评测数据,该模子在多项泰斗基准测试中刷新业界最优(SOTA)记载,空洞性能踏进人人第一,激励业内无为和顺。

1、评测得益亮眼,多格式的超过海外主流模子
在面前OCR边界公认的泰斗评测集OmniDocBench v1.6上,PaddleOCR-VL-1.6获取96.33%的总分,跳跃谷歌Gemini-3-Pro、OpenAI GPT-5.2、MinerU-2.5-Pro及国内的GLM-OCR等主流大模子与专用OCR决策,空洞排行人人第一。
在面向的确复杂场景规划的Real5-OmniDocBench评测中,该模子相似推崇杰出,总见解达到93.19%,较Gemini-3-Pro普及约4个百分点,在扫描件、弯折文档、屏幕拍照、光照变化及歪斜文档五类的确场景下均保抓发轫。
据了解,PaddleOCR系列在文本、公式、表格等中枢识别智商上收场全面升级,表格结构修起、古籍翰墨阔别与苦衷字识别等复杂任务的准确率较上一代模子均有权贵普及;钤记识别、图表融会及翰墨定位(Spotting)等多项智商亦同步强化。

2、轻量架构不变,建立者可无缝移动
值得和顺的是,2026世界杯官网入口PaddleOCR-VL-1.6在保留上一代0.9B轻量化参数范畴的前提下收场了性能跃升,通过模子入手的数据构建机制与渐进式纯属优化完成智商迭代。由于新旧两代模子结构保抓一致,已在分娩环境中部署PaddleOCR-VL-1.5的建立者和企业用户,无需寥落适配即可平滑移动至新版块,缩短了升级老本。
PaddleOCR系列模子基于百度文心大模子纯属而来,是文心多模态智商的挫折构成部分,现在相沿跳跃100种说念话识别,用户群体障翳人人170余个国度和地区。自格式开源以来,PaddleOCR在GitHub上的Star数已冲破79,200,超过谷歌旗下老牌开源格式Tesseract OCR,成为人人最受建立者和顺的开源OCR格式之一。
3、即刻可用,代码与权重全面灵通
PaddleOCR-VL-1.6现在已追究上线PaddleOCR官方网站(paddleocr.com),相沿网页端在线体验及API调用;模子代码与权重文献已同步开源至GitHub(github.com/PaddlePaddle/PaddleOCR)及Hugging Face(huggingface.co/PaddlePaddle/PaddleOCR-VL-1.6),面向人人建立者免费灵通。
跟着文档数字化需求的抓续增长2026FIFA世界杯中国官网,高精度、强鲁棒性的OCR智商正成为企业智能化转型的要害底座。这次PaddleOCR-VL-1.6的发布,或将进一步鼓吹国产开源OCR期间在人人范围内的采取与落地。