Skip to content

Commit 1161027

Browse files
authored
update docs (#3703)
* update README * update docs
1 parent 576b78d commit 1161027

File tree

5 files changed

+12
-12
lines changed

5 files changed

+12
-12
lines changed

docs/index.md

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -300,7 +300,7 @@ PaddleX的每一条产线对应特定的参数,您可以在各自的产线文
300300
...,
301301
[1156, ..., 1351]], dtype=int16)}}}
302302
```
303-
=== "通用版面解析v2"
303+
=== "通用版面解析v3"
304304

305305
```bash
306306
paddlex --pipeline PP-StructureV3 \
@@ -1057,7 +1057,7 @@ for res in output:
10571057

10581058
```
10591059

1060-
=== "通用版面解析v2"
1060+
=== "通用版面解析v3"
10611061

10621062
```python
10631063
from paddlex import create_pipeline
@@ -1425,11 +1425,11 @@ for res in output:
14251425

14261426
[:octicons-arrow-right-24: 教程](pipeline_usage/tutorials/ocr_pipelines/OCR.md)
14271427

1428-
- **通用版面解析v2**
1428+
- **通用版面解析v3**
14291429

14301430
---
14311431

1432-
通用版面解析v2产线在通用版面解析v1产线的基础上,强化了版面区域检测、表格识别、公式识别的能力,增加了多栏阅读顺序的恢复能力、结果转换 Markdown 文件的能力,在多种文档数据中,表现优异,可以处理较复杂的文档数据。
1432+
通用版面解析v3产线在通用版面解析v1产线的基础上,强化了版面区域检测、表格识别、公式识别的能力,增加了多栏阅读顺序的恢复能力、结果转换 Markdown 文件的能力,在多种文档数据中,表现优异,可以处理较复杂的文档数据。
14331433

14341434
[:octicons-arrow-right-24: 教程](pipeline_usage/tutorials/ocr_pipelines/PP-StructureV3.md)
14351435

docs/module_usage/tutorials/ocr_modules/textline_orientation_classification.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -471,7 +471,7 @@ python main.py -c paddlex/configs/modules/textline_orientation/PP-LCNet_x0_25_te
471471

472472
1.<b>产线集成</b>
473473

474-
文本行方向分类模块可以集成的PaddleX产线有[通用OCR产线](../../../pipeline_usage/tutorials/ocr_pipelines/OCR.md)、[通用版面解析产线](../../../pipeline_usage/tutorials/ocr_pipelines/layout_parsing.md)、[通用版面解析v2产线](../../../pipeline_usage/tutorials/ocr_pipelines/PP-StructureV3.md)和[文档场景信息抽取v3产线(PP-ChatOCRv3-doc)](../../../pipeline_usage/tutorials/information_extraction_pipelines/document_scene_information_extraction_v3.md),只需要替换模型路径即可完成文本行方向分类模块的模型更新。
474+
文本行方向分类模块可以集成的PaddleX产线有[通用OCR产线](../../../pipeline_usage/tutorials/ocr_pipelines/OCR.md)、[通用版面解析产线](../../../pipeline_usage/tutorials/ocr_pipelines/layout_parsing.md)、[通用版面解析v3产线](../../../pipeline_usage/tutorials/ocr_pipelines/PP-StructureV3.md)和[文档场景信息抽取v3产线(PP-ChatOCRv3-doc)](../../../pipeline_usage/tutorials/information_extraction_pipelines/document_scene_information_extraction_v3.md),只需要替换模型路径即可完成文本行方向分类模块的模型更新。
475475

476476
2.<b>模块集成</b>
477477

docs/pipeline_deploy/high_performance_inference.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -666,7 +666,7 @@ python -m pip install ../../python/dist/ultra_infer*.whl
666666
</tr>
667667

668668
<tr>
669-
<td rowspan="9">通用版面解析v2</td>
669+
<td rowspan="9">通用版面解析v3</td>
670670
<td>文档图像方向分类(可选)</td>
671671
<td><b>1</b> / 1 </td>
672672
<td>无 </td>

docs/pipeline_usage/pipeline_develop_guide.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -271,8 +271,8 @@ Pipeline:
271271
<td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/layout_parsing.html">通用版面解析产线使用教程</a></td>
272272
</tr>
273273
<tr>
274-
<td>通用版面解析v2</td>
275-
<td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/PP-StructureV3.html">通用版面解析v2产线使用教程</a></td>
274+
<td>通用版面解析v3</td>
275+
<td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/PP-StructureV3.html">通用版面解析v3产线使用教程</a></td>
276276
</tr>
277277
<tr>
278278
<td>公式识别</td>

docs/pipeline_usage/tutorials/ocr_pipelines/PP-StructureV3.md

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -1299,7 +1299,7 @@ for res in output:
12991299
res.save_to_json(save_path="output") ## 保存当前图像的结构化json结果
13001300
res.save_to_markdown(save_path="output") ## 保存当前图像的markdown格式的结果
13011301
```
1302-
<b>注:</b> 配置文件中的参数为产线初始化参数,如果希望更改通用版面解析v2产线初始化参数,可以直接修改配置文件中的参数,并加载配置文件进行预测。同时,CLI 预测也支持传入配置文件,`--pipeline` 指定配置文件的路径即可。
1302+
<b>注:</b> 配置文件中的参数为产线初始化参数,如果希望更改通用版面解析v3产线初始化参数,可以直接修改配置文件中的参数,并加载配置文件进行预测。同时,CLI 预测也支持传入配置文件,`--pipeline` 指定配置文件的路径即可。
13031303

13041304
## 3. 开发集成/部署
13051305
如果产线可以达到您对产线推理速度和精度的要求,您可以直接进行开发集成/部署。
@@ -1711,11 +1711,11 @@ for i, res in enumerate(result["layoutParsingResults"]):
17111711
您可以根据需要选择合适的方式部署模型产线,进而进行后续的 AI 应用集成。
17121712

17131713
## 4. 二次开发
1714-
如果通用版面解析v2产线提供的默认模型权重在您的场景中,精度或速度不满意,您可以尝试利用<b>您自己拥有的特定领域或应用场景的数据</b>对现有模型进行进一步的<b>微调</b>,以提升通用版面解析v2产线的在您的场景中的识别效果
1714+
如果通用版面解析v3产线提供的默认模型权重在您的场景中,精度或速度不满意,您可以尝试利用<b>您自己拥有的特定领域或应用场景的数据</b>对现有模型进行进一步的<b>微调</b>,以提升通用版面解析v3产线的在您的场景中的识别效果
17151715

17161716
### 4.1 模型微调
17171717

1718-
由于通用版面解析v2产线包含若干模块,模型产线的效果不及预期可能来自于其中任何一个模块。您可以对提取效果差的 case 进行分析,通过可视化图像,确定是哪个模块存在问题,并参考以下表格中对应的微调教程链接进行模型微调。
1718+
由于通用版面解析v3产线包含若干模块,模型产线的效果不及预期可能来自于其中任何一个模块。您可以对提取效果差的 case 进行分析,通过可视化图像,确定是哪个模块存在问题,并参考以下表格中对应的微调教程链接进行模型微调。
17191719

17201720

17211721
<table>
@@ -1832,4 +1832,4 @@ paddlex --pipeline PP-StructureV3 \
18321832

18331833
当然,您也可以在 Python 脚本中 `create_pipeline()` 时或者 `predict()` 时指定硬件设备。
18341834

1835-
若您想在更多种类的硬件上使用通用版面解析v2产线,请参考[PaddleX多硬件使用指南](../../../other_devices_support/multi_devices_use_guide.md)
1835+
若您想在更多种类的硬件上使用通用版面解析v3产线,请参考[PaddleX多硬件使用指南](../../../other_devices_support/multi_devices_use_guide.md)

0 commit comments

Comments
 (0)