Open WebUI 中的文档提取
Open WebUI 提供强大的文档提取功能,允许您在 RAG(检索增强生成)工作流中处理和分析各种类 型的文档。文档提取对于将非结构化文档内容转换为可被语言模型有效使用的结构化数据至关重要。
什么是文档提取?
文档提取是指自动识别和提取各种文件格式中的文本和数据的过程,包括:
- PDF(基于文本和扫描的)
- 包含文本的图像
- 手写文档
- 以及更多
通过适当的文档提取,Open WebUI 可以帮助您:
- 将基于图像的文档转换为可搜索的文本
- 保留文档结构和布局信息
- 提取结构化格式的数据以进行进一步处理
- 支持多语言内容识别
可用的提取方法
Open WebUI 支持多种文档提取引擎,以适应不同的需求和文档类型。每种提取方法都有其自身的优势,适用于不同的场景。
探索每种可用提取方法的文档,了解如何设置和在您的 Open WebUI 实例中有效使用它们。