Loader - local file
基本介绍
local file 文件加载器是 Document Loader 接口的一个实现,用于从本地文件系统中加载文档内容。该组件实现了 Eino: Document Loader 使用说明。
特性介绍
本地文件加载器具有以下特点:
- 支持通过文件路径直接加载文档
- 自动识别文件类型并选择合适的解析器 (需设置 ExtParser)
- 保留文件的元数据信息
- 支持将文件名作为文档 ID
使用方式
组件初始化
本地文件加载器通过 NewFileLoader
函数进行初始化,主要配置参数如下:
loader, err := NewFileLoader(ctx, &FileLoaderConfig{
UseNameAsID: true, // 是否使用文件名作为文档ID
Parser: &parser.TextParser{}, // 可选:指定自定义解析器
})
配置参数说明:
UseNameAsID
:是否将文件名用作文档 IDParser
:文档解析器,如果不指定则使用默认的扩展名解析器(ExtParser,当前仅实现了 TextParser)
加载文档
文档加载通过 Load
方法实现:
docs, err := loader.Load(ctx, document.Source{
URI: "./path/to/document.txt",
})
文档加载后会自动添加以下元数据:
_file_name
:文件名_extension
:文件扩展名_source
:文件的完整路径
注意事项:
- 路径必须指向一个文件,不能是目录
- 文件必须可读
- 如果
UseNameAsID
为 true,单文件时使用文件名作为 ID,多文档时使用文件名_序号
作为 ID
完整使用示例
单独使用
package main
import (
"context"
fileloader "github.com/cloudwego/eino-ext/components/document/loader/file"
"github.com/cloudwego/eino/components/document"
)
func main() {
ctx := context.Background()
// 初始化加载器
loader, err := fileloader.NewFileLoader(ctx, &fileloader.FileLoaderConfig{
UseNameAsID: true,
})
if err != nil {
panic(err)
}
// 加载文档
docs, err := loader.Load(ctx, document.Source{
URI: "./documents/sample.txt",
})
if err != nil {
panic(err)
}
// 使用文档内容
for _, doc := range docs {
println(doc.Content)
// 访问元数据
fileName := doc.MetaData[fileloader.MetaKeyFileName]
extension := doc.MetaData[fileloader.MetaKeyExtension]
source := doc.MetaData[fileloader.MetaKeySource]
}
}
相关文档
最后修改
January 13, 2025
: docs: add description for streamx (#1202) (0337c81)