Retriever - volc VikingDB
基本介绍
火山引擎 VikingDB 检索器是 Retriever 接口的一个实现,火山引擎 VikingDB 是火山引擎提供的向量数据库服务,提供了高性能的向量检索能力,本组件通过火山引擎 VikingDB Go SDK 与服务进行交互。该组件实现了 [🚧]Eino: Retriever 使用说明
使用方式
组件初始化
火山引擎 VikingDB 检索器通过 NewRetriever
函数进行初始化,主要配置参数如下:
retriever, err := NewRetriever(ctx, &RetrieverConfig{
// 服务配置
Host: "api.volcengineapi.com", // 服务地址
Region: "cn-beijing", // 区域
AK: "your-ak", // 访问密钥 ID
SK: "your-sk", // 访问密钥密码
Scheme: "https", // 协议
ConnectionTimeout: 30, // 连接超时时间(秒)
// 数据配置
Collection: "collection-name", // 集合名称
Index: "index-name", // 索引名称
// 向量化配置
EmbeddingConfig: EmbeddingConfig{
UseBuiltin: true, // 是否使用内置向量化
ModelName: "model-name",// 模型名称
UseSparse: true, // 是否使用稀疏向量
DenseWeight: 0.5, // 稠密向量权重
Embedding: embedder, // 自定义向量化器
},
// 检索配置
Partition: "partition", // 分区名称
TopK: ptrOf(100), // 返回结果数量
ScoreThreshold: ptrOf(0.7), // 相似度阈值
// 过滤配置
FilterDSL: map[string]any{ // DSL 过滤条件
"term": map[string]any{
"field": "value",
},
},
})
检索文档
文档检索通过 Retrieve
方法实现:
docs, err := retriever.Retrieve(ctx, "查询文本", retriever.WithTopK(5))
完整使用示例
基本检索
package main
import (
"context"
"github.com/cloudwego/eino-ext/components/retriever/volc_vikingdb"
)
func main() {
ctx := context.Background()
// 初始化检索器
r, err := volc_vikingdb.NewRetriever(ctx, &volc_vikingdb.RetrieverConfig{
Host: "api.volcengineapi.com",
Region: "cn-beijing",
AK: "your-ak",
SK: "your-sk",
Collection: "your-collection",
Index: "your-index",
EmbeddingConfig: volc_vikingdb.EmbeddingConfig{
UseBuiltin: true,
ModelName: "model-name",
UseSparse: true,
DenseWeight: 0.5,
},
TopK: ptrOf(5),
})
if err != nil {
panic(err)
}
// 执行检索
docs, err := r.Retrieve(ctx, "如何使用 VikingDB?")
if err != nil {
panic(err)
}
// 处理结果
for _, doc := range docs {
println("文档ID:", doc.ID)
println("内容:", doc.Content)
println("相似度:", doc.MetaData["_score"])
}
}
自定义向量化
package main
import (
"context"
"github.com/cloudwego/eino-ext/components/retriever/volc_vikingdb"
"github.com/cloudwego/eino/components/embedding"
)
func main() {
ctx := context.Background()
// 初始化向量化器 (以 openai 为例)
embedder, err := &openai.NewEmbedder(ctx, &openai.EmbeddingConfig{})
if err != nil {
panic(err)
}
// 初始化检索器
r, err := volc_vikingdb.NewRetriever(ctx, &volc_vikingdb.RetrieverConfig{
Host: "api.volcengineapi.com",
Region: "cn-beijing",
AK: "your-ak",
SK: "your-sk",
Collection: "your-collection",
Index: "your-index",
EmbeddingConfig: volc_vikingdb.EmbeddingConfig{
UseBuiltin: false,
Embedding: embedder,
},
})
if err != nil {
panic(err)
}
// 执行检索
docs, err := r.Retrieve(ctx, "查询文本")
if err != nil {
panic(err)
}
// 处理结果
for _, doc := range docs {
println(doc.Content)
}
}
相关文档
最后修改
January 13, 2025
: docs: add description for streamx (#1202) (0337c81)