-
Notifications
You must be signed in to change notification settings - Fork 2
Open
Labels
enhancementNew feature or requestNew feature or request
Description
- 使用inference API GPTS 支持 向量搜索
a. 通过pipeline自动处理向量化过程(支持huggingface api 以及openai api)
b. 通过query_vector_builder在knn查询阶段也使用inference进行向量化 - 使用huggingface/text-embeddings-inference 作为api移除之前内置pytouch做向量化的过程,这里可以提升之前知识库做向量化的性能
- 利用es 支持 inner hits的特性 改进存储结构
- 文档拆分https://github.com/Filimoa/open-parse
a. 使用这个开源的open parse项目。对pdf支持挺好。
b. 另外就是这个项目readme提到的 google document ai,以及aws的相关api,还有一个公司的产品(这些都是付费的 $10 / 1000page)
Metadata
Metadata
Assignees
Labels
enhancementNew feature or requestNew feature or request