我计划使用Gemini嵌入模型(models/embedding-001
)进行文档/查询检索,但我无法在文档中找到它是否支持英语以外的语言,尤其是希腊语。我想知道如果我的文档和查询都是希腊语,或者我的文档是希腊语而查询是英语,我能否获得准确的嵌入。
回答:
如果你想为希腊语获取嵌入,可以使用vertexai的文本嵌入模型textembedding-gecko@001,它支持希腊语。代码示例:
from vertexai.language_models import TextEmbeddingModeldef text_embedding() -> list: """使用大型语言模型进行文本嵌入。""" model = TextEmbeddingModel.from_pretrained("textembedding-gecko-multilingual@001") embeddings = model.get_embeddings(["What is life?"]) for embedding in embeddings: vector = embedding.values print(f"嵌入向量的长度: {len(vector)}") return vector