Embedding-V1

更新时间：2025-02-27

Embedding-V1是基于百度文心大模型技术的文本表示模型，将文本转化为用数值表示的向量形式，用于文本检索、信息推荐、知识挖掘等场景。本文介绍了相关API，本接口不限制商用。

功能介绍

根据输入内容生成对应的向量表示。

使用说明

支持通过Python SDK、Go SDK、Java SDK和Node.js SDK调用，调用流程请查看SDK安装及使用流程。

SDK调用

请求示例

import os
import qianfan

# 使用安全认证AK/SK鉴权，通过环境变量方式初始化；替换下列示例中参数，安全认证Access Key替换your_iam_ak，Secret Key替换your_iam_sk
os.environ["QIANFAN_ACCESS_KEY"] = "your_iam_ak"
os.environ["QIANFAN_SECRET_KEY"] = "your_iam_sk"

emb = qianfan.Embedding()

resp = emb.do(model="Embedding-V1", texts=[ 
    "推荐一些美食","给我讲个故事"
])
print(resp["body"])

package main

import (
	"context"
	"fmt"
	"os"

	"github.com/baidubce/bce-qianfan-sdk/go/qianfan"
)

func main() {
    // 使用安全认证AK/SK鉴权，通过环境变量初始化；替换下列示例中参数，安全认证Access Key替换your_iam_ak，Secret Key替换your_iam_sk
	os.Setenv("QIANFAN_ACCESS_KEY", "your_iam_ak")
	os.Setenv("QIANFAN_SECRET_KEY", "your_iam_sk")

	embed := qianfan.NewEmbedding(
        qianfan.WithModel("Embedding-V1"),
    )
	resp, _ := embed.Do( 
		context.TODO(),
		&qianfan.EmbeddingRequest{
			Input: []string{"你好啊", "明天天气多云"},
		},
	)
	for _, value := range resp.Data {
		fmt.Println(value.Embedding)
	}
}

import com.baidubce.qianfan.Qianfan;
import com.baidubce.qianfan.model.embedding.EmbeddingData;
import com.baidubce.qianfan.model.embedding.EmbeddingResponse;
import java.util.Arrays;

public class Demo {
    public static void main(String[] args) {
        // 使用安全认证AK/SK鉴权，替换下列示例中参数，安全认证Access Key替换your_iam_ak，Secret Key替换your_iam_sk
        Qianfan qianfan = new Qianfan("your_iam_ak", "your_iam_sk");
        
        EmbeddingResponse resp = qianfan.embedding()
                .model("Embedding-V1")
                .input(Arrays.asList("晚饭味道很不错", "晚餐真好吃"))
                .execute();
        for (EmbeddingData data : resp.getData()) {
            System.out.println(data.getEmbedding());
        }
    }
}

import {Embedding} from "@baiducloud/qianfan";

// 使用安全认证AK/SK鉴权，替换下列示例中参数，安全认证Access Key替换your_iam_ak，Secret Key替换your_iam_sk
const client = new Embedding({ QIANFAN_ACCESS_KEY: 'your_iam_ak', QIANFAN_SECRET_KEY: 'your_iam_sk' });
async function main() {
    const resp = await client.embedding({
        input: ['介绍下你自己吧', '你有什么爱好吗？'],
    }, 'Embedding-V1');
    const rs = resp.data;
    rs.forEach((data) => {
        console.log(data.embedding);
    })
}

main();

返回示例

{
	'id': 'as-tnrbsnpabg', 
	'object': 'embedding_list', 
	'created': 1718767750, 
	'data': [
		{
		    'object': 'embedding', 
			'embedding': [0.018314672634005547, 0.009424409829080105, -0.009610666893422604, ...],
  			'index': 0
  		}, 
  		{
  		    'object': 'embedding', 
  			'embedding': [0.12250778824090958, 0.07934671640396118, -0.027468973770737648, ...], 
  			'index': 1
        }
  	], 
  	'usage': {
  		'prompt_tokens': 6, 
  		'total_tokens': 6
  	}
}

[0.004519541282206774 -0.0725267082452774 0.0022614754270762205 0.13040794432163239 -0.08518342673778534 ...]
[0.020677050575613976 -0.041624199599027634 0.045507751405239105 ...]

[0.06842433661222458, 0.05259920656681061, -0.01780703105032444, ...]
[0.06406816840171814, 0.04901014640927315, -0.021046847105026245, ...]

[0.13463850319385529,  -0.010635782964527607,   0.024348171427845955...]
[0.06406816840171814, 0.04901014640927315, -0.021046847105026245, ...]

请求参数

注意：以下为Python SDK参数说明，Go、Java、Node.js SDK参数相关说明请参考Go SDK-向量Embeddings参数相关说明、Java SDK参数相关说明、Node.js SDK参数相关说明。

名称	类型	必填	描述
model	str	否	模型名称，说明：调用本文API，该字段为固定值Embedding-V1
texts	List[str]	是	填写文本，说明：（1）不能为空List，List的每个成员不能为空字符串（2）文本数量不超过16 （3）每个文本token数不超过384且长度不超过1000个字符
retry_count	int	否	重试次数，默认1次
request_timeout	float	否	请求超时时间，默认60秒
backoff_factor	float	否	请求重试参数，用于指定重试的策略，默认为0
user_id	str	否	表示最终用户的唯一标识符

返回参数

名称	类型	描述
id	str	本轮对话的id
object	str	回包类型，固定值“embedding_list”
created	int	时间戳
data	List[EmbeddingData]	embedding信息，data成员数和文本数量保持一致
usage	Usage	token统计信息，token数 = 汉字数+单词数*1.3 （仅为估算逻辑）

EmbeddingData说明

名称	类型	描述
object	str	固定值"embedding"
embedding	List[float]	embedding 内容
index	int	序号

Usage说明

名称	类型	描述
prompt_tokens	int	问题tokens数（包含历史QA）
total_tokens	int	tokens总数

续写Completions

bge-large-zh

百度智能云

千帆大模型服务与开发平台ModelBuilder