bge-large-zh bge-large-zh是由智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。本文介绍了相关API,本接口不限制商用。 功能介绍 根据输入内容生成对应的向量表示。
CodeLlama-7b-Instruct CodeLlama-7b-Instruct是Code Llama是由Meta AI研发并开源的一系列文本生成模型,旨在用于一般代码合成和理解。该模型参数规模为70亿。本文介绍了相关API。 功能介绍 调用本接口,发起一次文本续写请求。
Gemma-2B-it Gemma 是 Google 开发的一系列轻量级、尖端的开源文本生成模型,采用与 Gemini 模型相同的技术构建,适合用于各种文本生成任务,能够在资源量较小的端侧设备部署。本文介绍了相关API。 功能介绍 调用本接口,发起一次对话请求。
当模型生成结果以stop中某个元素结尾时,停止文本生成。说明: (1)每个元素长度不超过20字符。
ERNIE-Lite-8K ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。本文介绍了千帆相关API及应用。 功能介绍 调用本接口,发起一次对话请求。
MPT-30B-instruct MPT-30M-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在更为丰富的数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。本文介绍了相关API。 功能介绍 调用本接口,发起一次对话请求。
注意事项 模型版本说明:-MMDD,表示带日期版本接口,模型不再更新,会定期退役,退役下线前会通知用户,具体说明请看 模型版本升级及退役机制 文档。
ERNIE-Tiny-8K ERNIE Tiny是百度自研的超高性能大语言模型,部署与精调成本在文心系列模型中最低。ERNIE-Tiny-8K是模型的一个版本,本文介绍了相关API。 功能介绍 调用本接口,发起一次对话请求。
ERNIE-Speed-Pro-128K ERNIE Speed Pro是百度2024年最新发布的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题,同时具备极佳的推理性能。ERNIE-Speed-Pro-128K是2024年8月30日发布的初始版本,支持128K上下文长度,效果比ERNIE-Speed-128K更优。本文介绍了相关API。
当模型生成结果以stop中某个元素结尾时,停止文本生成。说明: (1)每个元素长度不超过20字符。