都做什么  内容精选
  • 什么情况下适合精调 - ModelBuilder

    什么情况下适合精调 大模型具备出色的数据处理、文本理解与生成能力,能够轻松应对各种复杂的语言任务,如智能问答、文本摘要、多语种翻译等,为用户提供流畅、自然的交互体验。然而,在实际运用当中,我们可能会遇到大模型生成效果不尽如人意的情况。别担心,接下来我们将介绍几种有效的优化方法,帮助您提升大模型的生成效果。 调整Prompt优化输出。

    查看更多>>

  • 什么是Post-pretrain - ModelBuilder

    智能客服 Post-pretrain可在输入的泛文本无标注数据上进行基础的问题归类,经过SFT调优后,可根据客户提出的问题泛化处理,给出范围内的应答策略。

    查看更多>>

都做什么  更多内容
  • Linux命令行机器人之---(4.)100行代码挑战开发一个完整的命令行机器人 千帆社区

    问:请问音视频领域中AAC和MP3的区别是什么? ########################## 答: 在音频领域中,AAC和MP3是常见的音频编码格式,它们之间的区别在于压缩效率和音质表现。 AAC(Advanced Audio Coding)是一种高级音频编码,它比MP3具有更高的压缩效率,可以在相同音质下减少文件大小。

    查看更多>>

  • Linux命令行机器人之---(4.)100行代码挑战开发一个完整的命令行机器人 千帆社区

    问:请问音视频领域中AAC和MP3的区别是什么? ########################## 答: 在音频领域中,AAC和MP3是常见的音频编码格式,它们之间的区别在于压缩效率和音质表现。 AAC(Advanced Audio Coding)是一种高级音频编码,它比MP3具有更高的压缩效率,可以在相同音质下减少文件大小。

    查看更多>>

  • 什么是Prompt工程 - ModelBuilder

    什么是Prompt工程 目录 产品介绍 应用场景及案例 产品介绍 在介绍Prompt工程之前首先了解一下什么是Prompt:Prompt也叫提示词,简单的理解成它是给大模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。大模型会基于 prompt 所提供的信息,生成对应的文本或者图片。

    查看更多>>

  • 什么是KTO训练 - ModelBuilder

    常见问题 Q:KTO训练和DPO训练有什么不同? A:训练过程中KTO方法需要对输出结果进行二元判断,符合预期/不符合预期,所以其收集的数据为Prompt+Chosen或Rejected;DPO训练依赖人类反馈,需要对输出结果进行偏好性判断,两个输出的倾向程度,所以其收集的数据为Prompt+Chosen和Rejected。

    查看更多>>

  • 什么是SimPO训练 - ModelBuilder

    什么是SimPO训练 SimPO(Simple Preference Optimization) : SimPO是一种用于优化和提升预训练大模型性能的技术。它旨在通过简单而高效的方式,调整模型参数,从而在保持模型性能的同时,减少计算资源和内存的消耗。SimPO 主要关注参数效率,这意味着它能够在不大幅增加模型参数的情况下,显著提升模型的性能。

    查看更多>>

  • 什么是DPO训练 - ModelBuilder

    什么是DPO训练 DPO(Direct Preference Optimization) : 直接偏好优化方法,通过直接优化语言模型来实现对大模型输出的精确把控,不用进行强化学习,也可以准确判断和学习到使用者的偏好,且效果更加突出。 本平台已预置DPO模型训练方式,快 开启 您的模型训练之旅吧~ 优势 操作更便捷 :更容易实施和训练,只需匹配专有数据集和训练模型,即可发布服务。

    查看更多>>

  • 什么是插件应用 - ModelBuilder

    什么是插件应用 目录 产品介绍 应用场景及案例 插件应用已于2024年7月31日迁移至AppBuilder,本文档为历史参考,如有需要请您于 AppBulier 使用或关注 。 产品介绍 插件应用(Plugin)是大语言模型(LLM)的应用构建工具,帮助用户快速构建LLM应用或将LLM应用到自建程序中。开发者可以通过LLM API 以及内置的模块等快速的启动LLM应用的创建工作。

    查看更多>>

  • 基于LangChain的LLM应用开发——代理 千帆社区

    其实就目前大语言模型的水平而言,把大语言模型作为推理引擎更有用:给它提供一些文本或者其他信息来源,大语言模型可能会使用从互联网学习的背景知识,同时也会利用我们提供的新信息来帮助回答问题、推理内容,甚至决定接下来要什么。LangChain的代理框架会协助我们这件事。 代理就是一种用大语言模型做出决策、调用工具来执行具体操作的系统。

    查看更多>>