HBase 爱速搭低代码平台 智能边缘 私有网络 应用引擎 文件存储 智能云解析 MapReduce 简单消息服务 轻量应用服务器 智能视联网平台 云数据库GaiaDB-X 日志服务 消息服务 负载均衡 对象存储 云虚拟主机 数据仓库Palo 容器镜像服务 云数据库DocDB 超级链BaaS平台 云原生微服务应用平台 解决方案 智慧城市 智慧金融 智能制造 智慧能源 智慧媒体 智慧水务 智能图云 企业上云
结合社会治理建设内容,统筹考虑40余家综治成员单位与社会资源数据情况,细化专题数据库设计,设计建立专题数据库160余个。 -整合社会治理专题数据,形成整个政法体系的集数据汇聚、存储、处理、监管、共享多位一体的大数据中心,为智能研判中心和各类实战应用提供数据支撑。 方案优势 数据优势 通过汇聚及关联时空数据、互联网数据、物联网数据,为城市构筑全面感知能力,索引城市万物,实时感知和洞察城市态势。
导入纯文本数据 目录 导入数据 BOS导入 分享链接导入 平台已有数据集 登录到 千帆大模型操作台 ,在左侧功能列选 通用数据集 ,进入主任务界面。 泛文本无标注数据多用于特定行业方向/场景下的大规模无标注数据语料,作为后续 Post-pretrain 的训练输入,推荐数据量至少10亿tokens,如需试用的话,则推荐1千万tokens及以上的数据量,凸显训练效果。
导入Prompt+Response数据 目录 导入数据 无标注信息 有标注信息 登录到 千帆大模型操作台 ,在左侧功能列选择 通用数据集 ,进入主任务界面。 导入数据 如果您选择的是导入 非排序文本 对话数据,除了支持 手动构建 方式导入数据,还支持 FAQ挖掘 的方式导入数据。 手动构建 适用于文本对话数据(含排序和非排序数据集)的导入。
3、选择新的数据源 如果导入文件中的报表和大屏中用到了数据库类型的数据源,您需要选择这些数据源在目标报表空间中对应的新数据源。如果没有,您需要在报表空间中先创建好新的对应数据源后再进行导入操作。
导入Prompt集数据 目录 导入数据 本地导入 BOS目录导入 分享链接导入 平台已有数据集 登录到 千帆大模型操作台 ,在左侧功能列选择 通用数据集 ,进入 训练数据集 主任务界面。 导入数据 创建数据集 完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。
导入Prompt+图片数据 目录 导入数据 无标注信息导入 有标注信息导入 登录到 千帆大模型操作台 ,在左侧功能列选择 通用数据集 ,进入主任务界面。 导入数据 创建数据集 完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。
导入Prompt+Chosen+Rejected数据 目录 导入数据 BOS导入 分享链接导入 平台已有数据集 登录到 千帆大模型操作台 ,在左侧功能列选 通用数据集 ,进入主任务界面。 Prompt+Chosen+Rejected数据多用于直接偏好优化,作为后续 DPO 的训练输入,推荐数据量至少100条数据,才能显现训练效果。
数据集的其他操作 目录 查看数据 发布数据 处理数据 删除数据 登录到 千帆大模型操作台 ,在左侧功能列选择 通用数据集 ,进入数据集管理主任务界面。 查看数据 平台支持您查看数据信息的概览,了解数据集版本ID、数据量、导入日志等等基本信息 点击指定数据集版本操作列的“详情”按钮,查看全部数据、有标注信息的数据和无标注信息的数据。并且支持根据导入日期、标注日期等条件进行筛选。
发起数据集导入任务 功能介绍 用于发起数据集导入任务。 注意事项 调用本文API,需使用 安全认证AK/SK鉴权 ,调用流程及鉴权介绍详见 SDK安装及使用流程 。