媒资数据字段规范
更新时间:2024-06-13
| 字段名称 | 中文名 | 类型 | 是否必传 | 数据样例 | 备注 |
|---|---|---|---|---|---|
| nid | 物料标识 | string | 是 | NID_1001 | 一条物料的唯一标识,物料id不能重复 |
| title | 媒资标题 | string | 是 | 示例媒资标题 | 电影、剧集、节目等标题,主要用来进行语义分析提取物料特征 |
| display_run_time | 媒资时长 | int | 否 | 61 | 播放时长(秒) |
| country | 国家地区 | string | 否 | 大陆 | 发布国 |
| year | 上映年份 | string | 否 | 2002 | 上映年份,用作特征,如生成某年的排行榜。 |
| desc | 媒资描述 | string | 否 | 示例描述 | 视频描述,主要用来进行语义分析提取物料特征 |
| actors | 演员列表 | strings | 否 | ["成龙"] | 演员列表,支持多个值 |
| directors | 创作者 | strings | 否 | ["袁和平"] | 媒资创作者/导演/出品方id,支持多个值 |
| view_point | 看点 | string | 否 | 样例描述 | 内容看点 |
| score | 评分 | string | 否 | 8.5 | 评分 |
| data_source | 物料来源(电信/移动/联通/其它) | string | 是 | CTC | 运营商或运营商编码: 电信/移动/联调/其它 |
| epi_type | 媒资类型 | string | 否 | program | 物料类型,program单剧集、series连续剧/系列剧、episode子集、channel频道、schedule节目单、album专栏、subject专题 |
| content_type | 内容类型 | string | 否 | video | 指定内容是视频还是图文类型 |
| base_tags | 媒资标签 | strings | 否 | ["动作"] | 内容标签,支持多个值 |
| op_tags | 运营标签 | strings | 否 | ["VIP", "院线"] | 业务方运营的标签 |
| show_tags | 展示标签 | strings | 否 | ["HD"] | 展示标签 |
| valid_time | 生效时间 | long | 否 | 1648561924764 | 物料生效时间, 用于控制物料可被推荐的生效时间,13位时间戳 |
| expire_time | 过期时间 | long | 否 | 1978831694000 | 物料失效时间,用于控制物料过期后不被推荐的场景,13位时间戳 |
| publish_time | 发布时间 | long | 是 | 1648561924764 | 发布时间, 格式: 13位时间戳 |
| operator_id | 运营商ID | string | 否 | CMCC | 运营商(电信、联通、移动等) |
| operator_name | 运营商名称 | string | 否 | 移动 | 运营商(电信、联通、移动等) |
| provider_id | 供应商ID, 直播情况下为直播的频道ID | string | 否 | iqiyi | 供应方ID,媒资提供商或者来源,用作特征 |
| provider_name | 供应商, 直播情况下为直播的频道名称 | string | 否 | 爱奇艺 | 供应方名称,媒资提供商或者来源,用作特征 |
| need_pay | 是否付费 | int | 否 | 1 | 是否付费,0(不付费)、1(付费) |
| channels | 频道 | strings | 否 | ["体育", "科技", "vod"] | 用户自定义标签,可在推荐接口作为推荐条件进行数据过滤 |
| ts | 上传时间 | long | 是 | 1648561924764 | 物料上传时间, 格式: 13位时间戳 |
| url | 视频地址 | string | 否 | 视频地址 | |
| language | 影视语言 | string | 否 | 中文 | 媒资所用语言,用作特征 |
| award | 获奖 | string | 否 | 金马奖 | 用作特征 |
| definition | 清晰度 | string | 否 | 高清 | 用作特征 |
| cities | 城市名称或编码列表 | strings | 否 | ["beijing", "shanghai"] | 物料所属的城市列表 |
| live_tags | 直播时间戳标签列表 | strings | 否 | [] | 直播标签 |
| media_code | 媒资编码 | string | 否 | 媒资编码 | |
| base_tag_codes | 媒资编码 | strings | 否 | ["0042", "0006", "0008"] | 媒资编码 |
| compere | 主持人 | strings | 否 | ["柳敬东", "喻明"] | 主持人 |
| type | 类型标识 | string | 否 | 电影 | 包含电视剧、电影、综艺、儿童动漫、新闻、音乐、体育、纪录片、游戏、直播、短内容合辑、戏曲、公开课,其他类型填未知,用作特征 |
| type_code | 类型标识编码 | string | 否 | 001 | 类型标识编码 |
| heat | 热度 | float | 否 | 1.0 | 热度 |
| is_subset | 是否是子集(如花千骨第二集) | int | 否 | 0 | 是否是子集(如花千骨第二集),0(不是)、1(是) |
