logo
2

【百度千帆杯●贺岁灵感模型比赛】OMLJ的参赛方案说明

首先,致谢:

感觉我们非常幸运:在诸多竞争对手中,在百度的自动评估中,我们的排名目前位列前5!
感谢百度提供这么优秀的平台与资源、以及百度老师们不辞辛苦地比赛组织运营!

其次,汇报参赛的整体方案:

1、方案的初衷:
不是为了比赛而比赛,我们拟定参赛的初衷是:(1)按比赛要求严格进行准备数据与模型训练;(2)同时也希望训练出来的模型:能够具有实用价值。
我们公司的主营产品线是:命理学的软件产品,比如知运八字、奇门遁甲、梅花易数;
因此我们期望本次比赛的成果也能在我们这个垂直细分领域上(AI+命理学)得以实用。
2、数据集准备:
我们准备了两份数据集,
(1)比赛专用的数据集:总共准备了214条样本数据。全部是人工制作的。严格遵守:“百度千帆杯赛题:贺岁灵感模型”的赛题要求,进行数据样本制作;包括生成、摘要、扩写等常见应用场景及常见风格与修辞等要求;尤其人工严查:字数误差等异常情况。
标准的样本举例:
[{"prompt": "假如你是环保活动协调员,请为志愿者和支持者准备一段60字的激励环保风格的春节祝福。", "response": [["春节到,祝福环保志愿者们如春风化雨,滋润大地;如绿意盎然,点缀生活。愿我们共筑美丽家园,春节快乐,环保行动,岁岁年年!"]]}]
注:字数严控误差,比如本例子要求60字、实际是59字。
(2)命理学数据集:我们总共准备了313条样本数据。也完全参照比赛数据集的格式。只不过在形式上,借用问答模式,实现了命理学知识的呈现。
标准的样本举例:
[{"prompt": "假如你是命理学专家。请问:何为伤官伤尽?限100字。","response": [["伤官伤尽,八字最为珍奇,富贵荣华入朝堂。伤官伤尽,即天干伤官,在八字四柱中有伤官没有一个官星;或地支内藏有正官,但又自动化掉,称为伤尽。但如有正官透干叫伤之不尽,八字混杂不清,为凶,就不叫伤官伤尽了。"]]}]
3、我们的模型训练:
(1)基于百度文心的基础模型:
ERNIE-Speed。
(2)特别参数:
AI调参是模型训练中至关重要的一环,因其复杂性而被称之为一门“玄学”。
本次我们模型训练时,参数设置主要是根据模型与数据集的特性而设置的;个别参数:是基于命理学角度生旺我们运势的吉祥数字。实际参数的截屏如下所示:
(3)模型训练多次,反复打磨。训练次数截屏如下所示:
4、应用成果:
(1)我们发布了模型的在线服务,及时提交作品、参赛:
[图片]
(2)同时我们也将本次训练获得的、宝贵的贺岁灵感模型,应用到了我们垂直细分领域、即:AI+命理学+对传统行业的创新。详情如下
a)4个背景是:
l《中国统计年鉴(2022)》数据显示,截至2021年,全国15岁以上单身人口约为2.39亿人;
l根据2021年的第七次人口普查数据显示,我国人口总量达到141178万人,男性人口72334万人,占51.24%,女性人口为68844万人,占48.76%,总人口性别比为105.7,中国男性足足比女性多了3490万;
l根据网上不完全统计,我国目前有1亿左右的大龄女性正处于单身状态
l根据国家统计局发布的数据,我国当前的生育率情况呈现出持续走低的趋势。
b)借用本次“百度贺岁灵感模型比赛”获得的宝贵的大模型,结合着上述国计民生的议题,我们提出的创新场景是:为单身人士,提供个性化的脱单建议与贺岁祝福!具体成果的使用说明如下:
l提交:希望脱单人士的生日信息
l计算:生辰八字信息,
l获得:AI大模型的个性化的脱单建议、新年祝福、个性化脱单祝福的七律唐诗。
c)应用成果的两个截屏如下:

最后,再次感恩感谢百度及百度老师们的付出!

评论
用户头像