数据堂入选首批“北京市人工智能大模型高质量数据集”合作企业
数据堂大模型数据解决方案
01
无监督学习数据
手势多模态数据
02
监督学习数据
-
监督微调(SFT)数据
-
敏感性Prompt编写/改写:
-
常见output数据标注:
无害性:输出内容不应对人造成身体、心理或社会伤害;设备或财产的损坏或损失;对环境的破坏;或损害人类福祉所必需的机构或资源
-
基于人类反馈的强化学习(RLHF)
-
常见RM数据人工排名标注:
-
常见RM数据多因素评分标注规范:
对模型输出的内容从最好(5分)到最坏(1分)进行打分,包括平分,如果输出质量接近,则分数相同。