GAIIC Track3 “猫老板”队分享 数据处理 清洗:分开连在一起的英文单词,规范标点符号 增强:左右交换pair Pretrain 使用了hfl/chinese-roberta-wwm-ext和hfl/chinese-roberta-wwm-ext-large 单句和pair都用 使用各种mask Finetune 左右交换pair,增强数据 hfl/chinese-roberta-wwm-ext-large:lr=1e-5,weigt clip=1 五折交叉验证 多个checkpoint ensemble