语料清洗
语料清洗包括清洗:(1) 未翻译句段 (2)原文与译文相同句段 (3)原文相同,译文不同句段 (4)原文不同,译文相同句段 (5)去除重复句段
未翻译句段
“未翻译句段”指TMX文件中若有译文空白句对,可通过此功能进行筛选。
原文与译文相同句段
“原文与译文相同句段”指筛选TMX文件中原文与译文(左右两列)完全相同的句对,用户可按需选择性进行删除。删除完成后,单击高级功能面板中的关闭按钮,可显示剩余数据。
原文相同,译文不同句段
“原文相同,译文不同句段”指筛选TMX文件中原文相同,译文不同句段,并可根据需要选择“保留第一条”。
删除完成后,单击高级功能面板中的关闭按钮,可显示剩余数据。
原文不同,译文相同句段
“原文不同,译文相同句段”指筛选TMX文件中原文不同,译文相同句段,并可根据需要选择“保留第一条”。
删除完成后,单击高级功能面板中的关闭按钮,可显示剩余数据。
去除重复句段
去除重复句段是去除TMX文件中内容完全重复的句对,只保留一条句对。
注:该操作无法撤销,请谨慎操作。