Skip to main content

语料清洗

语料清洗包括清洗:(1) 未翻译句段 (2)原文与译文相同句段 (3)原文相同,译文不同句段 (4)原文不同,译文相同句段 (5)去除重复句段


未翻译句段

“未翻译句段”指TMX文件中若有译文空白句对,可通过此功能进行筛选。


原文与译文相同句段

“原文与译文相同句段”指筛选TMX文件中原文与译文(左右两列)完全相同的句对,用户可按需选择性进行删除。删除完成后,单击高级功能面板中的关闭按钮,可显示剩余数据。


原文相同,译文不同句段

“原文相同,译文不同句段”指筛选TMX文件中原文相同,译文不同句段,并可根据需要选择“保留第一条”。

删除完成后,单击高级功能面板中的关闭按钮,可显示剩余数据。


原文不同,译文相同句段

“原文不同,译文相同句段”指筛选TMX文件中原文不同,译文相同句段,并可根据需要选择“保留第一条”。

删除完成后,单击高级功能面板中的关闭按钮,可显示剩余数据。


去除重复句段

去除重复句段是去除TMX文件中内容完全重复的句对,只保留一条句对。

注:该操作无法撤销,请谨慎操作。