字数统计
字数统计功能,可自动计算项目文件与记忆库句段的匹配情况、句段重复情况,并生成统计报告,协助项目管理人员快速估算工作量。
如何查看统计报告
您可点击项目管理,进入项目列表,点击项目名称进入项目详情页面,在上方标签页选择【统计】进入字数统计页面,查看并下载统计报告。
如您在项目中首次上传待译文档,则统计报告将在文件上传后自动生成。
如您在文档上传后,更改了项目设置中的记忆库设置,或追加上传文档、删除文档时,则需重新生成报告。在统计页面选择好语言方向、统计维度、项目文件、记忆库后,点击【重新生成报告】即可。
注:如您已在编辑器中开始工作,将某些句段翻译并写入了记忆库,重新生成报告时,这些句段将会被被归入102%匹配。
- 您每次生成的统计报告都会被记录。点击【统计记录】,在下拉菜单中切换报告生成时间,可查看或下载相应统计数据。
- 当项目中有多个文件时,总计数据和各文件数据将在统计界面依次排开,您可滚动页面查看。
解读统计信息
报告中,统计信息包括百分比、句段数、字符数(不计空格)、字数(含符号)、字数、中朝字符、空格数、数字和符号等多重维度,项目管理人员可按实际情况查看所需数据。
注:各平台、统计工具对以上维度的定义和计算规则可能会稍有不同,属正常现象,请以实际结果为准。
YiCAT统计信息定义
1. 【数据类型】
新字指在记忆库、项目其他文件中没有相同或相似内容(即记忆库匹配度50%以下)的句段。该概念亦应用在:字数计价设置
50%-74%、75%-84%、85%-94%、95%-99%、100%、101%、102%指文件内容中,对应翻译记忆库不同匹配度的句段。该概念亦应用在:句段状态
注:此处数据与项目设置中的记忆库最低匹配率设置无关。参考:什么是记忆库最低匹配率?应当如何设置?
2.【数据维度】
%百分比指按照字数(不包含)符号统计出的占比。
句段指文档导入至YiCAT中,通过句号、问号、感叹号等默认断句规则或自定义断句规则,被拆分出的翻译单元。
字符数(不包括空格),即Characters,指字符的个数。如一个汉字字符数为1,一个英文字母字符数为1,一个标点符号字符数为1,单独一个数字字符数为1(例如“1029”的字符数为4)。
字数(含符号),即Words,指字(词)的个数。如一个汉字字数为1,一个英文单词字数为1,一整个数字字符数为1(例如“1029”的字数为1)。注意此处词数不包括空格。
字数(不包含符号), 注意此处词数不包含符号,其余同上。
中朝字符,即中文字符与朝鲜语单词字符数。如一个汉字中朝字符数为1。注意此处中朝字符不包含数字、空格、标点与英文单词。
空格数,即句段中含空格的个数。
数字,即句段中含一整个数字的个数(例如“1029”的数字数为1)。
符号,即句段中含标点符号的个数(例如“《雷雨》是剧作家曹禺创作的一部话剧,发表于1934年7月。”一句中,符号数为4)。
注1:上述维度中的字数(含符号),与Microsoft Office Word 中的字数概念最为接近。
注2:项目基本信息中的总字数,即指项目中所有文件的字数总和(不包含符号)。
如何下载统计报告
- 生成(切换至)您想下载的统计报告页面,点击【下载统计报告】,即可下载.xlsx格式的统计报告文件。
- 统计报告格式如下