跳到主要内容

字数统计

字数统计功能,可自动计算项目文件与记忆库句段的匹配情况、句段重复情况,并生成统计报告,协助项目管理人员快速估算工作量。


如何查看统计报告

您可点击项目管理,进入项目列表,点击项目名称进入项目详情页面,在上方标签页选择【统计】进入字数统计页面,查看并下载统计报告。

  • 如您在项目中首次上传待译文档,则统计报告将在文件上传后自动生成。

  • 如您在文档上传后,更改了项目设置中的记忆库设置,或追加上传文档、删除文档时,则需重新生成报告。在统计页面选择好语言方向统计维度项目文件记忆库后,点击【重新生成报告】即可。

mceclip0.png

注:如您已在编辑器中开始工作,将某些句段翻译并写入了记忆库,重新生成报告时,这些句段将会被被归入102%匹配。

  • 您每次生成的统计报告都会被记录。点击【统计记录】,在下拉菜单中切换报告生成时间,可查看或下载相应统计数据。

mceclip1.png

  • 当项目中有多个文件时,总计数据和各文件数据将在统计界面依次排开,您可滚动页面查看。

mceclip4.png


解读统计信息

报告中,统计信息包括百分比、句段数、字符数(不计空格)、字数(含符号)、字数、中朝字符、空格数、数字和符号等多重维度,项目管理人员可按实际情况查看所需数据。

注:各平台、统计工具对以上维度的定义和计算规则可能会稍有不同,属正常现象,请以实际结果为准。

YiCAT统计信息定义

mceclip2.png

1.数据类型

  • 新字指在记忆库、项目其他文件中没有相同或相似内容(即记忆库匹配度50%以下)的句段。该概念亦应用在:字数计价设置

  • 50%-74%、75%-84%、85%-94%、95%-99%、100%、101%、102%指文件内容中,对应翻译记忆库不同匹配度的句段。该概念亦应用在:句段状态

注:此处数据与项目设置中的记忆库最低匹配率设置无关。参考:什么是记忆库最低匹配率?应当如何设置?

  • 内部重复指一个文件内部重复的句段。该概念亦应用在:锁定重复句段

  • 跨文件重复指一个项目内,多个文件间重复的句段。该概念亦应用在:锁定重复句段

  • 总计指以上各数据的合计。

2.【数据维度

  • %百分比指按照字数(不包含)符号统计出的占比。

  • 句段指文档导入至YiCAT中,通过句号、问号、感叹号等默认断句规则或自定义断句规则,被拆分出的翻译单元。

  • 字符数(不包括空格),即Characters,指字符的个数。如一个汉字字符数为1,一个英文字母字符数为1,一个标点符号字符数为1,单独一个数字字符数为1(例如“1029”的字符数为4)。

  • 字数(含符号),即Words,指字(词)的个数。如一个汉字字数为1,一个英文单词字数为1,一整个数字字符数为1(例如“1029”的字数为1)。注意此处词数不包括空格。

  • 字数(不包含符号), 注意此处词数不包含符号,其余同上。

  • 中朝字符,即中文字符与朝鲜语单词字符数。如一个汉字中朝字符数为1。注意此处中朝字符不包含数字、空格、标点与英文单词。

  • 空格数,即句段中含空格的个数。

  • 数字,即句段中含一整个数字的个数(例如“1029”的数字数为1)。

  • 符号,即句段中含标点符号的个数(例如“《雷雨》是剧作家曹禺创作的一部话剧,发表于1934年7月。”一句中,符号数为4)。

注1:上述维度中的字数(含符号),与Microsoft Office Word 中的字数概念最为接近。

mceclip4.png

mceclip1.png

注2:项目基本信息中的总字数,即指项目中所有文件的字数总和(不包含符号)。

mceclip3.png


如何下载统计报告

  • 生成(切换至)您想下载的统计报告页面,点击【下载统计报告】,即可下载.xlsx格式的统计报告文件。

mceclip5.png

  • 统计报告格式如下

mceclip6.png