工具的力量

Sophy最近在帮人翻译一些资料,翻译是在一个用Java写的软件中进行的。翻译结束交工的时候,对方发来一个字数统计,问有没有意见。我们起初没有统计字数,但对方既然问了,我们就想算算看是不是和对方的统计一样。

这个Java软件本身没有字数统计功能,而且编辑功能很差,也不方便复制,总不能一个一个字数吧?我看它的文件是XLIFF,是翻译界通用的一种文件格式,本身是基于XML的。文件处理不正是计算机的老本行嘛,于是我用PowerShell写了一个脚本,将XLIFF中的翻译源提取出来,统计每个翻译源项目的字数,再将结果导入到一个csv里,用Excel加总出合计字数。PowerShell干这个还真是方便,几行脚本就搞定了。要写个功能差不多的C#程序,估计还要麻烦,关键是C#还得在机器上装Visual Studio呢。

一算不要紧,结果和对方给的差别还挺大。于是我们就将我们生成的Excel和统计结果都发给了对方。他们一查,原来是他们少算了一个XLIFF文件。他们统计字数的方法更原始,是将他们原来对应每个XLIFF的Excel文件内容复制到Word中,用Word的字数统计来看到底有多少字。对方倒是很容易说话,承认了错误,也二话没说同意用我们的统计结果来计算工作量。这一点上,新加坡的机构到确实要比国内规范一些。

像PowerShell这种脚本程序在许多程序员看来是雕虫小技,可是对于翻译来说,这么一小段脚步就可以帮助他们解决类似字数统计这样的问题。技术跨界的时候,确实可以带来意想不到的效果。前几天网上暴红的那篇程序员降级论,说的也就是这个意思吧。