永远在问你「要不要翻译这个网页?」的 Google Translate,这下子守备范围又再扩大一些了。新增的 13 种语言为阿姆哈拉语(衣索比亚)、科西嘉语、弗里斯兰语(北荷兰、北德)、吉尔吉斯语、夏威夷语、库尔德语(土耳其、两伊、叙利亚一带)、卢森堡语、萨摩亚语、苏格兰盖尔语、修纳语(辛巴威)、信德语(巴基斯坦)、普什图语(阿富汗)、和科萨语(南非),再加上原有的 90 种语言,Google 表示已涵盖了 99% 的上网人口。

Google翻译再添13种语言,现在支持103种语言,覆盖99%网络人口-老D

在发布文中,Google 的团队也顺便解释了一下新的语言是如何被加入的。除了该语言必需有文字之外,还要能在网络上找到足够数量的翻译对照文字,让 Google Translate 的系统做机器学习与模式辨认。等到系统学习到一定程度后,还是要有志愿者来检查 Google 的翻译是否正确,特别是一些比较俚语的用法的修正。想想 Google Translate 从开始服务到现在已经过了十个年头,虽然很难做到完美,但能有现在这样的程度已经是非常了不起的了呢!

Google翻译在寻找新语言的标准包括它必须是一种有纪录的文字,而且可在网路上找到大量的翻译,后者Google是藉由机器学习、授权内容及翻译社群的协助达成目的,估计迄今全球已有超过300万用户贡献了约2亿个翻译文字。

虽然新支援的文字看起来很陌生,但它们其实都有自己独特的地位,例如阿姆哈拉语是闪语的第二大语言,仅次于阿拉伯文,科西嘉语是拿破仑的母语,绍纳语是班图语系数百种语言中最流行的,科萨语则是南非的第二大语言。

Google亦鼓励所有的用户加入翻译社群,以协助Google改善各种语言的翻译品质。

而百度仅仅支持27种语言,质量还是一般般,图样图森破。