趣卡翻译语料库功能介绍

H

hello_kitty 趣卡翻译

发布时间:2021-05-17阅读(2079)


主要新增功能如下:

  • 支持语料库系统。

  • 解决之前两段甚至多段文本合成一段的问题,新版本翻译按段分类,更好排版PDF。

  • 解决换行、"-"等符号导致翻译不准确的问题。

  • 解决腾讯翻译漏翻问题。

  • 优化翻译体验。





语料库系统


纠正专业词汇翻译不准确问题,你让专业名词翻译成什么它就翻译成什么。感谢用户reinfo发布的语料库体验效果文章,截取其中的文字说明:


程序把training翻译成培训,导致这段话“The learned algorithms are domain-agnostic and can generalize to new environments not seen during training.”翻译有问题:学习的算法是领域不可知论,可以概括到新的环境,没有看到在培训。

把training -> 训练 平行词汇加到个人创建的语料库之后,这段话就得到了如下翻译结果所学习的算法与域无关,可以推广到训练期间未见的新环境中。




多段文本分开


新程序在一定程度能有效识别文中的段落,在一定程度上按照段落分隔开,提高了用户的阅读和中英文对照体验。



换行、"-"等符号问题


PDF中"-"符号会将单词分成两个,你通过复制翻译会发现出现很多换行符且“-符号会将单词分成两个,导致翻译不准确。
本程序能有效删除换行符,并识别末尾出现的"-"符,并将分开的单词合并,对于内部出现“-的字符,本程序不会进行误删,有效的保留全文意思。

先前重要功能说明



  • 修改中文字体功能:配置文件中font_size表示翻译之后的中文字体大小,默认为9号字体。如果你感觉翻译的中文字体过小,且留有较多空白内容,可以通过设置font_size的大小调整字体,如果设置字体过大的话,程序会根据剩余空白内容自动调整该段的最佳字体大小。

  • 分页翻译功能:配置文件中的split表示分页翻译,比如你的文档页数为100,你只想翻译1-10页,可以将split的值设置为1,即可进入分页翻译模式。

  • 多种翻译器支持:配置文件中translation表示翻译器的名称,目前支持的公有翻译器的名称分别填google,bing,无需要输入后面的秘钥信息也能正常翻译。私有翻译器的名称填qq,baidu,deepl,需要输入后面的秘钥信息才能正常使用。

  • 中英文对照支持功能:将中文翻译结果和英文原文进行合并,达到对照的效果。



喜欢(5) 收藏 举报 分享来自:Mac客户端
发表评论
0条评论
首页 语料库 发布 文章 我的