excel是啥意思(用Multiterm创建术语库)

wufei123 发布于 2024-01-14 阅读(171)

(Prerequisite)在您阅读本文前,可能还需要阅读之前的推文:使用SDL trados翻译单一文档(入门/基础使用) 从Excel创建术语库Multiterm提供了Convert插件,用于将其他格式的文本转换为术语库中间格式。

你可以在开始菜单键入 Convert 找到:

在开始导入之前,我们应该让术语库有着Multiterm可识别的格式。Excel应该满足的格式在上一篇文章,我使用了下图形容术语库大致是个什么:

其实,这也差不多是Multiterm的导入格式导入格式应该满足以下基本条件:第一行描述这一类内容是什么,可以是描述这一列文字使用的语言,例如英文(English)、中文(Chinese)或是其他语言,也可以是说明性内容;。

虽然对此行填写格式没有明确要求,但为了软件能够清楚的识别,建议使用语言的英文名(这部分的示例图只是告诉你可以这样写,但不建议这样)每一列只写一种语言,每一行是一个术语在不同语言下的描述,可以部分留空(例如:我不知道aircraft对应的日文,此格可以留空);。

除此之外,没有多余的内容,表格左一列、上一行不留空。示例图:(不建议)

(推荐)

实际上,术语库不录入这种并不“专业”的用词,这里的术语库创建仅仅是示例,不要将常见词添加到术语库;在术语库中,使用的索引语言还是以其中的两个为主体的,你可以在Multiterm中选定转换为Multiterm xml格式(中间格式)。

启动程序按之前的提示启动Convert程序,在开始页面点击 下一步;随后的转换会话页提示你可以使用:过去已经保存的转换设置;或者是创建一个新的转换会话(在选项处可以选择保存,作为演示我不保存,直接下一步)

选择源文档类型Convert可以把其他形式的术语数据转换为MultitermXML格式,这里是由Excel转换的,因此选择倒数第二个。然后点击下一步。

浏览文件点“浏览”选择原文件,随后的内容应该是默认填好的,如果需要更改位置,请手动“另存为”保存。这里不修改默认保存位置(保存位置为 源文档所在的文件夹),点击“下一步”。

字段指定Convet将自动获取首行内容作为每一列的标题(列标题字段),但软件并不知道到文件对应的是哪个语言(或者是对应说明性内容),需要用户在此页指定依次点击标题字段标签,选择字段类型(这里演示的是语言字段),在下拉框中选择本列对应的语言。

每一列都设置后,点击下一步

术语库条目结构(说明性字段指定)如果存在说明性字段,在这一页可以指定说明性字段需要放在条目中的哪个位置。由于这里没有说明性字段,这里点击下一步。检查设置,然后继续“下一步”。

到这里,Excel格式的术语数据转换就已经完成了。请确认成功转换的条目数和Excel中的条目数量是否一致,这样可以检查有没有转换失败的条目。

对异常条目的处理使用Excel导入时没有提供异常处理对于其他格式,可能会出现不能全部导入的情况,异常条目处理可以将无法导入的内容另外存储对于其他类型的源文件在有些环境下,无法从Excel直接转换,这时,可以将Excel转换为csv后进行转换。

在Excel另存为中选择文件格式为 csv(以逗号分隔)的保存形式请注意只能选择csv格式,请注意记住后面对应的分隔格式,如 空格分隔这是未来Convert划分的依据也可以使用txt格式做convert处理,但也需要知道条目分隔的格式。

在随后的警告对话框一路点击 确定;

在文件类型页面选择电子表格或数据交换格式;

选择对应的分隔格式(如果文件有多个分隔符,则都选上),然后检查预览情况;

未提及的部分和Excel转换的操作相同。创建新术语库打开Multiterm,然后按下快捷键 Ctrl+Alt+T (或者依次点击左上角蓝色按钮“文件”、“新建”、“创建术语库”。

)关于创建术语库的详细操作请参考星期天先前的推送 Trados入门 (¥¥这里插入连接¥¥)。需要注意的是:在创建索引字段处,需要和电子表格内的语言对应,电子表格内的语言必须创建对应的索引字段

导入到刚创建的术语库在左侧栏按图示点击:切换到术语库状态栏;右键要添加到的术语库;点击“导入术语库”;

找到刚刚转换出来的xml文档(如果你使用的是默认设置,则在源文件目录下,文件名以.mtf结尾的XML类型的文件;

如果你的源文件严格按照对应格式的话,可以勾选快速导入,否则,请不要勾选(例如:当原表格第一行不是语言对应的英文时,不要勾选);

未选择快速导入时,下一步需要设定排除条目的保存位置,点击另存为选择一个保存位置即可,然后点击下一步;

在处理结果页,请注意核对导入成功的条目数;

下图画框区展示的是术语库语言方向,可以在此位置修改。如果有多个语言,可以在此选择哪两个语言是首要语言。

从待译文段中提取术语我们可以利用SDL Multiterm Extract从文本中提取高频出现的词汇、短语,然后,从中选出术语并手动翻译请注意,如果没有另外导入汉语停止词,请不要使用Extract提取中文术语。

创建项目以下,没有特殊说明的,请在完成该步步骤后,点击Next,而不是Finish。大多数情况下,创建文件或项目都是使用快捷键Ctrl + N,这里也是如此,你也可以按照下图指示的位置打开创建窗口。

设置项目类型在NewProject窗口左侧的列表,可以选择创建的Project类型,在这里,星期天只介绍部分类型(其他的星期天也不会用)单语言术语提取项目:从单一语言中提取术语;双语言术语提取项目:从对齐的或双语文档中提取术语;

从已存在的术语库中提取术语QA项目(不清楚是做什么的,下同)字典项目这里,我们从单一语言的待译文段中获取术语,但由于我们要一并准备术语的翻译,所以选择多语言术语提取项目它可以一并创建目标语言的字段(虽然是空的),这允许我们直接输入术语的翻译。

设置源术语库在这里,你可以提前选择项目提取到的术语(在这里,也包括翻译,因为是双语的)保存在哪里(选择一个术语库),或者,不使用术语库而直接选择翻译方向。这里演示的是不使用术语库的情况。

添加文件将文件添加到项目。项目将从这些文件中提取术语。

要排除的术语如之前所说,有的高频出现的词语并不是术语,虽然Extract默认了一些排除文字,如有必要,你仍然可以指定排除的术语。这也可以避免术语库中的术语重复。

来自术语库(Exclue termbase)在本例中,我们要翻译术语,如果术语库中包括了这部分术语,我们就不用翻译了对于这部分术语,可以从术语库中导入要排除的项目来自文件(Exclude file)你也可以从文件中导入排除项目。

移除添加的排除文件(Remove)在选中要排除文件(文件所在行变蓝)的情况下,点击Remove记录被排除术语(Record discarded terms)Extract将会把排除的术语保存到被排除的术语列表。

点击Browse可以选定记录位置术语提取设置

术语长度范围(Minimum/Maximum term length)可以选择要提取的术语长度(单词个数),这根据具体要提取的术语类型而定术语提取精度(Silence/Noise ratio)(信噪比)。

提取的术语可能包含无用的术语,或一些错误信噪比越偏向于Silence,提取到的术语越少,准确度越高;相应的,Noise,提取到的术语多,准确度低排除无用词(Stopword)停止词Stopword是诸如语气词,标点符号等内置的判断词,它们会从提取结果中排除。

可惜的是,对于中文并没有默认的stopword设定,当中文文档是源语言时,术语提取精度会很低*#01#*自定义stopword、汉语停止词在本阶段,不需要设置最大提取术语数(Maximum number of extracted terms)。

最终提取到的术语是按照 “是术语的可能性”由高到低排序的,设定最大术语数,可以排除掉那些可能性低的词组。寻找释义Extract可以从网络中自动寻找释义

*#02#*配置自动寻找。处理文件提取术语在完成了上述设置(并确认了设置信息,按下Finish)后,软件会提示你开始处理。如下图所示。

如果不想立即开始处理,那么请点击否。稍后可以按下 F7 开始处理。

界面概述

术语页术语页列出按照要求提取到的所有词组Score为这个词组的得分(是术语的可能性),100为满分*#03#*Domain星期天也不知道是啥术语属性页这里设置术语的相关信息Remove Entry 可以移除术语条目;。

Concordance 将会在一致性页面列出所有出现所有术语的句子;Synonyms 输入同义词;Acronym 输入缩略词;Definition 设定术语的概念;Context sentences 上下文句子;

*#04#*不知道是干啥的一致性页面这里展示所有使用这个词组的句子自行翻译术语在图中画箭头的地方键入术语在你输入翻译之前,可以点击术语属性页的 Concordance 查看所有句子请确定词组在句子中有相同的意思,如果意思相差较大,请考虑增加释义或删除术语条目。

输入释义后按下回车,即可保存一个释义再次点击可以再创建一个翻译然后,点击蓝色箭头(术语属性页左上角)翻译下一个术语自行探索将软件语言设置为中文可能会更方便你自己发现新功能点击View->User Interface Language。

导出术语列表按下 Ctrl + E 即可导出文件。点击Next后可以选择保存为什么格式。

格式依次为:保存到 Multiterm 术语库;保存到 Multiterm XML 中间格式;保存为 制表符分隔的文本文件导出到文本文件选择文件保存位置,然后直接导出即可点击Browse选择保存位置;准确来说是保存到哪个文件,还请输入文件名;

选择过滤器;完成导出。导出到术语库提示Tips:只会导出到高亮选中的术语库;需要事先创建术语库;术语库的语言方向应该和之前的设定一致。选择保存到哪个术语库;

选择过滤器;(按照你设定的条件导出指定的术语)选择要导出的语言;请保证导出的语言方向和术语库一致!设定导出时的冲突处理方式:

从上到下依次为:将条目作为新条目导出(Export all terms as new entries):----为(同一个词组的)每个翻译都创建一个新条目(Export each translation to a sepatate new entry);

----将(同一个词组的)所有翻译作为一个新条目创建(Export all translation to one new entry);将条目和现有术语条目合并(Update existing enties and merge on sourse index term);

让我自己选择如何处理冲突项目(Prompt for each term);处理冲突:选择 我自己处理 时,需要对每个冲突项目进行手动选择点击 Entry 1 下方的方框+可以展开条目1在术语库中的术语释义。

手动勾选需要合并的条目,然后点击Merge;或者创建一个新条目,点击Cteate New Entry完成导出-=EOF=-仅供个人学习使用,不允许转载、二次投稿或用作商业用途片段引用应当在明显的位置注明本文连接。

本文首发于微信公众号:沉默的异常。沉默的异常.小野人的星期天 版权所有。

亲爱的读者们,感谢您花时间阅读本文。如果您对本文有任何疑问或建议,请随时联系我。我非常乐意与您交流。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

宝骏汽车 新闻14965