專利名稱:譯員專業翻譯能力的量化方法
技術領域:
本發明涉及計算機領域,具體而言,涉及一種譯員專業翻譯能力的量化方法。
背景技術:
目前的譯員的能力量化方式,主要是通過完整的語篇翻譯。這是翻譯測試中最常用的測試方法,主要用于測試譯者的跨文化交際能力以及雙語轉換能力,這是最能測驗譯者翻譯水平的一種測驗方式,具有很高的效度,但最大的缺點在于評分標準難以控制,對同一個翻譯,不同閱卷人,或者同一閱卷人在不同時候,給出的成績都可能會有很大的出入。在翻譯后,統計每個譯員的得分,目前采用的技術是人工判分后,統計每個人的得分,這樣處理,效率低,且存在主觀性強,得分不夠客觀,不能實現客觀的量化譯員的翻譯能力。
發明內容
本發明旨在提供一種譯員專業翻譯能力的量化方法,以解決的上述譯員評分過程,不夠客觀的量化譯員的翻譯能力問題。在本發明的實施例中,提供了一種譯員專業翻譯能力的量化方法,包括根據譯員的專業測試要求,選擇相應的多件測試稿件提供給譯員進行翻譯測試;將每件譯后稿件與相應的標準譯稿進行相似性分析,得到其相似度數值;其中,所述相似度值介于O I之間;提取每篇測試稿件內的關鍵詞,與術語語料庫進行匹配,確定每篇稿件的術語數量,作為計算稿件權重的基值;通過所述基值、所述測試稿件的翻譯難度系數、和譯員的翻譯速度系數確定出每件測試稿件所占的權重;將每篇測試稿件的權重與該測試稿件的標準譯稿同譯后稿件的相似度值對應相乘,將所有乘積相加,所得數值乘以100得到一個O 100之間的數值,將該數值作為該譯員在該專業的翻譯能力分值。本發明的方法,通過客觀的譯后稿件與標準譯稿進行相似性分析,得到相似度,并將術語的數量、測試稿件的難度系數以及譯員的翻譯速度作為權重計算項,通過相似度和權重二者結合得到譯員專業翻譯能力的量化值。得到了客觀的結果,提高了量化的效率。
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中圖1示出了實施例的流程圖;圖2示出了實施例中量化過程的流程圖;圖3示出了實施例中樹形結構圖。
具體實施例方式下面將參考附圖并結合實施例,來詳細說明本發明。參見圖1,包括以下步驟Sll :根據譯員的專業測試要求,選擇相應的多件測試稿件提供給譯員進行翻譯測試;S12 :將每件譯后稿件與相應的標準譯稿進行相似性分析,得到其相似度數值;其中,所述相似度值介于O I之間;S13:提取每篇測試稿件內的關鍵詞,與術語語料庫進行匹配,確定每篇稿件的術語數量,作為計算稿件權重的基值;S14:通過所述基值、所述測試稿件的翻譯難度系數、和譯員的翻譯速度系數確定出每件測試稿件所占的權重;S15:將每篇測試稿件的權重與該測試稿件的標準譯稿同譯后稿件的相似度值對應相乘,將所有乘積相加,所得數值乘以100得到一個O 100之間的數值,將該數值作為該譯員在該專業的翻譯能力分值。本發明的方法,通過客觀的譯后稿件與標準譯稿進行相似性分析,得到相似度,并將術語的數量、測試稿件的難度系數以及譯員的翻譯速度作為權重計算項,通過相似度和權重二者結合得到譯員專業翻譯能力的量化值。得到了客觀的結果,提高了量化的效率。參見圖2所示的量化過程流程圖,該方法的流程過程如下提取測試稿件一篇中到英的有關汽車發動機制造的測試稿件,其語種信息、行業信息和學科領域信息為語種信息中一英行業信息37交通運輸設備制造業372汽車制造3721汽車整車制造學科領域信息470動力與電氣工程470. 30動力機械工程470. 3020內燃機工程(包括汽油機、柴油機、氣體燃料發動機等)對譯員能力進行判斷,如果已經經過判定,則進入譯員能力選擇/比較模塊,如果沒有經過判定,則進行翻譯能力測試系統登陸模塊。譯員登錄平臺申請領取測試稿件。系統讀取測試稿件的語種、行業、學科、領域等屬性信息,若譯員具備該屬性能力,則進入譯員能力比較/選擇模塊;否則分配測試許可號給該譯員進行該專業屬性能力的翻譯測試;申領譯員憑測試許可號登錄翻譯能力測試系統,進行該語種、行業、學科、領域的翻譯能力測試;系統根據測試許可號,從標準測試文檔庫中提取7篇相關測試文檔給待測譯員,包括語種類文檔I篇,行業類文檔3篇(37、372、3721),學科領域類文檔3篇(470、470. 30、470. 3020),其難度系數分別為9、6、8、8、7、8、7,排列順序為語種、行業-交通運輸設備制造業(37)、行業-交通運輸設備制造業-汽車制造(372)、行業-交通運輸設備制造業-汽車制造-汽車整車制造(3721)、學科領域信息-動力與電氣工程(470)、學科領域信息-動力與電氣工程-動力機械工程(470.30)、學科領域信息-動力與電氣工程-動力機械工程-內燃機工程(470.3020),后面的數字順序與此相同;譯員翻譯完成后,根據翻譯時間得到7篇譯文的翻譯速度檔位值分別為:6、8、7、
6、6、7、7,然后調用相似性比較模塊計算譯員的譯文和標準譯文的相似度,得到7篇譯文和標準譯文的相似度值,分別為:0.6,0.65,0.79,0.83,0.77,0.82,0.85 ;優選地,稿件相似性比較模塊進行分析的過程包括:S21:提取每篇譯后稿件和與其對應的標準譯稿所歸屬的屬于一個專業的多篇標準譯稿的全部關鍵詞,得到關鍵詞集合C= {k1;k2,-,kj ;S22:計算C中每個關鍵詞k在稿件集合中出現的概率,即出現關鍵詞k的稿件數和稿件總數之比,記為P (k)。將關鍵詞按P (k)進行降序排序,并將每一個關鍵詞作為一個集合,這樣得到初始的m個待合并集合,記為{kj , {k2},..., {kj ;在這m個關鍵詞中,計算在關鍵詞Ici出現的稿件中,關鍵詞kj也出現的概率,記為P (kj Iki),共計P L個條件概率,(I彡i, j彡m ;i關j);P (kj I kj 的計算方法:P (IijIki)=P (^ki) /p Cki),p (Iijki)為 Ii^ki 同時出現在同一篇稿件中的概率。S23:合并集合,當集合I和J同時滿足以下兩個條件時合并:
權利要求
1.一種譯員專業翻譯能力的量化方法,其特征在于,包括:根據譯員的專業測試要求,選擇相應的多件測試稿件提供給譯員進行翻譯測試;將每件譯后稿件與相應的標準譯稿進行相似性分析,得到其相似度數值;其中,所述相似度值介于O I之間;提取每篇測試稿件內的關鍵詞,與術語語料庫進行匹配,確定每篇稿件的術語數量,作為計算稿件權重的基值;通過所述基值、所述測試稿件的翻譯難度系數、和譯員的翻譯速度系數確定出每件測試稿件所占的權重;將上述所得的權重值結合譯后稿件與標準譯稿的相似度值得到一個O 100之間的數值,將該數值作為該譯員在該專業的翻譯能力分值。
2.根據權利要求1所述的方法,其特征在于,所述相似性分析的過程包括:提取每篇譯后稿件和與其對應的測試文檔庫中的標準譯稿集合的關鍵詞;該關鍵詞的集合為 C={k1; k2,..., kj ;計算C中每個關鍵詞k在稿件中出現的概率,即出現關鍵詞k的稿件數和稿件總數之比,記為P (k);將C中關鍵詞按P (k)進行降序排序,并將每一個關鍵詞作為一個集合,這樣得到初始的m個待合并集合,記為{kj , {k2},..., {kj ;在這m個關鍵詞中,計算在關鍵詞匕出現的稿件中關鍵詞kj出現的概率,記為P(IijIki),共計P I個條件概率,(I 彡 i,j 彡 m ;i 關 j);p (IijIki)=P (^ki)/p Cki),p (Iijki)為h和h同時出現在同一篇稿件中的概率;合并待合并集合,生成以關鍵詞集合C為根節點的關鍵詞概念樹。
3.根據權利要求2所述的方法,其特征在于,所述合并過程包括:對于待合并的兩個關鍵詞集合Cl和C2,合并條件為:存在Ici屬于Cl, kj屬于C2,且p(10>閥值?14 (IijIki) >閥值P2,當P (Iii)和P (k」| Iii)大于所述設定閥值時,關鍵詞Iii和h表達相同概念,滿足其所在的集合的合并條件之一;在合并后的集合中任給一個關鍵詞ki;其與集合中一半以上關鍵詞都滿足條件PCkjIki))閥值 P2。
4.根據權利要求3所述的方法,定義H為生成的概念樹的高度,定義depth(k)為節點k在樹中的深度,即為從根節點到該節點所經歷的邊數;定義com Cki, kj)為離節點Ici和k」最近的共同父節點;任兩個關鍵詞的積的計算公式AiXkj=Clepth (com Cki, k」))/H ;設向量 A=^a2,..., an}, B= , b2,…,bj ,定義向量計算:
全文摘要
本發明提供了一種譯員專業翻譯能力的量化方法,包括根據譯員的測試要求,系統選擇相應的多件測試稿件提供給譯員進行翻譯測試;將每件譯后稿件與相應的標準譯稿進行相似性分析,得到相似度數值;提取每篇測試稿件的關鍵詞,與術語語料庫進行匹配,確定每篇稿件的術語數量,作為計算稿件權重的基值,再結合稿件的翻譯難度和譯員的翻譯速度通過一定的計算模型得出每件測試稿件所占的權重;通過所得權重和相似度值最終計算出該譯員在該專業的翻譯能力分值。本發明的方法,通過客觀的譯后稿件與標準譯稿進行相似性分析,得到相似度,再結合譯稿的權重,計算出譯員專業翻譯能力的量化值。得到了相對客觀的結果,提高了譯員翻譯能力測試的效率。
文檔編號G09B7/00GK103077630SQ201210591760
公開日2013年5月1日 申請日期2012年12月31日 優先權日2012年12月31日
發明者江潮 申請人:武漢傳神信息技術有限公司