Kukadiria Ubora wa Neural na Uhariri wa Kiotomatiki kwa Tafsiri Inayosaidiwa na Kompyuta

Orodha ya Yaliyomo

1. Utangulizi

Ujio wa Tafsiri ya Neural ya Mashine (NMT) umebadilisha dhana kuelekea kutumia tafsiri zinazotokana na mashine. Hata hivyo, pengo la ubora kati ya matokeo ya NMT na viwango vya kibinadamu linahitaji uhariri wa baada ya mkono, mchakato unaochukua muda. Karatasi hii inapendekeza mfumo wa kina wa kujifunza kwa kina unaounganisha Kukadiria Ubora (QE) na Uhariri wa Kiotomatiki wa Baada ya Tafsiri (APE). Lengo ni kutoa mapendekezo ya kusahihisha makosa na kupunguza mzigo kwa watafsiri binadamu kupitia mfumo wa ngazi unaoeleweka, unaofanana na tabia ya uhariri wa kibinadamu.

2. Kazi Zinazohusiana

Kazi hii inajengwa juu ya nyuzi kadhaa za utafiti zinazounganishwa: Tafsiri ya Neural ya Mashine (NMT), Kukadiria Ubora (kutabiri ubora wa tafsiri bila marejeo), na Uhariri wa Kiotomatiki wa Baada ya Tafsiri (kusahihisha kiotomatiki matokeo ya MT). Inajipatia nafasi ndani ya mfumo wa Tafsiri Inayosaidiwa na Kompyuta (CAT), kwa lengo la kuzidi mifumo ya MT au QE pekee kuelekea mfuatano uliojumuishwa, unaoendeshwa na maamuzi.

3. Mbinu

Uvumbuzi wa msingi ni mfumo wa ngazi wenye moduli tatu za utumishi, zilizounganishwa kwa ukaribu ndani ya mitandao ya neva ya Transformer.

3.1 Muundo wa Mfumo wa Ngazi

Mfumo huu kwanza huchunguza wagombea wa MT kupitia moduli ya kina ya QE. Kulingana na alama ya ubora wa jumla iliyotabiriwa, huelekeza sentensi kwa masharti kwenye moja ya njia mbili za uhariri wa baada ya tafsiri.

3.2 Moduli ya Kukadiria Ubora

Moduli hii hutabiri makosa ya kina ya kiwango cha tokeni (k.m., kutafsiri vibaya, kuacha) ambayo hukusanywa kuwa alama ya ubora wa kiwango cha sentensi. Inatumia kipakiaji cha msingi cha Transformer kuchambua sentensi chanzo na matokeo ya MT.

3.3 Uhariri wa Kizalendo

Kwa sentensi zilizokadiriwa kuwa na ubora wa chini na moduli ya QE, mfumo wa kizalendo wa mlolongo-hadi-mlolongo (unaotokana na Transformer) unatumika kufupisha na kuandika upya tafsiri yote. Hii ni sawa na kutafsiri upya kwa ukamilifu kwa sehemu yenye matatizo.

3.4 Uhariri wa Operesheni ya Atomiki

Kwa sentensi zilizo na ubora wa juu zenye makosa madogo, moduli yenye ufanisi zaidi hutumiwa. Hutabiri mfuatano wa operesheni za uhariri za atomiki (k.m., WEKA, FUTA, BADILISHA_NA_X) kwa kiwango cha tokeni, ikipunguza mabadiliko kwa matokeo ya asili ya MT. Uwezekano wa operesheni $o_t$ katika nafasi $t$ unaweza kuonyeshwa kama: $P(o_t | \mathbf{s}, \mathbf{mt}_{1:t}) = \text{Softmax}(\mathbf{W} \cdot \mathbf{h}_t + \mathbf{b})$ ambapo $\mathbf{h}_t$ ni hali ya siri kutoka kwa mfumo, $\mathbf{s}$ ni chanzo, na $\mathbf{mt}$ ni tafsiri ya mashine.

4. Majaribio na Matokeo

4.1 Seti ya Data na Usanidi

Tathmini ilifanywa kwenye seti ya data ya Kiingereza–Kijerumani kutoka kwenye kazi ya pamoja ya APE ya WMT 2017. Vipimo vya kawaida BLEU (kubwa ni bora) na TER (Kiwango cha Uhariri wa Tafsiri, ndogo ni bora) vilitumika.

4.2 Matokeo ya Kiasi (BLEU/TER)

Mfumo wa ngazi uliopendekezwa ulifikia utendaji wa hali ya juu kabisa kwenye kazi ya APE ya WMT 2017, ukizidi njia zilizoshika nafasi za juu katika alama za BLEU na TER. Hii inaonyesha ufanisi wa mkakati wa uelekezaji wenye masharti na njia ya uhariri wa baada ya tafsiri mbili.

Vipimo Muhimu vya Utendaji

Alama ya BLEU: Ilifikia matokeo bora zaidi ikilinganishwa na SOTA ya awali.

Alama ya TER: Ilipunguza kwa kiasi kikubwa umbali wa uhariri, ikionyesha uhariri wa baada ya tafsiri wenye uaminifu wa juu.

4.3 Tathmini ya Kibinadamu

Katika tathmini ya kibinadamu iliyodhibitiwa, watafsiri walioidhinishwa waliombwa kuhariri matokeo ya MT na bila usaidizi wa mfumo wa APE uliopendekezwa. Matokeo yalionyesha kupungua kwa kiasi kikubwa kwa wakati wa uhariri wa baada ya tafsiri wakati wa kutumia mapendekezo ya APE, ikithibitisha matumizi ya vitendo ya mfumo huo katika mfuatano wa kazi wa CAT ulio halisi.

5. Uchambuzi wa Kiufundi na Mfumo

5.1 Uelewa wa Msingi na Mtiririko wa Kimantiki

Uelewa wa Msingi: Mafanikio ya msingi ya karatasi hii sio tu mfumo mwingine wa APE; ni utenganishaji wa kimkakati wa mchakato wa utambuzi wa mhariri wa kibinadamu kuwa mti wa maamuzi unaotekelezwa na mitandao ya neva. Badala ya mfumo wa "kurekebisha" mmoja, wanaiga hatua ya kwanza ya mtafsiri mtaalamu: kukadiria, kisha kutenda kwa usahihi. Hii inafanana na mfuatano wa "kukadiria kisha kutenda" unaoonekana katika roboti za hali ya juu na ujifunzaji wa kuimarisha, ukitumika kwa kusahihisha lugha. Uchaguzi kati ya uhariri wa kizalendo na wa atomiki ni mfano wa moja kwa moja wa mtu anayeamua kati ya kuandika upya aya yenye matatizo au kusahihisha tu makosa ya maandishi.

Mtiririko wa Kimantiki: Mfuatano huu ni mfululizo mzuri lakini wenye masharti. 1) Utambuzi wa Ugonjwa (QE): Mfumo wa utambuzi wa makosa wa kina, wa kiwango cha tokeni, hufanya kazi kama zana ya utambuzi wa ugonjwa. Hii ni ya hali ya juu zaidi kuliko kupima alama kwa kiwango cha sentensi, ikitoa "ramani ya joto" ya matatizo. 2) Kupanga Kipaumbele: Utambuzi huu hukusanyika kuwa uamuzi wa jozi: je, hii ni sentensi "mgonjwa" (ubora wa chini) au "yenye afya" yenye magonjwa madogo (ubora wa juu)? 3) Matibabu: Kesi muhimu (ubora wa chini) hupata utunzaji wa kina wa mfumo wa kizalendo—kutafsiriwa upya kwa ukamilifu kwa sehemu yenye matatizo. Kesi thabiti (ubora wa juu) hupata upasuaji mdogo kupitia operesheni za atomiki. Mtiririko huu unahakikisha rasilimali za kompyuta zinatengwa kwa ufanisi, kanuni iliyokopwa kutoka kwa nadharia ya uboreshaji wa mifumo.

5.2 Nguvu na Mapungufu

Nguvu:

Muundo Unaozingatia Kibinadamu: Muundo wa moduli tatu ndio nguvu yake kubwa zaidi. Hauitazami APE kama shida ya maandishi-hadi-maandishi ya kisanduku nyeusi bali huivunja kuwa kazi ndogo zinazoeleweka (QE, kuandika upya kikubwa, uhariri mdogo), na kufanya matokeo ya mfumo kuwa ya kuaminika zaidi na yanayoweza kusahihishwa kwa watafsiri wataalamu. Hii inalingana na msukumo wa AI inayoelezeka katika matumizi muhimu.
Ufanisi wa Rasilimali: Utendaji wenye masharti ni mwerevu. Kwa nini kukimbia mfumo mzito wa kizalendo kwenye sentensi ambayo inahitaji tu neno kubadilishwa? Uelekezaji huu wa nguvu, unaokumbusha mifumo ya mchanganyiko wa wataalamu au Transformer ya Google, hutoa njia inayoweza kuongezeka kwa utekelezaji.
Uthibitishaji wa Kimajaribio: Matokeo madhubuti kwenye viwango vya WMT pamoja na tathmini halisi ya kibinadamu inayoonyesha kuokoa wakati ndio kiwango cha dhahabu. Karatasi nyingi sana zinasimama kwenye alama za BLEU; kuthibitisha ufanisi katika utafiti wa watumiaji ni ushahidi wa thamani ya vitendo.

Mapungufu na Vikwazo:

Urahisishaji wa Kupanga Kipaumbele wa Jozi: Mgawanyiko wa ubora wa juu/chini ni kizuizi muhimu. Uhariri wa kibinadamu wa baada ya tafsiri upo kwenye wigo. Sentensi inaweza kuwa sahihi kwa 80% lakini kuwa na kosa moja muhimu, linalovunja muktadha (alama ya "juu" yenye hitilafu ya kifo). Mlango wa jozi unaweza kuipeleka vibaya kwenye uhariri wa atomiki, na kukosa hitaji la uumbaji upya wa ndani lakini wa kina. Moduli ya QE inahitaji alama za ujasiri au lebo za ukali wa makosa ya aina nyingi.
Ugumu wa Mafunzo na Uvunjikaji wa Mfuatano: Huu ni mfuatano wa hatua nyingi (mfumo wa QE -> kielekezi -> moja ya mifumo miwili ya PE). Makosa hujumuishwa. Ikiwa mfumo wa QE haujasanidiwa vizuri, utendaji wa mfumo mzima hupungua. Kufundisha mfumo kama huo kwa ukamilifu ni ngumu sana, mara nyingi huhitaji mbinu za kisasa kama Gumbel-Softmax kwa utofautishaji wa uelekezaji au ujifunzaji wa kuimarisha, ambazo karatasi inaweza kushughulikia kikamilifu.
Kufungwa kwa Kikoa na Jozi ya Lugha: Kama mifumo mingi ya kina ya MT/APE, utendaji wake unategemea kwa kiasi kikubwa ubora na wingi wa data sambamba kwa jozi maalum ya lugha na kikoa (k.m., WMT En-De). Karatasi haichunguzi jozi za lugha zenye rasilimali chache au kukabiliana haraka na vikoa vipya (k.m., kisheria hadi kimatibabu), ambayo ni kikwazo kikubwa kwa zana za CAT za biashara. Mbinu kama ujifunzaji wa meta au moduli za kikokotoo, kama zilivyochunguzwa katika utafiti wa hivi karibuni wa NLP, zinaweza kuwa hatua zinazofuata muhimu.

5.3 Uelewa Unaoweza Kutekelezwa

Kwa Watafiti:

Chunguza Uelekezaji laini: Acha uamuzi mgumu wa jozi. Chunguza mchanganyiko laini, wenye uzani wa wahariri wa kizalendo na wa atomiki, ambapo matokeo ya moduli ya QE hupima mchango wa kila mmoja. Hii inaweza kuwa imara zaidi kwa makosa ya QE.
Unganisha Ujuzi wa Nje: Mfumo wa sasa unategemea tu sentensi chanzo na ya MT. Jumuisha vipengele kutoka kwa hifadhidata za kumbukumbu ya tafsiri (TM) au besi za istilahi—zana za kawaida katika vifurushi vya CAT vya kitaalamu—kama muktadha wa ziada. Hii inaunganisha pengo kati ya njia za neva safi na uhandisi wa utafsiri wa jadi.
Weka Kigezo kwenye Kumbukumbu za Halisi za CAT: Pita mbele ya kazi za pamoja za WMT. Shirikiana na wakala wa utafsiri ili kujaribu kwenye miradi halisi, yenye fujo, ya tafsiri ya vikoa vingi na kumbukumbu za mwingiliano wa mtafsiri. Hii itaonyesha hali halisi za kushindwa.

Kwa Wasanidi Bidhaa (Wauzaji wa Zana za CAT):

Tekeleza kama Mlango wa Ubora: Tumia moduli ya QE kama kichujio cha awali katika mifumo ya usimamizi wa tafsiri. Weka alama kiotomatiki sehemu zenye ujasiri mdogo kwa umakini wa mkaguzi mkuu au zijazie mapema kwa mapendekezo ya APE ya kizalendo, na kuwezesha mfuatano wa kazi wa ukaguzi.
Zingatia Mhariri wa Atomiki kwa Ujumuishaji wa UI: Matokeo ya operesheni ya atomiki (WEKA/FUTA/BADILISHA) ni kamili kwa interfaces zinazoingiliana. Inaweza kuendesha uhariri wa maandishi wenye akili, unaotabiri ambapo mtafsiri hutumia njia fupi za kibodi kukubali/kukataa/kuhariri mapendekezo ya atomiki, na kupunguza kwa kiasi kikubwa vibonyezo vya kibodi.
Kipaumbele Kukabiliana na Mfumo: Wekeza katika kuendeleza mifuatano yenye ufanisi ya kusanidi laini au kukabiliana na kikoa kwa mfumo wa APE. Wateja wa biashara wanahitaji mifumo iliyobinafsishwa kwa istilahi zao maalum na miongozo ya mtindo ndani ya siku, sio miezi.

Mfano wa Mfumo wa Uchambuzi

Muktadha: Tafsiri ya hati ya kisheria kutoka Kiingereza hadi Kijerumani.
Chanzo: "The party shall indemnify the other party for all losses."
Matokeo ya Msingi ya MT: "Die Partei wird die andere Partei für alle Verluste entschädigen." (Sahihi, lakini inatumia "Partei" ambayo inaweza kuwa isiyo rasmi/ya kutoshangaza katika muktadha mkali wa mkataba. Neno bora zaidi linaweza kuwa "Vertragspartei").
Mfuatano wa Kazi wa Mfumo Ulipendekezwa:

Moduli ya QE: Inachambua sehemu hiyo. Tokeni nyingi ni sahihi, lakini huweka alama kwa "Partei" kama kutofautiana kwa istilahi (sio lazima kosa, lakini uchaguzi wa neno usio bora). Sentensi hupokea alama ya "ubora wa juu".
Uelekezaji: Inapelekwa kwenye moduli ya Uhariri wa Operesheni ya Atomiki.
Mhariri wa Atomiki: Kwa kuzingatia chanzo na muktadha, inaweza kupendekeza mfuatano wa operesheni: [WEKA, WEKA, BADILISHA_NA_'Vertragspartei', WEKA, WEKA, WEKA, WEKA].
Matokeo: "Die Vertragspartei wird die andere Vertragspartei für alle Verluste entschädigen." Hii ni uhariri madhubuti, mdogo unaolingana na viwango vya istilahi za kisheria.

Mfano huu unaonyesha jinsi mfumo huu unavyozidi kusahihisha makosa rahisi hadi kuboresha mtindo na istilahi, hitaji muhimu katika tafsiri ya kitaalamu.

6. Matumizi ya Baadaye na Mwelekeo

Matokeo ya mfumo huu uliojumuishwa wa QE-APE yanazidi zaidi ya tafsiri ya jadi:

Mifumo ya MT Inayojikokotoa: Ishara ya QE inaweza kurudishwa kwa wakati halisi kwenye mfumo wa NMT kwa ajili ya kukabiliana mtandaoni au ujifunzaji wa kuimarisha, na kuunda kitanzi cha tafsiri kinachojiboresha.
Udhibiti wa Maudhui na Utafsiri wa Kienyeji: Moduli ya operesheni ya atomiki inaweza kubadilishwa ili kuta fsiri kiotomatiki au kudhibiti maudhui yanayotokana na mtumiaji kwa kutumia ubadilishaji unaofaa kitamaduni au ufutaji kulingana na sheria za sera.
Elimu na Mafunzo: Mfumo huu unaweza kutumika kama mwalimu mwenye akili kwa wanafunzi wa tafsiri, na kutoa uchambuzi wa kina wa makosa (kutoka kwa moduli ya QE) na mapendekezo ya kusahihisha.
Tafsiri ya Njia Nyingi: Kujumuisha kanuni zinazofanana za kukadiria ubora na uhariri wa baada ya tafsiri kwa mifumo ya tafsiri ya msingi wa picha (OCR) au hotuba-hadi-hotuba, ambapo makosa yana njia tofauti.
Mazingira ya Rasilimali Chache na Yasio na Usimamizi: Kazi ya baadaye lazima ishughulikie kutumia kanuni hizi ambapo hazina kubwa za data sambamba hazipatikani, kwa uwezekano wa kutumia mbinu zisizo na usimamizi au zilizo na usimamizi wa nusu zilizochochewa na kazi kama CycleGAN kwa tafsiri ya picha isiyo na jozi, lakini ikitumika kwa maandishi.

7. Marejeo

Wang, J., Wang, K., Ge, N., Shi, Y., Zhao, Y., & Fan, K. (2020). Computer Assisted Translation with Neural Quality Estimation and Automatic Post-Editing. arXiv preprint arXiv:2009.09126.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
Specia, L., Shah, K., de Souza, J. G., & Cohn, T. (2013). QuEst - A translation quality estimation framework. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics: System Demonstrations.
Junczys-Dowmunt, M., & Grundkiewicz, R. (2016). Log-linear combinations of monolingual and bilingual neural machine translation models for automatic post-editing. In Proceedings of the First Conference on Machine Translation.
Isola, P., Zhu, J. Y., Zhou, T., & Efros, A. A. (2017). Image-to-image translation with conditional adversarial networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1125-1134). (Iliyotajwa kwa mfano wa dhana ya mabadiliko ya masharti, maalum ya kazi).
Läubli, S., Fishel, M., Massey, G., Ehrensberger-Dow, M., & Volk, M. (2013). Assessing post-editing efficiency in a realistic translation environment. Proceedings of MT Summit XIV.