Ƙarfafa Masu Fassara Manyan Harsunan Harshe ta hanyar Ƙwaƙwalwar Fassara

1. Gabatarwa

Wannan takardar bincike, "Ƙarfafa Masu Fassara Manyan Harsunan Harshe ta hanyar Ƙwaƙwalwar Fassara," tana binciko wata sabuwar hanya don inganta fassarar inji (MT) ta hanyar amfani da ƙwarewar koyo a cikin mahallin Manyan Harsunan Harshe (LLMs). Babban ra'ayi shine a yi amfani da Ƙwaƙwalwar Fassara (TMs)—ma'ajiyar bayanai na tsoffin fassarorin ɗan adam—a matsayin ƙarfafawa mai motsi don jagorantar LLMs, tare da kawar da buƙatar canje-canjen gine-gine ko sake horar da babban samfurin. Wannan hanyar, wacce ake kira Ƙarfafa Ƙwaƙwalwar Fassara don Manyan Harsunan Harshe (TMP-LM), tana nuna gagarumin ci gaba, yana mai da fassarar tushen LLM ya yi gasa tare da ingantattun tsarin Fassarar Injin Jijiya (NMT) waɗanda aka daidaita akan manyan bayanan yanki.

2. Hanyar Aiki

2.1. Ƙarfafa Ƙwaƙwalwar Fassara (TMP-LM)

TMP-LM dabara ce mai sauƙi amma mai tasiri ta ƙarfafawa. Don wata jimla mai tushe $x$ da za a fassara, tsarin yana dawo da nau'i-nau'i $k$ masu dacewa na fassara $(x^{tm}_i, y^{tm}_i)$ daga TM. Ana tsara waɗannan nau'i-nau'i zuwa ƙarfafawa bisa wani samfuri na musamman, wanda ake sanya shi a gaban umarnin fassara $x$. LLM, bisa wannan ƙarfafawar, yana samar da fassarar $y$. Ana iya tsara tsarin a matsayin nemo $y$ wanda ya ƙara ƙarfafa $P(y | f_{ref}(x^{tm}_1, y^{tm}_1, ..., x^{tm}_k, y^{tm}_k, x), \theta)$, inda $f_{ref}$ shine aikin samfurin ƙarfafawa kuma $\theta$ su ne sigogin LLM.

2.2. Ƙirar Samfurin ƙarfafawa

Takardar tana binciko salo daban-daban na ƙarfafawa, musamman tana bambanta tsarin UMARNI da CODE (duba Hoto 1 a cikin PDF). Tsarin UMARNI yana amfani da harshe na halitta (misali, "Idan fassarar X1 ita ce Y1..., to menene fassarar X?"). Tsarin CODE yana amfani da tsari, salo mai ma'ana (misali, "[src-lang]=[X1] [tgt-lang]=[Y1]..."). Zaɓin samfurin yana tasiri sosai ga ikon LLM na yin amfani da misalan TM da aka bayar yadda ya kamata.

Babban Ci Gaba

20-30 BLEU

Maki da aka samu akan mai fassara LLM na asali

Babban Fa'ida

Babu Canjin Gine-gine

Yana amfani da LLM na yau da kullun ta hanyar ƙarfafawa kawai

Kwatancen Tushe

SOTA NMT

Yana gasa tare da samfuran da aka daidaita sosai

3. Gwaje-gwaje & Sakamako

3.1. Tsarin Gwaji

An gudanar da gwaje-gwaje ta amfani da samfurin GPT-3.5 (text-davinci-003, wanda ake kira davinci-003) a cikin nau'i-nau'i na harsuna da yawa (misali, Zh-En, De-En) da yankuna (IT, Alkur'ani, Likita, Doka). An gina Ƙwaƙwalwar Fassara daga bayanan yanki. An kimanta aikin ta amfani da makin BLEU, tare da kwatanta TMP-LM da babban ma'auni mai ƙarfi: babban samfurin davinci-003 ba tare da ƙarfafawar TM ba da kuma da ingantaccen tsarin NMT mai girma (ma'aunin SOTA).

3.2. Sakamako na Asali

Sakamakon yana da ban mamaki. TMP-LM ya inganta ingancin fassarar babban LLM da maki BLEU 20 zuwa 30 a cikin ayyuka daban-daban. A mafi yawan saitin gwaji, aikin LLM da aka ƙarfafa ya kasance daidai ko ma ya wuce na tsarin NMT na musamman, na cikin yanki. Wannan yana nuna babban yuwuwar koyo a cikin mahallin tare da ingantattun ƙarfafawa don daidaita LLMs na gaba ɗaya zuwa ayyukan fassara na musamman.

3.3. Nazarin Cirewa

Nazarin cirewa ya tabbatar da mahimmancin ingancin TM da ƙirar ƙarfafawa. Ribar aikin tana da alaƙa kai tsaye da dacewa da daidaiton misalan TM da aka dawo. Bugu da ƙari, ƙarfafawar CODE-style gabaɗaya ta samar da ingantaccen ci gaba mai ƙarfi da daidaito fiye da ƙarfafawar UMARNI-style, mai yiwuwa saboda tsarinta mai tsabta, mara shakka ga LLM don tantancewa.

Mahimman Fahimta

LLMs Ƙwararrun Masu Koyo ne: Ikon su na "fahimta" da bin umarni masu rikitarwa shine maɓallin nasarar TMP-LM.
Ƙirar Ƙarfafawa Tana da Muhimmanci: Tsari da tsabtar samfurin ƙarfafawa ba ƙananan sigogi ba ne waɗanda ke tasiri sosai ga aikin.
TM a matsayin Tushen Ilimi Mai Motsi: Wannan hanyar tana mai da ma'ajiyar bayanai na TM masu tsayayye zuwa jagorori masu aiki, na mahallin ga LLMs, yana haɗa tsarin fassara na gargajiya da na zamani.
Daidaitaccen Daidaitawa: TMP-LM yana ba da hanya zuwa ingantaccen fassara, na musamman na yanki ba tare da farashin lissafi na daidaita manyan LLMs ba.

4. Nazari & Tattaunawa

4.1. Fahimtar Asali

Wannan takarda ba kawai game da ingantaccen fassara ba ce; ta zama babban darasi a cikin arbitrage na albarkatu. Marubutan sun gano wata muhimmiyar rashin inganci: rashin amfani da wadatar, ƙwaƙwalwar fassara masu daraja (TMs) a zamanin LLMs. Yayin da masana'antu suka damu da sikelin sigogin samfurin, sun nuna cewa sikelin hankali na mahallin—ciyar da LLMs misalan da suka dace—zai iya samar da riba mara daidaituwa. Tsalle-tsalle na maki BLEU 20-30 ba kawai ci gaba ba ne; canjin tsari ne, yana tabbatar da cewa ga ayyuka da yawa, ƙwararren gwaninta zai iya wuce ƙwararren mai ƙware. Wannan yana daidaitawa da binciken da aka samu a wasu yankuna inda koyo a cikin mahallin ya fi daidaitawa akan ayyukan da ke da ƙarancin bayanai, kamar yadda aka tattauna a cikin bincike daga cibiyoyi kamar Cibiyar Bincike kan Samfuran Tushe ta Stanford.

4.2. Gudanar da Ma'ana

Hujjar tana da sauƙi kuma tana da tasiri mai ƙarfi: 1) Matsala: LLMs ƙwararrun masu fassara ne amma ba su da takamaiman yanki; TMs suna da wadata a cikin ilimin yanki amma ma'ajiyar bayanai ne masu zaman kansu. 2) Hasashe: Koyon LLMs a cikin mahallin zai iya kunna TMs. 3) Tsarin Aiki: Tsara sassan TM a matsayin ƙarfafawa kaɗan. 4) Tabbatarwa: Babban ribar BLEU a cikin yankuna. 5) Ma'ana: Mafi kyawun tsarin fassara na iya zama haɗakar LLM mai ƙarfafa dawo, ba tsarin NMT mai tsayi-zuwa-ƙarshe ba. Wannan gudana yana kama da nasarar tsarin "samarwa mai ƙarfafa dawo" da aka gani a cikin samfura kamar RETRO, amma yana amfani da shi ga matsalar da ta girma, mai mahimmanci ta kasuwanci: fassara.

4.3. Ƙarfi & Kurakurai

Ƙarfi: Hanyar tana da hazaka a zahiri. Ba ta kutsawa (babu canjin samfurin), za a iya tura ta nan da nan akan APIs kamar na OpenAI, kuma tana amfani da farashin da aka kashe (TMs na kamfani). Yana mai da abin alhaki (ma'ajiyar bayanai na TM masu tsayayye) zuwa kadara mai dabarun. Kwatancen da SOTA NMT ma'auni ne mai ƙarfi da gamsarwa.

Kurakurai: Takardar ta yi watsi da giwa a cikin daki: jinkiri da farashi. Gina da sarrafa dogayen ƙarfafawa masu yawan misali ga kowace jimla yana ƙara lokacin ƙididdigewa da amfani da alamar alama sosai, wanda ke hana aikace-aikacen ainihin-lokaci, masu yawan aiki. Bugu da ƙari, hanyar tana da hankali sosai ga ingancin TM; ƙwaƙwalwar TM mara kyau ko mara dacewa na iya rage aikin, yana haifar da yanayin "shara-shara a ciki, shara-shara a waje". Dogaro da samfurin mallakar mallaka (davinci-003) shima yana iyakance sake samarwa da tabbatarwa mai zaman kanta.

4.4. Fahimta Mai Aiki

Ga shugabannin kamfanoni: Dakatar da kula da TM ɗinku a matsayin tarihin gado. Wannan binciken ya ba da umarnin sake kimanta kadarorin TM a matsayin babban ɓangaren tarin fassarar AI ɗinku. Fa'idar farkon mai motsi ta ta'allaka ne akan gina ingantattun tsarin dawo da TM masu goyan bayan binciken vector waɗanda aka inganta don ƙarfafa LLM.

Ga masu bincike: Ƙarfafawar CODE-style wani muhimmin bincike ne. Aikin nan gaba dole ne ya tsara injiniyan ƙarfafawa don fassara, yana motsawa daga fasaha zuwa kimiyya. Binciken wannan tare da LLMs masu buɗe tushe (misali, LLaMA, BLOOM) mataki ne mai mahimmanci na gaba don ƙaddamar da hanyar.

Ga masu haɓakawa: Ai wani tsarin faɗuwa. Yi amfani da makin amincewa daga tsarin dawo da TM; idan ba a sami ingantaccen daidaito ba, a yi amfani da fassarar LLM na asali don guje wa lalacewa. Wannan haɗakar ƙarfi mai ƙarfi shine maɓalli ga tsarin samarwa.

5. Cikakkun Bayanai na Fasaha

Babban ƙirar fasaha ita ce tsarar ƙarfafawa. Idan aka ba da jimla mai tushe $x$, da nau'i-nau'i $k$ na TM da aka dawo $(x_i^{tm}, y_i^{tm})$, ana gina ƙarfafawar $P$ kamar haka:
$P = f_{ref}(x_1^{tm}, y_1^{tm}, ..., x_k^{tm}, y_k^{tm}, x)$
Inda $f_{ref}$ aikin samfuri ne. LLM sannan yana lissafa:
$y^* = \arg\max_y P(y | P, \theta)$
Gwaje-gwajen takardar yawanci suna amfani da $k=2$ ko $k=4$. Dawo da misalan TM yana dogara ne akan ma'auni kamar BM25 ko kusancin kusanci tsakanin $x$ da $x_i^{tm}$.

6. Misalin Tsarin Nazari

Yanayi: Wani kamfani na doka yana buƙatar fassara sabon sashe na kwangila daga Jamusanci zuwa Turanci. TM ɗinsu yana ɗauke da dubban sassan da aka fassara a baya.
Aikace-aikacen Tsarin:

Dawo: Tsarin yana amfani da binciken ma'ana don nemo sassan Jamusanci 2 mafi kama da su daga TM da fassararsu ta Turanci na ƙwararru.
Gina Ƙarfafawa (CODE-style):
[src-lang]=[An samo Sashen Jamusanci 1] [tgt-lang]=[Fassarar Turanci 1] [src-lang]=[An samo Sashen Jamusanci 2] [tgt-lang]=[Fassarar Turanci 2] [src-lang]=[Sabon Sashen Jamusanci] [tgt-lang]=
Aiwatarwa: Ana aika wannan ƙarfafawa zuwa LLM (misali, GPT-4). LLM, bisa ingantaccen furucin doka na misalan da suka gabata, yana samar da fassara don sabon sashe wanda ke kiyaye daidaitattun kalmomi da salo.
Fitowa: Ingantaccen fassara, mai dacewa da yanki wanda mai fassara na gaba ɗaya zai iya rasa.

Wannan tsarin yana mai da kowane sabon aikin fassara zuwa matsalar koyo kaɗan na musamman ga mahallin takardar.

7. Aikace-aikace na Gaba & Hanyoyi

Ma'anar TMP-LM ta wuce fassara:

Samar da Rubutu Mai Sarrafawa: Daidaita LLMs don takamaiman muryoyin alama, salo na takaddun fasaha, ko bin ka'idoji ta hanyar amfani da rubutun misali a matsayin ƙarfafawa.
Mataimakan AI Na Musamman: Yin amfani da imel ɗin mai amfani na baya, rahotanni, ko saƙonni a matsayin "ƙwaƙwalwar salo" don ƙarfafa LLM don samar da sabon abun ciki a cikin muryarsu ta musamman.
Samar da Code & Daidaitawa: Ƙarfafa LLMs tare da ayyuka da tsarin da ake da su na tushen code don samar da sabon code wanda ke bin irin wannan al'ada da gine-gine.
Bincike na Gaba: Muhimman hanyoyi sun haɗa da inganta matsawa ƙarfafawa don rage farashi, haɗa ingantattun samfuran dawo don daidaita TM, da bincika iyakokin koyo a cikin mahallin da daidaitawa yayin da LLMs suka girma. Haɗa wannan tare da hanyoyin daidaitawa masu inganci (PEFT) kamar LoRA zai iya haifar da haɗakarwa mai ƙarfi.

Hanyar ƙarshe ita ce ƙirƙirar Injin Mahalli Mai Motsi—tsarin da ke sarrafa, dawo da, da tsara mafi dacewar ilimin mahalli (daga TMs, zane-zanen ilimi, hulɗar da suka gabata) don jagorantar LLMs ga kowane aikin da aka bayar.

8. Nassoshi

Mu, Y., Reheman, A., Cao, Z., da sauransu. (2023). Ƙarfafa Masu Fassara Manyan Harsunan Harshe ta hanyar Ƙwaƙwalwar Fassara. arXiv preprint arXiv:2305.17367.
Brown, T., Mann, B., Ryder, N., da sauransu. (2020). Harsunan Harshe Ƙwararrun Masu Koyo ne. Ci gaba a cikin Tsarin Bayanai na Jijiya, 33.
Khandelwal, U., Levy, O., Jurafsky, D., da sauransu. (2021). Gabaɗaya ta hanyar Ƙwaƙwalwa: Samfuran Harshe Mafi Kusa. Taron Ƙasa da Ƙasa kan Wakilcin Koyo (ICLR).
Borgeaud, S., Mensch, A., Hoffmann, J., da sauransu. (2022). Inganta Samfuran Harshe ta hanyar Dawo daga Tiriliyoyin Alamomi. Taron Ƙasa da Ƙasa kan Injin Koyo (ICML).
Cibiyar Bincike kan Samfuran Tushe ta Stanford (CRFM). (2023). Kan Damuwa da Haɗarin Samfuran Tushe. https://crfm.stanford.edu/.
Vaswani, A., Shazeer, N., Parmar, N., da sauransu. (2017). Hankali Shine Abinda Kake Bukata. Ci gaba a cikin Tsarin Bayanai na Jijiya, 30.