1. ভূমিকা ও উদ্দেশ্য
ডিজিটাল হিউম্যানিটিজে (ডিএইচ) জ্ঞান সংগঠন নিয়ন্ত্রিত শব্দভাণ্ডার, থিসরাস এবং অন্টোলজির উপর ব্যাপকভাবে নির্ভর করে, যা প্রাথমিকভাবে সিম্পল নলেজ অর্গানাইজেশন সিস্টেম (এসকেওএস) ব্যবহার করে মডেল করা হয়। এই সম্পদগুলিতে ইংরেজির আধিপত্যের কারণে একটি উল্লেখযোগ্য বাধা বিদ্যমান, যা অ-দেশীয় ভাষাভাষীদের বাদ দেয় এবং বিভিন্ন সংস্কৃতি ও ভাষার প্রতিনিধিত্ব কম করে। বহুভাষিক থিসরাস অন্তর্ভুক্তিমূলক গবেষণা অবকাঠামোর জন্য অত্যন্ত গুরুত্বপূর্ণ, কিন্তু তাদের ম্যানুয়াল তৈরি স্কেলযোগ্য নয়। ডোমেন-নির্দিষ্ট দ্বিভাষিক কর্পাসের অভাবের কারণে ডিএইচ প্রেক্ষাপটে শাস্ত্রীয় মেশিন অনুবাদ (এমটি) পদ্ধতি ব্যর্থ হয়। এই গবেষণাপত্রটি WOKIE (আন্তর্জাতিক পরিবেশে জ্ঞান ব্যবস্থাপনার জন্য ভালো অনুবাদিত অপশন) পরিচয় করিয়ে দেয়, যা একটি ওপেন-সোর্স, মডুলার পাইপলাইন যা বহিরাগত অনুবাদ পরিষেবাগুলিকে বড় ভাষা মডেল (এলএলএম) ব্যবহার করে লক্ষ্যযুক্ত পরিমার্জনের সাথে একত্রিত করে এসকেওএস থিসরাসের অনুবাদ স্বয়ংক্রিয় করতে, গুণমান, স্কেলযোগ্যতা এবং খরচের মধ্যে ভারসাম্য বজায় রেখে।
2. WOKIE পাইপলাইন: স্থাপত্য ও কার্যপ্রবাহ
WOKIE কে একটি কনফিগারযোগ্য, বহু-পর্যায়ের পাইপলাইন হিসাবে ডিজাইন করা হয়েছে যার জন্য এমটি বা এলএলএম-এর পূর্ব অভিজ্ঞতার প্রয়োজন নেই। এটি সাধারণ হার্ডওয়্যারে চলে এবং বিনামূল্যের অনুবাদ পরিষেবা ব্যবহার করতে পারে।
2.1 মূল উপাদানসমূহ
পাইপলাইনটি তিনটি প্রধান পর্যায় নিয়ে গঠিত:
- প্রাথমিক অনুবাদ: একটি এসকেওএস থিসরাস পার্স করা হয়, এবং এর লেবেলগুলি (prefLabel, altLabel) একাধিক কনফিগারযোগ্য বহিরাগত অনুবাদ পরিষেবায় (যেমন, গুগল ট্রান্সলেট, DeepL API) পাঠানো হয়।
- প্রার্থী সমষ্টিকরণ ও মতবিরোধ সনাক্তকরণ: প্রতিটি শব্দের জন্য অনুবাদ সংগ্রহ করা হয়। একটি মূল উদ্ভাবন হল পরিষেবাগুলির মধ্যে "মতবিরোধ" সনাক্তকরণ। একটি কনফিগারযোগ্য থ্রেশহোল্ড (যেমন, যদি N পরিষেবা থেকে অনুবাদগুলি একটি সাদৃশ্য স্কোরের বাইরে ভিন্ন হয়) পরিমার্জন পর্যায় শুরু করে।
- এলএলএম-ভিত্তিক পরিমার্জন: যে শব্দগুলির জন্য প্রাথমিক অনুবাদে মতবিরোধ হয়, সেই প্রার্থী অনুবাদ এবং মূল শব্দটি একটি এলএলএম-এ (যেমন, GPT-4, Llama 3) খাওয়ানো হয় একটি সাবধানে তৈরি প্রম্পটের সাথে, যা সম্ভাব্য সর্বোত্তম অনুবাদ এবং যুক্তি চায়।
2.2 এলএলএম-ভিত্তিক পরিমার্জন যুক্তি
এলএলএম-এর নির্বাচনী ব্যবহার WOKIE-এর নকশার কেন্দ্রবিন্দু। প্রতিটি শব্দ এলএলএম দিয়ে অনুবাদ করার পরিবর্তে (খরচবহুল, ধীর, সম্ভাব্য বিভ্রান্তিকর), এলএলএম শুধুমাত্র কঠিন ক্ষেত্রগুলির জন্য সালিশ হিসাবে মোতায়েন করা হয়। এই হাইব্রিড পদ্ধতিটি সরল অনুবাদের জন্য স্ট্যান্ডার্ড এমটি API-এর গতি এবং কম খরচের সুবিধা নেয়, এলএলএম কম্পিউটিং শুধুমাত্র সেই শব্দগুলির জন্য সংরক্ষণ করে যেখানে ঐক্যমত্যের অভাব রয়েছে, যার ফলে গুণমান এবং সম্পদ ব্যয়ের মধ্যে ভারসাম্য অপ্টিমাইজ করা হয়।
3. প্রযুক্তিগত বিবরণ ও পদ্ধতি
WOKIE পাইথনে বাস্তবায়িত হয়েছে, এসকেওএস পার্সিংয়ের জন্য RDFLib-এর মতো লাইব্রেরিগুলির সুবিধা নিয়ে। সিস্টেমের কার্যকারিতা তার বুদ্ধিমান রাউটিং মেকানিজমের উপর নির্ভরশীল।
3.1 অনুবাদ গুণমান মূল্যায়ন মেট্রিক
অনুবাদ গুণমান মূল্যায়ন করতে, লেখকরা স্বয়ংক্রিয় মেট্রিক এবং বিশেষজ্ঞ মানব মূল্যায়নের সংমিশ্রণ ব্যবহার করেছেন। স্বয়ংক্রিয় স্কোরিংয়ের জন্য, তারা BLEU (বাইলিংগুয়াল ইভ্যালুয়েশন আন্ডারস্টাডি) স্কোর প্রয়োগ করেছেন, যা এমটি গবেষণায় সাধারণত ব্যবহৃত হয়, কিন্তু সংক্ষিপ্ত, পরিভাষাগত বাক্যাংশের জন্য এর সীমাবদ্ধতা উল্লেখ করেছেন। মূল মূল্যায়ন অন্টোলজি ম্যাচিং (ওএম) কার্যকারিতার উন্নতির উপর দৃষ্টি নিবদ্ধ করেছে, LogMap এবং AML-এর মতো স্ট্যান্ডার্ড ওএম সিস্টেম ব্যবহার করে। অনুমান ছিল যে উচ্চ-গুণমানের অনুবাদ ভালো অ্যালাইনমেন্ট স্কোরের দিকে নিয়ে যাবে। একটি থিসরাস $T$-এর জন্য অনুবাদের পরে কার্যকারিতা লাভ $G$ নিম্নরূপ সূত্রায়িত করা যেতে পারে:
$G(T) = \frac{Score_{matched}(T_{translated}) - Score_{matched}(T_{original})}{Score_{matched}(T_{original})}$
যেখানে $Score_{matched}$ হল অন্টোলজি ম্যাচিং সিস্টেম থেকে F-মাপ।
4. পরীক্ষামূলক ফলাফল ও মূল্যায়ন
মূল্যায়নটি ১৫টি ভাষায় বেশ কয়েকটি ডিএইচ থিসরাস কভার করেছে, বিভিন্ন প্যারামিটার, অনুবাদ পরিষেবা এবং এলএলএম পরীক্ষা করেছে।
মূল পরীক্ষামূলক পরিসংখ্যান
- মূল্যায়নকৃত থিসরাস: একাধিক (যেমন, Getty AAT, GND)
- ভাষাসমূহ: ১৫টি, জার্মান, ফরাসি, স্প্যানিশ, চীনা, আরবি সহ
- পরীক্ষিত এলএলএম: GPT-4, GPT-3.5-Turbo, Llama 3 70B
- বেসলাইন পরিষেবা: গুগল ট্রান্সলেট, DeepL API
4.1 ভাষাভেদে অনুবাদ গুণমান
মানব মূল্যায়নে দেখা গেছে যে WOKIE পাইপলাইন (বহিরাগত এমটি + এলএলএম পরিমার্জন) ধারাবাহিকভাবে যেকোনো একক বহিরাগত অনুবাদ পরিষেবা একা ব্যবহার করার চেয়ে ভালো পারফর্ম করেছে। গুণমানের উন্নতি সবচেয়ে বেশি লক্ষণীয় ছিল:
- কম-সম্পদ ভাষার জন্য: যেখানে স্ট্যান্ডার্ড API প্রায়ই ব্যর্থ হয়।
- ডোমেন-নির্দিষ্ট পরিভাষার জন্য: সাংস্কৃতিক বা ঐতিহাসিক সূক্ষ্মতা সহ শব্দ (যেমন, "fresco secco," "codex") যেখানে জেনেরিক এমটি আক্ষরিক কিন্তু ভুল অনুবাদ দেয়।
চার্ট বর্ণনা (কল্পিত): একটি বার চার্ট চারটি শর্তের মধ্যে BLEU স্কোর (বা মানব মূল্যায়ন স্কোর) তুলনা করছে: শুধুমাত্র গুগল ট্রান্সলেট, শুধুমাত্র DeepL, GPT-3.5 পরিমার্জন সহ WOKIE, এবং GPT-4 পরিমার্জন সহ WOKIE। WOKIE কনফিগারেশনের বারগুলি উল্লেখযোগ্যভাবে উচ্চতর, বিশেষ করে ইংরেজি-থেকে-আরবি বা ইংরেজি-থেকে-চীনা-এর মতো ভাষা জোড়ার জন্য।
4.2 অন্টোলজি ম্যাচিং কার্যকারিতা উন্নতি
প্রাথমিক পরিমাণগত ফলাফল। WOKIE-এর মাধ্যমে ইংরেজি নয় এমন থিসরাস প্রক্রিয়াকরণ করে ইংরেজি লেবেল যোগ করার পরে, অন্টোলজি ম্যাচিং সিস্টেমের (LogMap, AML) F-মাপ স্কোর উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে—গড়ে ২২-৩৫% পর্যন্ত, ভাষা এবং থিসরাস জটিলতার উপর নির্ভর করে। এটি পাইপলাইনের মূল উপযোগিতা প্রমাণ করে: এটি ইংরেজি-কেন্দ্রিক ওএম টুলগুলির জন্য অ-ইংরেজি সম্পদগুলি আবিষ্কারযোগ্য করে তৈরি করে সিমেন্টিক আন্তঃক্রিয়াশীলতা সরাসরি বৃদ্ধি করে।
চার্ট বর্ণনা (কল্পিত): একটি লাইন গ্রাফ y-অক্ষে অন্টোলজি ম্যাচিং-এর F-মাপ এবং x-অক্ষে বিভিন্ন অনুবাদ পদ্ধতি দেখাচ্ছে। লাইনটি "কোনো অনুবাদ নেই"-এর জন্য কম থেকে শুরু হয়, "একক এমটি পরিষেবা"-এর জন্য সামান্য বৃদ্ধি পায় এবং "WOKIE পাইপলাইন"-এর জন্য তীব্রভাবে শীর্ষে পৌঁছায়।
4.3 কার্যকারিতা ও খরচ বিশ্লেষণ
এলএলএম-কে নির্বাচনীভাবে শুধুমাত্র মতবিরোধপূর্ণ শব্দগুলির জন্য ব্যবহার করে (সাধারণত মোটের ১০-২৫%), WOKIE একটি নিষ্পাপ পূর্ণ-এলএলএম অনুবাদ পদ্ধতির তুলনায় এলএলএম API খরচ ৭৫-৯০% কমিয়েছে, প্রায় ~৯৫% গুণমান সুবিধা ধরে রেখে। প্রক্রিয়াকরণ সময় এলএলএম কল দ্বারা প্রভাবিত ছিল, কিন্তু সামগ্রিক পাইপলাইনটি স্ট্যান্ডার্ড হার্ডওয়্যারে মাঝারি আকারের থিসরাসের জন্য সম্ভবপর ছিল।
5. বিশ্লেষণ কাঠামো: একটি নন-কোড কেস স্টাডি
পরিস্থিতি: একটি ইউরোপীয় ডিজিটাল লাইব্রেরিতে মধ্যযুগীয় শিল্প কৌশলের জন্য একটি জার্মান ভাষার থিসরাস রয়েছে। জাপানের গবেষকরা প্রাসঙ্গিক সম্পদ খুঁজে পাচ্ছেন না কারণ তাদের অন্টোলজি ম্যাচিং টুলগুলি শুধুমাত্র ইংরেজি লেবেল প্রক্রিয়া করে।
WOKIE প্রয়োগ:
- ইনপুট: জার্মান শব্দ "Wandmalerei" (ওয়াল পেইন্টিং)।
- পর্যায় ১ (বহিরাগত এমটি): গুগল ট্রান্সলেট "wall painting" ফেরত দেয়। DeepL "mural painting" ফেরত দেয়। মাইক্রোসফট ট্রান্সলেটর "wall painting" ফেরত দেয়। মতবিরোধ রয়েছে ("mural" বনাম "wall")।
- পর্যায় ২ (মতবিরোধ সনাক্তকরণ): প্রার্থীদের মধ্যে সাদৃশ্য থ্রেশহোল্ডের নিচে। এলএলএম পরিমার্জন শুরু হয়।
- পর্যায় ৩ (এলএলএম পরিমার্জন): প্রম্পট: "জার্মান শিল্প ইতিহাস শব্দ 'Wandmalerei' এবং প্রার্থী ইংরেজি অনুবাদ ['wall painting', 'mural painting'] দেওয়া আছে, শিল্প ইতিহাসে একটি এসকেওএস থিসরাসের জন্য কোনটি সবচেয়ে সঠিক এবং প্রাসঙ্গিকভাবে উপযুক্ত শব্দ? ক্ষেত্রের নির্দিষ্টতা এবং সাধারণ ব্যবহার বিবেচনা করুন।"
- এলএলএম আউটপুট: "Getty AAT-এর মতো শিল্প ইতিহাস থিসরাসের প্রেক্ষাপটে, 'mural painting' হল 'Wandmalerei'-এর জন্য আরও সুনির্দিষ্ট এবং সাধারণভাবে ব্যবহৃত বর্ণনাকারী, কারণ এটি বিশেষভাবে একটি দেয়াল বা ছাদে সরাসরি প্রয়োগ করা পেইন্টিং বোঝায়।"
- ফলাফল: এসকেওএস ধারণাটি prefLabel "mural painting" পায়, ইংরেজি ভাষার অন্টোলজির সাথে সঠিক ম্যাচিং সক্ষম করে।
6. ভবিষ্যতের প্রয়োগ ও গবেষণা দিকনির্দেশ
- অনুবাদের বাইরে: WOKIE কে লক্ষ্য ভাষায় নতুন সম্পর্কিত ধারণা বা altLabel-এর পরামর্শ দেওয়ার জন্য প্রসারিত করা, একটি থিসরাস সম্প্রসারণ টুল হিসাবে কাজ করে।
- ফাউন্ডেশনাল মডেলের সাথে একীকরণ: ভিশন-ল্যাঙ্গুয়েজ মডেল (যেমন CLIP) ব্যবহার করে ডিজিটাল সংগ্রহে সংযুক্ত চিত্রের ভিত্তিতে শুধুমাত্র পাঠ্য নয়, ধারণাগুলি অনুবাদ করা।
- অ্যাকটিভ লার্নিং লুপ: মানব-ইন-দ্য-লুপ প্রতিক্রিয়া অন্তর্ভুক্ত করে এলএলএম আউটপুট সংশোধন করা, ক্রমাগত পাইপলাইনের ডোমেন-নির্দিষ্ট কার্যকারিতা উন্নত করা।
- মূল্যায়নের মানকীকরণ: এসকেওএস/থিসরাস অনুবাদ গুণমান মূল্যায়নের জন্য একটি নিবেদিত বেঞ্চমার্ক স্যুট বিকাশ করা, BLEU-এর বাইরে সেই মেট্রিকগুলিতে যাওয়া যা শ্রেণিবদ্ধ এবং সম্পর্ক সংরক্ষণ ক্যাপচার করে।
- বিস্তৃত জ্ঞান সংগঠন সিস্টেম (কেওএস): হাইব্রিড এমটি+এলএলএম পরিমার্জন নীতি এসকেওএস-এর বাইরে আরও জটিল অন্টোলজি (OWL) এ প্রয়োগ করা।
7. তথ্যসূত্র
- Kraus, F., Blumenröhr, N., Tonne, D., & Streit, A. (2025). Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS Thesauri. arXiv preprint arXiv:2507.19537.
- Miles, A., & Bechhofer, S. (2009). SKOS Simple Knowledge Organization System Reference. W3C Recommendation. https://www.w3.org/TR/skos-reference/
- Vaswani, A., et al. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NIPS 2017).
- Carroll, J. J., & Stickler, P. (2004). RDF Triples in the Semantic Web. IEEE Internet Computing.
- Getty Research Institute. (2024). Art & Architecture Thesaurus (AAT). https://www.getty.edu/research/tools/vocabularies/aat/
- Papineni, K., et al. (2002). BLEU: a Method for Automatic Evaluation of Machine Translation. Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL).
8. বিশেষজ্ঞ বিশ্লেষণ: মূল অন্তর্দৃষ্টি, যৌক্তিক প্রবাহ, শক্তি ও দুর্বলতা, কার্যকরী অন্তর্দৃষ্টি
মূল অন্তর্দৃষ্টি: WOKIE শুধু আরেকটি অনুবাদ টুল নয়; এটি সাংস্কৃতিক ঐতিহ্য তথ্যের বিচ্ছিন্ন বিশ্বের জন্য একটি ব্যবহারিক, খরচ-সচেতন আন্তঃক্রিয়াশীলতা ইঞ্জিন। এর আসল উদ্ভাবন হল এই স্বীকৃতি যে নিখুঁত এআই অনুবাদ বিশেষায়িত ডোমেনের জন্য একটি নিরর্থক প্রচেষ্টা, এবং পরিবর্তে, এটি এলএলএম-কে একটি ভোঁতা হাতুড়ির পরিবর্তে একটি উচ্চ-নির্ভুল স্ক্যাল্পেল হিসাবে ব্যবহার করে। গবেষণাপত্রটি সঠিকভাবে ডিএইচ-এর মূল সমস্যা চিহ্নিত করেছে: ইংরেজি হল লিঙ্কড ডেটার জন্য ডি ফ্যাক্টো প্রশ্ন ভাষা, যা বিশাল অ-ইংরেজি জ্ঞান ভাণ্ডারের একটি নীরব বর্জন তৈরি করে। WOKIE-এর লক্ষ্য কাব্যিক অনুবাদ নয় বরং আবিষ্কার সক্ষম করা, যা একটি আরও অর্জনযোগ্য এবং প্রভাবশালী লক্ষ্য।
যৌক্তিক প্রবাহ: যুক্তিটি আকর্ষণীয় এবং সুগঠিত। এটি একটি অপ্রতিরোধ্য ব্যথার বিন্দু দিয়ে শুরু হয় (ডিএইচ-এ ভাষা বর্জন), সুস্পষ্ট সমাধানগুলি ধ্বংস করে (ম্যানুয়াল কাজ অসম্ভব, ডেটা স্বল্পতার কারণে শাস্ত্রীয় এমটি ব্যর্থ হয়), এবং এলএলএম-কে একটি সম্ভাব্য কিন্তু ত্রুটিপূর্ণ ত্রাণকর্তা হিসাবে অবস্থান দেয় (খরচ, বিভ্রান্তি)। তারপর, এটি মার্জিত হাইব্রিড মডেলটি উপস্থাপন করে: ৮০% সহজ ক্ষেত্রের জন্য সস্তা, দ্রুত API ব্যবহার করুন, এবং ব্যয়বহুল, স্মার্ট এলএলএম শুধুমাত্র বিতর্কিত ২০% এর জন্য সালিশ হিসাবে মোতায়েন করুন। এই "মতবিরোধ সনাক্তকরণ" প্রকল্পের চতুর মর্ম। মূল্যায়ন যৌক্তিকভাবে অনুবাদ গুণমানকে উন্নত অন্টোলজি ম্যাচিং স্কোরের কংক্রিট, পরিমাপযোগ্য ফলাফলের সাথে যুক্ত করে, বিষয়ভিত্তিক অনুবাদ গুণমানের বাইরে বাস্তব-বিশ্বের উপযোগিতা প্রমাণ করে।
শক্তি ও দুর্বলতা:
শক্তি: হাইব্রিড স্থাপত্য বাণিজ্যিকভাবে বিচক্ষণ এবং প্রযুক্তিগতভাবে শব্দ। এসকেওএস, একটি W3C স্ট্যান্ডার্ড, এর উপর ফোকাস তাৎক্ষণিক প্রাসঙ্গিকতা নিশ্চিত করে। ওপেন-সোর্স প্রকৃতি এবং "সাধারণ হার্ডওয়্যার"-এর জন্য নকশা গৃহীতির বাধা নাটকীয়ভাবে কমিয়ে দেয়। ওএম কার্যকারিতার উপর মূল্যায়ন একটি মাস্টারস্ট্রোক—এটি উপযোগিতা পরিমাপ করে, শুধুমাত্র নান্দনিকতা নয়।
দুর্বলতা: গবেষণাপত্রটি প্রম্পট ইঞ্জিনিয়ারিং উপেক্ষা করে, যা এলএলএম পরিমার্জনের জন্য সাফল্য বা ব্যর্থতার কারণ। একটি খারাপ প্রম্পট এলএলএম স্তরটিকে অকেজো বা ক্ষতিকারক করে তুলতে পারে। মূল্যায়ন, যদিও যুক্তিসঙ্গত, এখনও কিছুটা বিচ্ছিন্ন; WOKIE ডিএইচ টেক্সটে NLLB-এর মতো একটি ছোট, ওপেন-সোর্স মডেল ফাইন-টিউন করার সাথে কীভাবে তুলনা করে? এলএলএম API-এর দীর্ঘমেয়াদী খরচ ট্র্যাজেক্টরি টেকসইতার জন্য একটি ঝুঁকির কারণ যা সম্পূর্ণরূপে সমাধান করা হয়নি।
কার্যকরী অন্তর্দৃষ্টি:
- ডিএইচ প্রতিষ্ঠানের জন্য: অবিলম্বে একটি মূল অ-ইংরেজি থিসরাসে WOKIE পাইলট করুন। উন্নত সম্পদ আবিষ্কার এবং Europeana বা DPLA-এর মতো প্রধান কেন্দ্রগুলির সাথে অ্যালাইনমেন্টে ROI উল্লেখযোগ্য হতে পারে। যাচাই করার জন্য বিনামূল্যের টিয়ার পরিষেবা দিয়ে শুরু করুন।
- ডেভেলপারদের জন্য: WOKIE কোডবেসে অবদান রাখুন, বিশেষ করে বিভিন্ন ডিএইচ উপ-ক্ষেত্রের জন্য (প্রত্নতত্ত্ব, সঙ্গীতবিদ্যা, ইত্যাদি) অপ্টিমাইজড, ডোমেন-টিউনড প্রম্পটগুলির একটি লাইব্রেরি তৈরি করতে।
- অর্থদাতাদের জন্য: একটি স্বর্ণ-মান, বহুভাষিক ডিএইচ পরিভাষা বেঞ্চমার্ক তৈরি করার জন্য তহবিল প্রদান করুন যাতে ক্ষেত্রটি BLEU স্কোরের বাইরে যেতে পারে। WOKIE-এর আউটপুট অ্যাকটিভ লার্নিং সিস্টেমে একীভূত করে এমন প্রকল্পগুলিকে সমর্থন করুন।
- সমালোচনামূলক পরবর্তী পদক্ষেপ: সম্প্রদায়কে অবশ্যই এই মেশিন-অনুবাদিত লেবেলগুলির জন্য একটি গভর্নেন্স মডেল বিকাশ করতে হবে। গবেষণামূলক অখণ্ডতা বজায় রাখার জন্য, রিসার্চ ডেটা অ্যালায়েন্স (RDA)-এর মতো উদ্যোগ দ্বারা সমর্থিত ডেটা প্রোভেনেন্স নীতিগুলি অনুসরণ করে, সেগুলিকে স্পষ্টভাবে "মেশিন-অগমেন্টেড" হিসাবে ট্যাগ করা উচিত।
উপসংহারে, WOKIE সেই ধরনের ব্যবহারিক, ব্যবহার-কেস-চালিত এআই অ্যাপ্লিকেশনকে প্রতিনিধিত্ব করে যা প্রকৃতপক্ষে কার্যপ্রবাহ পরিবর্তন করবে। এটি AGI-এর পিছনে ছোটে না; এটি পুরানো এবং নতুন প্রযুক্তির একটি চতুর মিশ্রণ দিয়ে একটি নির্দিষ্ট, বেদনাদায়ক সমস্যার সমাধান করে। এর সাফল্য BLEU পয়েন্টে নয়, বরং পূর্বে অদৃশ্য ঐতিহাসিক রেকর্ডের সংখ্যায় পরিমাপ করা হবে যা হঠাৎ করে একটি বিশ্বব্যাপী গবেষকের জন্য খুঁজে পাওয়া যায়।