-
17:15
-
16:30
-
15:44
-
15:00
-
14:15
-
13:39
-
13:00
-
12:15
-
11:30
-
11:07
-
10:43
-
10:00
-
09:15
-
08:57
-
08:29
-
08:08
-
07:45
ما را در فیسبوک دنبال کنید
GemMaroc: انقلاب مراکشی در ادغام زبان داریجا در هوش مصنوعی
مراکش با راهاندازی GemMaroc، یک مطالعه پیشگام با عنوان «باز کردن مهارت داریا در LLM با حداقل دادهها»، که توانایی مدلهای زبانی را برای درک و تولید داریا، گویش مراکشی، بررسی میکند، گامی بزرگ در دنیای فناوری زبان برداشته است.
این ابتکار، که توسط گروهی از محققان مراکشی متخصص در هوش مصنوعی و زبانشناسی رهبری میشود، انقلابی واقعی در ادغام زبانهای محلی در سیستمهای دیجیتال را نشان میدهد. GemMaroc، بسیار بیشتر از یک پروژه علمی، به عنوان یک اقدام رهاییبخش فناوری در مواجهه با سلطه زبانی جهانی در حوزه هوش مصنوعی برجسته است.
نتایج این مطالعه چشمگیر است: تنها در دو روز آموزش، محققان موفق شدند مدلی را توسعه دهند که قادر به درک و تولید داریا با دقت قابل توجه و با استفاده از منابع داده محدود باشد.
این تیم با استفاده از مجموعهای کوچک از جملات با دقت ترجمه و انتخاب شده، افزایش نرخ پاسخ صحیح را از ۳۳٪ به بیش از ۴۷٪ مشاهده کرد، بدون اینکه عملکرد مدل در زبان انگلیسی به خطر بیفتد. پیشرفتهترین مدل، GemMaroc-27B، حتی در آزمونهای درک مطلب داریجا از چندین مدل بینالمللی نیز پیشی گرفت.
این مطالعه بر یک نکته حیاتی تأکید میکند: موفقیت مدل به حجم دادهها بستگی ندارد، بلکه به کیفیت و تنوع آن بستگی دارد. محققان سناریوهای زندگی واقعی و گفتگوهای روزمره که منعکس کننده زندگی مراکشی هستند - دستورالعملهای گفتاری، عبارات عامیانه و سوالات فرهنگی - را ترجیح دادند تا به مدل اجازه دهند ظرافتهای بافت محلی را ادغام کند.
یکی دیگر از نوآوریهای مهم، ایجاد یک زبان «ساختارمند داریجا» بود که با هدف کاهش «نویز زبانی» ناشی از تنوع گویشهای منطقهای انجام شد. این رویکرد، هوش مصنوعی را قادر ساخت تا به طور مداومتر و دقیقتر پاسخ دهد و راه را برای طراحی ابزارهای آموزشی، اداری و دیجیتال در داریجا هموار کند.
این مطالعه همچنین یک چالش اساسی را برجسته میکند: فقدان یک استاندارد نوشتاری برای داریجا، به دلیل ماهیت اساساً شفاهی آن. برای پرداختن به این موضوع، تیم یک روش ترکیبی را اتخاذ کرد که نوشتار را با الفبای عربی و لاتین ترکیب میکرد تا واقعیت زبانی مراکشی را در اینترنت و رسانههای اجتماعی منعکس کند.
در نهایت، برای حفظ تعادل مهارت مدل، 20٪ از متون آموزشی به زبان انگلیسی باقی ماندند و حفظ مهارتهای کلی سیستم در ریاضیات، استدلال و درک زمینهای را تضمین کردند.
با GemMaroc، مراکش خود را به عنوان پیشگام در گنجاندن زبانی هوش مصنوعی معرفی میکند و ثابت میکند که فناوری پیشرفته میتواند با یک زبان محلی سازگار شود و آن را به ابزاری برای نوآوری فرهنگی و اجتماعی تبدیل کند. این پروژه نویدبخش دوران جدیدی است که در آن داریجا سرانجام وارد زبان ماشینها میشود، در جایگاهی برابر با زبانهای اصلی جهان.