Advertising
  • فجر
  • طلوع آفتاب
  • ظهر
  • عصر
  • مغرب
  • عشاء

ما را در فیس‌بوک دنبال کنید

GemMaroc: انقلاب مراکشی در ادغام زبان داریجا در هوش مصنوعی

15:00
GemMaroc: انقلاب مراکشی در ادغام زبان داریجا در هوش مصنوعی

مراکش با راه‌اندازی GemMaroc، یک مطالعه پیشگام با عنوان «باز کردن مهارت داریا در LLM با حداقل داده‌ها»، که توانایی مدل‌های زبانی را برای درک و تولید داریا، گویش مراکشی، بررسی می‌کند، گامی بزرگ در دنیای فناوری زبان برداشته است.

این ابتکار، که توسط گروهی از محققان مراکشی متخصص در هوش مصنوعی و زبان‌شناسی رهبری می‌شود، انقلابی واقعی در ادغام زبان‌های محلی در سیستم‌های دیجیتال را نشان می‌دهد. GemMaroc، بسیار بیشتر از یک پروژه علمی، به عنوان یک اقدام رهایی‌بخش فناوری در مواجهه با سلطه زبانی جهانی در حوزه هوش مصنوعی برجسته است.

نتایج این مطالعه چشمگیر است: تنها در دو روز آموزش، محققان موفق شدند مدلی را توسعه دهند که قادر به درک و تولید داریا با دقت قابل توجه و با استفاده از منابع داده محدود باشد.

این تیم با استفاده از مجموعه‌ای کوچک از جملات با دقت ترجمه و انتخاب شده، افزایش نرخ پاسخ صحیح را از ۳۳٪ به بیش از ۴۷٪ مشاهده کرد، بدون اینکه عملکرد مدل در زبان انگلیسی به خطر بیفتد. پیشرفته‌ترین مدل، GemMaroc-27B، حتی در آزمون‌های درک مطلب داریجا از چندین مدل بین‌المللی نیز پیشی گرفت.

این مطالعه بر یک نکته حیاتی تأکید می‌کند: موفقیت مدل به حجم داده‌ها بستگی ندارد، بلکه به کیفیت و تنوع آن بستگی دارد. محققان سناریوهای زندگی واقعی و گفتگوهای روزمره که منعکس کننده زندگی مراکشی هستند - دستورالعمل‌های گفتاری، عبارات عامیانه و سوالات فرهنگی - را ترجیح دادند تا به مدل اجازه دهند ظرافت‌های بافت محلی را ادغام کند.

یکی دیگر از نوآوری‌های مهم، ایجاد یک زبان «ساختارمند داریجا» بود که با هدف کاهش «نویز زبانی» ناشی از تنوع گویش‌های منطقه‌ای انجام شد. این رویکرد، هوش مصنوعی را قادر ساخت تا به طور مداوم‌تر و دقیق‌تر پاسخ دهد و راه را برای طراحی ابزارهای آموزشی، اداری و دیجیتال در داریجا هموار کند.

این مطالعه همچنین یک چالش اساسی را برجسته می‌کند: فقدان یک استاندارد نوشتاری برای داریجا، به دلیل ماهیت اساساً شفاهی آن. برای پرداختن به این موضوع، تیم یک روش ترکیبی را اتخاذ کرد که نوشتار را با الفبای عربی و لاتین ترکیب می‌کرد تا واقعیت زبانی مراکشی را در اینترنت و رسانه‌های اجتماعی منعکس کند.

در نهایت، برای حفظ تعادل مهارت مدل، 20٪ از متون آموزشی به زبان انگلیسی باقی ماندند و حفظ مهارت‌های کلی سیستم در ریاضیات، استدلال و درک زمینه‌ای را تضمین کردند.

با GemMaroc، مراکش خود را به عنوان پیشگام در گنجاندن زبانی هوش مصنوعی معرفی می‌کند و ثابت می‌کند که فناوری پیشرفته می‌تواند با یک زبان محلی سازگار شود و آن را به ابزاری برای نوآوری فرهنگی و اجتماعی تبدیل کند. این پروژه نویدبخش دوران جدیدی است که در آن داریجا سرانجام وارد زبان ماشین‌ها می‌شود، در جایگاهی برابر با زبان‌های اصلی جهان.



ادامه مطلب

×

برنامه walaw را دانلود کنید