آخرین اخبار

17:14

دادگاه کار فرانسه حکم داد که پاری سن ژرمن باید ۶۰.۹ میلیون یورو به امباپه بپردازد
16:38

هوش مصنوعی در حال تغییر چشم‌انداز انرژی جهانی است: نوآوری در مقابل افزایش هزینه‌ها
16:23

جزئیات جدیدی از دستگیری یک جاسوس اسرائیلی در غرب تهران منتشر شده است
16:10

گزارش: مراکش در رتبه ۷۰ جهانی از نظر کیفیت زندگی دیجیتال
15:52

سودان برای سومین بار متوالی در صدر فهرست بحران‌های کمیته بین‌المللی نجات قرار گرفت
15:25

حمله آمریکا به کشتی‌ها در نزدیکی ونزوئلا، حضور نظامی در آمریکای لاتین را گسترش می‌دهد
15:25

مراکش و اتحادیه اروپا: یک همکاری اقتصادی پررونق
14:43

تایلند می‌گوید کامبوج باید «اولین» آتش‌بس را برای توقف جنگ اعلام کند
14:00

مراکش در سال ۲۰۲۵ از نظر رشد ذخایر ارزی در رتبه پنجم آفریقا قرار گرفت
13:18

فورد با اصلاح بخش خودروهای برقی ضررده خود، ۱۹.۵ میلیارد دلار ضرر خواهد کرد
13:00

بخشی جدایی‌ناپذیر از خاک ایران... تهران بیانیه امارات در مورد جزایر سه‌گانه را محکوم می‌کند
12:15

نزدک برای پاسخگویی به تقاضای سرمایه‌گذاران جهانی، خود را برای معاملات سهام ۲۴ ساعته آماده می‌کند
11:30

ایالات متحده فنتانیل را به عنوان «سلاح کشتار جمعی» طبقه‌بندی می‌کند
11:03

جدال قدرت در اتحادیه اروپا، دیوار پهپادی و سایر پروژه‌های دفاعی را به خطر می‌اندازد
10:44

سازمان ملل قطعنامه‌ای را تصویب کرد که حق تعیین سرنوشت مردم فلسطین را با اکثریت آرا تأیید می‌کند
10:00

جام ملت‌های آفریقا ۲۰۲۵: شور و شوق آفریقایی مراکش را فرا گرفت، ویترینی جهانی از ورزش
09:49

ترامپ می‌گوید نیروی بین‌المللی تثبیت‌کننده غزه در حال حاضر در حال فعالیت است
09:15

گروه ۷۷ و چین بر ضرورت احترام به حاکمیت و تمامیت ارضی کشورها تأکید کردند
09:03

ترامپ از بی‌بی‌سی به دلیل ویرایش مستند، 10 میلیارد دلار غرامت خواست
08:28

گروه ۲۰: آفریقای جنوبی از اولین اجلاس تحت ریاست ایالات متحده کنار گذاشته شد
08:07

اروپایی‌ها نیروی صلح برای اوکراین تشکیل می‌دهند
07:45

فیچ: مراکش رکورد رشد صادرات را به دلیل رشد بخش خودرو (+9.2%) ثبت کرد

ساعت‌های نماز

فجر
طلوع آفتاب
ظهر
عصر
مغرب
عشاء

ساعت‌های دیگر شهرها

Advertising

فن آوری

متا مدل هوش مصنوعی Spirit LM را برای تقلید صدای انسان راه اندازی کرد

Tuesday 22 October 2024 - 08:45

متا مدل منبع باز جدید خود را با نام "Spirit LM" راه اندازی کرده است که به چالش های مربوط به مدل های چندوجهی در هوش مصنوعی در تولید صدا می پردازد.

هدف مدل جدید ارائه یک تجربه صوتی طبیعی تر و گویاتر است که گامی پیشرفته در توسعه ربات های هوشمندی است که قادر به برقراری ارتباط صوتی به روش های پیچیده تر و واقعی تر هستند.

مدل «Spirit LM» مبتنی بر یک مدل زبان از پیش آموزش‌دیده‌شده حاوی 7 میلیارد پارامتر است و با توانایی آن در پردازش صدا متفاوت از مدل‌های سنتی که بر فناوری‌های تشخیص خودکار گفتار (ASR) متکی هستند، متمایز می‌شود.

متا اشاره می کند که رویکرد سنتی منجر به از بین رفتن بسیاری از بیان های طبیعی صدا می شود. بنابراین، Spirit LM برای غلبه بر این محدودیت‌ها بر استفاده از واج‌ها، آهنگ‌ها و زیر و بم تکیه می‌کند و به آن اجازه می‌دهد صداهای طبیعی تولید کند و کارهای جدیدی از جمله تشخیص گفتار، تبدیل متن به متن و طبقه‌بندی صدا را بیاموزد.

متا این مدل را در یک مقاله تحقیقاتی فاش کرد و همچنین جزئیات تحقیقاتی را که منجر به توسعه "Spirit LM" شد، علاوه بر نمونه هایی از عملکرد صوتی این مدل، ذکر کرد و ایده روشنی از قابلیت های آینده آن ارائه داد.

این مدل اکنون به‌عنوان یک پروژه منبع باز برای توسعه‌دهندگان و محققان در دسترس است تا از آن استفاده کنند و توسعه دهند و انتظار می‌رود در آینده در برنامه‌های متا مانند WhatsApp، Instagram و Facebook مورد استفاده قرار گیرد و به کاربران امکان تعامل با هوش مصنوعی از طریق صدای طبیعی را بدهد. . مکالمات پر از عبارات مشابه حالت صوتی پیشرفته که اخیرا توسط OpenAI معرفی شده است.