هوش مصنوعی مولد یک حکم اعدام برای زبان های در حال انقراض نیست

جدول محتوا

طبق گزارش یونسکوممکن است تا سال 2100 بیش از نیمی از زبان ها منقرض شوند. بسیاری از مردم می گویند که هوش مصنوعی مولد به این فرآیند کمک می کند.

کاهش تنوع زبان با هوش مصنوعی یا اینترنت آغاز نشد. اما هوش مصنوعی است در موقعیتی برای تسریع نابودی زبان های بومی و کم منابع.

بیشتر 7000 زبان دنیا منابع کافی برای آموزش مدل‌های هوش مصنوعی ندارند و بسیاری از آنها فاقد فرم نوشتاری هستند. این به این معنی است که چند زبان اصلی بر انبار داده‌های آموزشی هوش مصنوعی بشریت تسلط دارند، در حالی که بیشتر آنها در انقلاب هوش مصنوعی رها شده‌اند – و ممکن است به طور کامل ناپدید شوند.

دلیل ساده این است که بیشتر داده‌های آموزشی هوش مصنوعی به زبان انگلیسی است. انگلیسی محرک اصلی مدل‌های زبان بزرگ (LLM) است و افرادی که به زبان‌های کمتر رایج صحبت می‌کنند، در فناوری هوش مصنوعی کمتر حضور دارند.

در نظر بگیرید این آمار از مجمع جهانی اقتصاد:

دو سوم تمام وب سایت ها به زبان انگلیسی هستند.
بسیاری از داده هایی که GenAI از آنها می آموزد از وب خراشیده شده است.
کمتر از 20 درصد از جمعیت جهان انگلیسی صحبت می کنند.

همانطور که هوش مصنوعی در زندگی روزمره ما بیشتر می شود، همه ما باید به برابری زبان فکر کنیم. هوش مصنوعی پتانسیل بی‌سابقه‌ای برای حل مشکلات در مقیاس دارد و وعده آن نباید به دنیای انگلیسی‌زبان محدود شود. هوش مصنوعی در حال ایجاد امکانات و ابزارهایی است که زندگی شخصی و حرفه ای افراد را برای مردم کشورهای توسعه یافته و ثروتمند بهبود می بخشد.

گویندگان زبان‌های کم‌منبع به کمبود بازنمایی در فن‌آوری عادت کرده‌اند – از پیدا نکردن وب‌سایت‌ها به زبانشان تا عدم شناسایی لهجه‌شان توسط سیری. بسیاری از متن که است موجود برای آموزش هوش مصنوعی به زبان‌های با منابع پایین‌تر، کیفیت پایینی دارد (با دقت مشکوک ترجمه شده است) و دامنه محدودی دارد.

چگونه جامعه می تواند تضمین کند که زبان های با منابع پایین تر از معادله هوش مصنوعی حذف نمی شوند؟ چگونه می توانیم اطمینان حاصل کنیم که زبان مانعی برای وعده هوش مصنوعی نیست؟

در تلاشی برای فراگیری زبان، برخی از بازیگران اصلی فناوری ابتکاراتی برای آموزش مدل‌های زبان چندزبانه بزرگ (MLM) دارند. به عنوان مثال، مایکروسافت ترنسلیت متعهد شده است که از “هر زبان، در همه جا” پشتیبانی کند. و متا یک وعده “هیچ زبانی باقی نمی ماند” دارد. اینها قابل ستایش هستند، اما آیا واقع بینانه هستند؟

مشتاق به سمت یک مدل که هر زبانی را در جهان مدیریت کند به نفع افراد ممتاز است زیرا حجم بسیار بیشتری از داده ها از زبان های اصلی جهان وجود دارد. هنگامی که ما شروع به کار با زبان‌های کم‌منبع و زبان‌هایی با خط‌های غیر لاتین می‌کنیم، آموزش مدل‌های هوش مصنوعی سخت‌تر، زمان‌برتر و گران‌تر می‌شود. آن را به عنوان یک مالیات ناخواسته بر زبان هایی که کمتر معرفی شده اند در نظر بگیرید.

پیشرفت در فناوری گفتار

مدل‌های هوش مصنوعی عمدتاً روی متن آموزش داده می‌شوند، که طبیعتاً زبان‌هایی را که ذخیره‌های عمیق‌تری از محتوای متن دارند، ترجیح می‌دهد. تنوع زبان با سیستم هایی که به متن وابسته نیستند بهتر پشتیبانی می شود. تعامل انسانی در یک زمان همه مبتنی بر گفتار بود، و بسیاری از فرهنگ ها این تمرکز شفاهی را حفظ می کنند. برای پاسخگویی بهتر به مخاطبان جهانی، صنعت هوش مصنوعی باید از داده های متنی به داده های گفتاری پیشرفت کند.

تحقیقات پیشرفت های زیادی در فناوری گفتار دارد، اما همچنان از فناوری های مبتنی بر متن عقب است. تحقیقات در زمینه پردازش گفتار در حال پیشرفت است، اما فناوری گفتار به گفتار مستقیم هنوز به بلوغ رسیده است. واقعیت این است که صنعت تمایل دارد با احتیاط حرکت کند و تنها زمانی که یک فناوری به سطح معینی پیشرفت کند.

پلتفرم تفسیر زنده GlobalLink TransPerfect که به تازگی منتشر شده است، دوباره از اشکال بالغ‌تر فناوری گفتار – تشخیص خودکار گفتار (ASR) و متن به گفتار (TTS) – استفاده می‌کند، زیرا سیستم‌های گفتار به گفتار مستقیم در این مرحله به اندازه کافی بالغ نیستند. . همانطور که گفته شد، تیم های تحقیقاتی ما در حال آماده شدن برای روزی هستند که خطوط لوله کاملاً گفتار به گفتار برای زمان اصلی آماده شوند.

گفتار به گفتار مدل های ترجمه نوید بزرگی در حفظ زبان های شفاهی می دهد. در سال 2022، متا اولین سیستم ترجمه گفتار به گفتار مبتنی بر هوش مصنوعی را برای هوکین، یک زبان عمدتا شفاهی که حدود 46 میلیون نفر در دیاسپورای چینی به آن صحبت می‌کنند، معرفی کرد. این بخشی از پروژه Universal Speech Translator متا است که در حال توسعه مدل‌های جدید هوش مصنوعی است که امیدوار است بتواند ترجمه گفتار به گفتار در زمان واقعی را در بسیاری از زبان‌ها فعال کند. متا مدل‌های ترجمه هوکین، مجموعه داده‌های ارزیابی و مقالات تحقیقاتی خود را به صورت متن‌باز انتخاب کرد تا دیگران بتوانند کار خود را بازتولید کرده و بر اساس آن کار کنند.

یادگیری با کمتر

این واقعیت که ما به عنوان یک جامعه جهانی فاقد منابع پیرامون برخی زبان ها هستیم، حکم اعدام برای آن زبان ها نیست. اینجاست که مدل‌های چند زبانه مزیتی دارند، زیرا زبان‌ها از یکدیگر یاد می‌گیرند. همه زبان ها از الگوهایی پیروی می کنند. به دلیل انتقال دانش بین زبان ها، نیاز به داده های آموزشی کمتر می شود.

فرض کنید مدلی دارید که در حال یادگیری 90 زبان است و می‌خواهید اینویت (گروهی از زبان‌های بومی آمریکای شمالی) را اضافه کنید. به دلیل انتقال دانش، به داده های Inuit کمتری نیاز خواهید داشت. ما در حال یافتن راه هایی برای یادگیری با کمتر هستیم. مقدار داده مورد نیاز برای تنظیم دقیق موتورها کمتر است.

من به آینده ای با هوش مصنوعی فراگیرتر امیدوار هستم. من فکر نمی‌کنم که محکوم به ناپدید شدن انبوهی از زبان‌ها باشیم، و فکر نمی‌کنم هوش مصنوعی همچنان در قلمرو دنیای انگلیسی‌زبان باقی بماند. در حال حاضر، ما شاهد آگاهی بیشتر در مورد مسئله برابری زبان هستیم. از مجموعه داده‌های متنوع‌تر گرفته تا ساخت مدل‌های خاص زبان، ما در حال پیشرفت هستیم.

زبان Fon را در نظر بگیرید، زبانی که حدود 4 میلیون نفر در بنین و کشورهای همسایه آفریقا صحبت می کنند. چندی پیش، یک مدل محبوب هوش مصنوعی، فون را به عنوان یک زبان تخیلی توصیف کرد. یک دانشمند کامپیوتر به نام Bonaventure Dosseau، که مادرش Fon صحبت می کند، به این نوع محرومیت عادت داشت. دوسو که فرانسوی صحبت می کند، بدون برنامه ترجمه بزرگ شد که به او در برقراری ارتباط با مادرش کمک کند. امروز، او می تواند با مادرش به لطف یک مترجم فون-فرانسوی که با زحمت ساخته است، ارتباط برقرار کند. امروزه یک ویکی پدیا فون نوپا نیز وجود دارد.

در تلاش برای استفاده از فناوری برای حفظ زبان‌ها، هنرمند ترک، Refik Anadol، ایجاد یک ابزار AI منبع باز برای مردم بومی را آغاز کرده است. در اجلاس جهانی اقتصاد، او پرسید: “چگونه می توانیم هوش مصنوعی ایجاد کنیم که کل بشریت را نشناسد؟”

ما نمی توانیم و نمی توانیم.

منبع:unite.ai

پیشرفت در فناوری گفتار

یادگیری با کمتر

پست های مرتبط

مقابله با انتخاب مدل: 6 ملاحظات برای انتخاب بهترین مدل

Minmax vs Standard vs Strong Scaler: کدام یک برای داده های نامتقارن برنده می شود؟

مقابله با الگوریتم: رگرسیون لجستیک در مقابل Random Forest یا XGBoost در داده های نامتعادل