Այսօր Meta-ն ներկայացրեց SeamlessM4T-ն՝ առաջին ունիվերսալ բազմամոդալ և բազմալեզու արհեստական բանականության թարգմանության մոդելը, որը թույլ է տալիս օգտատերերին հաղորդակցվել լեզվական խոչընդոտների միջով: SeamlessM4T-ն ներկայումս հասանելի է հետազոտողների և մշակողների համար համապատասխան լիցենզիայի ներքո: Հրապարակվել են նաև SeamlessAlign-ի մետատվյալները, որը բազմամոդալ թարգմանության ամենամեծ բաց տվյալների հավաքածուն է, որը ներառում է 270,000 ժամ վերլուծված խոսք:.
Դուգլաս Ադամսի «Գալակտիկայի ավտոստոպով ճանապարհորդի ուղեցույց» վեպերի նման՝ համընդհանուր լեզվի թարգմանիչ ստեղծելը մարտահրավեր է, և գոյություն ունեցող խոսքից խոսք և խոսքից տեքստ համակարգերը ներառում են աշխարհի լեզուների միայն մի փոքր մասը: SeamlessM4T-ն հիմնված է ամբողջ աշխարհում համընդհանուր թարգմանիչ ստեղծելու համար տարիների ընթացքում կատարված հետազոտական ջանքերի վրա: Անհատական մոդելներ օգտագործող մոտեցումների համեմատ, SeamlessM4T-ի միասնական համակարգի մոտեցումը նվազեցնում է սխալներն ու ուշացումները՝ բարելավելով թարգմանության գործընթացի արդյունավետությունն ու որակը:.

Անցյալ տարի Meta-ի մշակողները թողարկեցին No Language Left Behind (NLLB) տեքստից տեքստ մեքենայական թարգմանության մոդելը, որն աջակցում է 200 լեզու և այդ ժամանակվանից ի վեր ինտեգրվել է Վիքիպեդիայում որպես թարգմանչական ծառայությունների մատակարար: Նրանք նախկինում ցուցադրել են համընդհանուր խոսքի թարգմանիչ, որը դարձավ Մին Նանի (չինարեն լեզվի բարբառ) առաջին ուղիղ խոսքից խոսքի համակարգը: Meta լեզվի մեկ այլ նախագիծ է Massively Multilingual Speech-ը՝ խոսքի ճանաչման, նույնականացման և սինթեզի համակարգ ավելի քան 1100 լեզուներով:.
SeamlessM4T-ն հիմնված է այս բոլոր նախագծերի արդյունքների վրա՝ ապահովելով բազմալեզու և բազմամոդալ թարգմանություն՝ հիմնվելով միասնական մոդելի վրա, որը կառուցված է բանավոր տվյալների լայն շրջանակի աղբյուրների վրա՝ ժամանակակից արդյունքներով: SeamlessM4T-ն աջակցում է
- Խոսքի ճանաչում գրեթե 100 լեզուներով;
- Խոսքի տեքստի փոխակերպում գրեթե 100 մուտքագրման և ելքագրման լեզուների համար։
- Խոսքի խոսքի փոխակերպում, գրեթե 100 մուտքագրման լեզուների և 36 (ներառյալ անգլերեն և ռուսերեն) ելքային լեզուների աջակցություն;
- Տեքստի թարգմանություն գրեթե 100 լեզուներով;
- Տեքստի խոսքի փոխակերպում, գրեթե 100 մուտքագրման լեզուների և 35 (ներառյալ անգլերեն և ռուսերեն) ելքային լեզուների աջակցություն։.
SeamlessM4T-ն հետազոտողների ջանքերի վերջին քայլն է՝ ստեղծելու արհեստական բանականության վրա հիմնված տեխնոլոգիա, որը կօգնի կապել տարբեր լեզուներով խոսող մարդկանց: Իմացեք ավելին SeamlessM4T-ի մասին Meta AI բլոգում:.

