Meta-ն ներկայացրեց SeamlessM4T-ը՝ ունիվերսալ արհեստական ​​բանականության մոդել, որը նախատեսված է տեքստը և խոսքը գրեթե 100 լեզուներով, այդ թվում՝ ռուսերենով թարգմանելու համար։

Meta-ն ներկայացրեց SeamlessM4T-ը՝ ունիվերսալ արհեստական ​​բանականության մոդել, որը նախատեսված է տեքստը և խոսքը գրեթե 100 լեզուներով, այդ թվում՝ ռուսերենով թարգմանելու համար։

Այսօր Meta-ն ներկայացրեց SeamlessM4T-ն՝ առաջին ունիվերսալ բազմամոդալ և բազմալեզու արհեստական ​​բանականության թարգմանության մոդելը, որը թույլ է տալիս օգտատերերին հաղորդակցվել լեզվական խոչընդոտների միջով: SeamlessM4T-ն ներկայումս հասանելի է հետազոտողների և մշակողների համար համապատասխան լիցենզիայի ներքո: Հրապարակվել են նաև SeamlessAlign-ի մետատվյալները, որը բազմամոդալ թարգմանության ամենամեծ բաց տվյալների հավաքածուն է, որը ներառում է 270,000 ժամ վերլուծված խոսք:.

Դուգլաս Ադամսի «Գալակտիկայի ավտոստոպով ճանապարհորդի ուղեցույց» վեպերի նման՝ համընդհանուր լեզվի թարգմանիչ ստեղծելը մարտահրավեր է, և գոյություն ունեցող խոսքից խոսք և խոսքից տեքստ համակարգերը ներառում են աշխարհի լեզուների միայն մի փոքր մասը: SeamlessM4T-ն հիմնված է ամբողջ աշխարհում համընդհանուր թարգմանիչ ստեղծելու համար տարիների ընթացքում կատարված հետազոտական ​​ջանքերի վրա: Անհատական ​​մոդելներ օգտագործող մոտեցումների համեմատ, SeamlessM4T-ի միասնական համակարգի մոտեցումը նվազեցնում է սխալներն ու ուշացումները՝ բարելավելով թարգմանության գործընթացի արդյունավետությունն ու որակը:.

SeamlessM4T
SeamlessM4T

Անցյալ տարի Meta-ի մշակողները թողարկեցին No Language Left Behind (NLLB) տեքստից տեքստ մեքենայական թարգմանության մոդելը, որն աջակցում է 200 լեզու և այդ ժամանակվանից ի վեր ինտեգրվել է Վիքիպեդիայում որպես թարգմանչական ծառայությունների մատակարար: Նրանք նախկինում ցուցադրել են համընդհանուր խոսքի թարգմանիչ, որը դարձավ Մին Նանի (չինարեն լեզվի բարբառ) առաջին ուղիղ խոսքից խոսքի համակարգը: Meta լեզվի մեկ այլ նախագիծ է Massively Multilingual Speech-ը՝ խոսքի ճանաչման, նույնականացման և սինթեզի համակարգ ավելի քան 1100 լեզուներով:.

SeamlessM4T-ն հիմնված է այս բոլոր նախագծերի արդյունքների վրա՝ ապահովելով բազմալեզու և բազմամոդալ թարգմանություն՝ հիմնվելով միասնական մոդելի վրա, որը կառուցված է բանավոր տվյալների լայն շրջանակի աղբյուրների վրա՝ ժամանակակից արդյունքներով: SeamlessM4T-ն աջակցում է

  • Խոսքի ճանաչում գրեթե 100 լեզուներով;
  • Խոսքի տեքստի փոխակերպում գրեթե 100 մուտքագրման և ելքագրման լեզուների համար։
  • Խոսքի խոսքի փոխակերպում, գրեթե 100 մուտքագրման լեզուների և 36 (ներառյալ անգլերեն և ռուսերեն) ելքային լեզուների աջակցություն;
  • Տեքստի թարգմանություն գրեթե 100 լեզուներով;
  • Տեքստի խոսքի փոխակերպում, գրեթե 100 մուտքագրման լեզուների և 35 (ներառյալ անգլերեն և ռուսերեն) ելքային լեզուների աջակցություն։.

SeamlessM4T-ն հետազոտողների ջանքերի վերջին քայլն է՝ ստեղծելու արհեստական ​​բանականության վրա հիմնված տեխնոլոգիա, որը կօգնի կապել տարբեր լեզուներով խոսող մարդկանց: Իմացեք ավելին SeamlessM4T-ի մասին Meta AI բլոգում:.

Կարդացե՛ք աղբյուրը