მეტამ წარმოადგინა SeamlessM4T, უნივერსალური ხელოვნური ინტელექტის მოდელი ტექსტისა და მეტყველების თითქმის 100 ენაზე, მათ შორის რუსულ ენაზე თარგმნისთვის

მეტამ წარმოადგინა SeamlessM4T, უნივერსალური ხელოვნური ინტელექტის მოდელი ტექსტისა და მეტყველების თითქმის 100 ენაზე, მათ შორის რუსულ ენაზე თარგმნისთვის

დღეს, Meta-მ წარმოადგინა SeamlessM4T, პირველი უნივერსალური მულტიმოდალური და მრავალენოვანი ხელოვნური ინტელექტის თარგმანის მოდელი, რომელიც მომხმარებლებს საშუალებას აძლევს, ენობრივი ბარიერების გადალახვის გზით დაუკავშირდნენ. SeamlessM4T ამჟამად ხელმისაწვდომია მკვლევარებისა და დეველოპერებისთვის შესაბამისი ლიცენზიით. ასევე გამოქვეყნდა SeamlessAlign-ის მეტამონაცემები, მულტიმოდალური თარგმანის უდიდესი ღია მონაცემთა ნაკრები, რომელიც მოიცავს 270,000 საათის გაანალიზებულ მეტყველებას.

უნივერსალური ენის მთარგმნელის შექმნა, როგორიცაა დუგლას ადამსის „ავტოსტოპით მოგზაურობის გზამკვლევი გალაქტიკაში“ რომანებიდან გამოგონილი „ბაბილონის თევზი“, საკმაოდ რთული ამოცანაა და არსებული მეტყველების მეტყველებად და ტექსტად გარდაქმნის სისტემები მსოფლიოს ენების მხოლოდ მცირე ნაწილს მოიცავს. SeamlessM4T ეფუძნება მთელ მსოფლიოში მრავალწლიან კვლევით ძალისხმევას უნივერსალური მთარგმნელის შესაქმნელად. ინდივიდუალური მოდელების გამოყენებით მიდგომებთან შედარებით, SeamlessM4T-ის ერთიანი სისტემის მიდგომა ამცირებს შეცდომებსა და შეფერხებებს, რაც აუმჯობესებს თარგმანის პროცესის ეფექტურობას და ხარისხს.

SeamlessM4T
SeamlessM4T

გასულ წელს Meta-ს დეველოპერებმა გამოუშვეს No Language Left Behind (NLLB), ტექსტიდან ტექსტში მანქანური თარგმანის მოდელი, რომელიც მხარს უჭერს 200 ენას და მას შემდეგ ინტეგრირებულია Wikipedia-ში, როგორც თარგმანის სერვისის პროვაიდერი. მათ ადრე აჩვენეს უნივერსალური მეტყველების მთარგმნელი, რომელიც გახდა პირველი პირდაპირი მეტყველებიდან მეტყველებაზე გადასვლის სისტემა მინ ნანის (ჩინური დიალექტი) ენაზე. კიდევ ერთი Meta-ს ენის პროექტია Massively Multilingual Speech, სისტემა მეტყველების ამოცნობის, იდენტიფიკაციისა და სინთეზისთვის 1100-ზე მეტ ენაზე.

SeamlessM4T ეფუძნება ყველა ამ პროექტის შედეგებს და უზრუნველყოფს მრავალენოვან და მულტიმოდალურ თარგმანს, რომელიც დაფუძნებულია ერთიან მოდელზე, რომელიც აგებულია სალაპარაკო მონაცემთა წყაროების ფართო სპექტრზე და უახლესი შედეგებით. SeamlessM4T მხარს უჭერს:

  • მეტყველების ამოცნობა თითქმის 100 ენაზე;
  • მეტყველების ტექსტად კონვერტაცია თითქმის 100 შეყვანისა და გამოყვანის ენაზე;
  • მეტყველების მეტყველების კონვერტაცია, თითქმის 100 შეყვანის ენისა და 36 (ინგლისური და რუსული ჩათვლით) გამომავალი ენის მხარდაჭერა;
  • ტექსტის თარგმნა თითქმის 100 ენაზე;
  • ტექსტიდან მეტყველებამდე კონვერტაცია, თითქმის 100 შეყვანის ენისა და 35 (ინგლისური და რუსული ჩათვლით) გამომავალი ენის მხარდაჭერა.

SeamlessM4T წარმოადგენს მკვლევართა ძალისხმევის უახლეს ნაბიჯს ხელოვნური ინტელექტით მართული ტექნოლოგიის შესაქმნელად, რომელიც სხვადასხვა ენაზე მოლაპარაკე ადამიანებს ერთმანეთთან დააკავშირებს. SeamlessM4T-ის შესახებ დამატებითი ინფორმაციისთვის ეწვიეთ Meta AI ბლოგს.

წაიკითხეთ წყარო