ხელოვნური ინტელექტი

  • ავსტრალიურმა ჟურნალმა თავისი თანამშრომლები ხელოვნური ინტელექტით ჩაანაცვლა

    ავსტრალიურმა ჟურნალმა თავისი თანამშრომლები ხელოვნური ინტელექტით ჩაანაცვლა

    ავსტრალიურმა ჟურნალმა Cosmos Magazine-მა მოულოდნელად გაათავისუფლა ყველა მწერალი და ისინი ხელოვნური ინტელექტით ჩაანაცვლა, რამაც ყოფილი თანამშრომლებისა და მკითხველების აღშფოთება გამოიწვია, იუწყება .

    თანამშრომლების გათავისუფლება 2024 წლის დასაწყისში წინასწარი შეტყობინების გარეშე მოხდა და მალევე გაირკვა, რომ საიტზე გამოქვეყნებულ სტატიებს ხელოვნური ინტელექტი გენერირებდა, რომელიც იმავე ავტორების კონტენტზე იყო გაწვრთნილი, რომლებიც შეცვლილი იყვნენ.

    ერთ-ერთი ყოფილი ავტორის თქმით, ჟურნალთან მისი მუშაობა „ბედნიერი და მომგებიანი ურთიერთობით“ დაიწყო, თუმცა მოულოდნელად შეწყდა მას შემდეგ, რაც მან გამოსაქვეყნებლად კიდევ ერთი ნაშრომი წარადგინა. აღმოჩნდა, რომ ჟურნალმა გრანტი მიიღო სპეციალიზებული ხელოვნური ინტელექტის შესაქმნელად, რომელიც ამჟამად კონტენტს გათავისუფლებული თანამშრომლების მიერ ადრე გამოქვეყნებული სტატიების გამოყენებით წარმოქმნის. ეს გადაწყვეტილება მხოლოდ ჟურნალის მენეჯმენტმა მიიღო და დანარჩენი პერსონალისგან საიდუმლოდ ინახებოდა.

    ჟურნალის მფლობელებიც და ხელოვნური ინტელექტის ჟურნალისტიკაში გამოყენებაც კრიტიკის ქარცეცხლში მოექცა. The Register-თან ყოფილმა ავტორმა აღნიშნა: „მე უბრალოდ არ გამათავისუფლეს და რობოტით არ ჩამანაცვლეს. ეს რობოტი ჩემი სუროგატისთვის იყო დაპროგრამებული“. ყოფილმა თანამშრომლებმა და თანადამფუძნებლებმა დაგმეს ეს ნაბიჯი და უკმაყოფილება გამოთქვეს გრანტი გამცემმა ორგანიზაციამ.

  • OpenAI წარმოგიდგენთ ახალ საძიებო სისტემას SearchGPT

    OpenAI წარმოგიდგენთ ახალ საძიებო სისტემას SearchGPT

    ცნობით, Hightech.fm-ის.

    SearchGPT შექმნილია სწრაფი, ზუსტი და წყაროებზე დაფუძნებული პასუხების უზრუნველსაყოფად, რაც მას უფრო გამჭვირვალე და საიმედო ინფორმაციის ძიების ინსტრუმენტად აქცევს. ChatGPT-თან ინტეგრირებული ეს სისტემა საშუალებას აძლევს მომხმარებლებს ჩაერთონ საუბარში ხელოვნურ ინტელექტთან და დასვან დამატებითი კითხვები უფრო დეტალური პასუხების მისაღებად. International Business Times UK-ის თანახმად, ეს ფუნქცია SearchGPT-ს უნიკალურს ხდის ბაზარზე.

    SearchGPT-ის ერთ-ერთი მთავარი ფუნქციაა ტექსტური და სურათებიანი ძიების მხარდაჭერა, ასევე ამინდის პროგნოზის, კალკულატორების, სპორტული ანგარიშებისა და ფინანსური მონაცემების სხვადასხვა ვიჯეტები. სისტემას შეუძლია ვებგვერდების შეჯამება, ნაჩვენები ინფორმაციის 300 სიმბოლომდე შეზღუდვით, რაც ხელს უწყობს არაავტორიზებული კონტენტის თავიდან აცილებას, იტყობინება THE DECODER.

    OpenAI-მ ისეთ მსხვილ გამომცემლებთან დადო შეთანხმებები, როგორიცაა News Corp და The Atlantic, რაც SearchGPT-ს საშუალებას აძლევს გამოიყენოს მათი კონტენტი მომხმარებლის კითხვებზე პასუხის გასაცემად. ეს უზრუნველყოფს მაღალი ხარისხის და სანდო ინფორმაციას. FavTutor აღნიშნავს, რომ ამ მიდგომამ შეიძლება მნიშვნელოვნად შეცვალოს საძიებო ტექნოლოგიების ლანდშაფტი.

    SearchGPT-ის გაშვება OpenAI-ის უფრო ფართო სტრატეგიის ნაწილია, რომელიც ინტეგრირებული ძიებისა და ხელოვნური ინტელექტის სისტემის შექმნას ისახავს მიზნად. ეს სისტემა არა მხოლოდ ინფორმაციას აწვდის, არამედ მომხმარებლებს მის ყველაზე ეფექტურად პოვნასა და გამოყენებაში ეხმარება. ამან შესაძლოა მომხმარებლებს რეალურ დროში ინფორმაციასთან მუშაობის ახალი ინსტრუმენტი შესთავაზოს და საძიებო ტექნოლოგიების ბაზარი გარდაქმნას.

  • T-Bank-მა წარმოადგინა მოწინავე რუსულენოვანი ენობრივი მოდელი T-lite

    T-Bank-მა წარმოადგინა მოწინავე რუსულენოვანი ენობრივი მოდელი T-lite

    T-Bank-ის ხელოვნური ინტელექტის ცენტრმა წარმოადგინა თავისი უახლესი განვითარება, მასშტაბური ენობრივი მოდელი სახელწოდებით T-lite, რომელიც შექმნილია რუსულ ენაზე ბიზნეს პრობლემების გადასაჭრელად. Hi -Tech Mail.ru-ს ცნობით, მოდელის შესახებ ინფორმაცია T-Bank-ის პირველ მანქანური სწავლების კონფერენციაზე, Turbo ML Conf.-ზე გავრცელდა.

    8 მილიარდი პარამეტრის მქონე T-lite მოდელმა შესანიშნავი შედეგები აჩვენა სამრეწველო და შიდა ტესტებში, რითაც გაუსწრო ისეთ უცხოურ ანალოგებს, როგორიცაა Chat-GPT 3.5 და Llama-3-8B-Instruct. მოდელის აღსანიშნავი მახასიათებელია მისი მაღალი ეფექტურობა: იგი შეიქმნა მსგავსი მოდელებისთვის ტიპიური გამოთვლითი რესურსების მხოლოდ 3%-ის გამოყენებით.

    T-lite არის ძლიერი ინსტრუმენტი LLM აპლიკაციების შესაქმნელად, რომელთა გამოყენება შესაძლებელია მონაცემების მესამე მხარეებთან გაზიარების გარეშე. მოდელი საშუალებას იძლევა შეიქმნას დამხმარე ასისტენტები, ინტელექტუალური საძიებო სისტემები და ინსტრუმენტები დიდი მოცულობის ტექსტის ანალიზისა და შეჯამებისთვის. თავისი ეფექტურობის წყალობით, T-lite გთავაზობთ ხარისხს, რომელიც შედარებადია 20 მილიარდი პარამეტრის მქონე მოდელებთან, ამავდროულად რჩება ეკონომიური.

    T-lite არის T-Bank-ის მიერ სპეციალიზებული პრობლემების გადასაჭრელად შემუშავებული Gen-T ენობრივი მოდელების ოჯახის ნაწილი. ეს მოდელები ადვილად ადაპტირებადია და გვთავაზობს ძალაუფლებისა და ხარისხის ოპტიმალურ ბალანსს. ჩვენივე ენობრივი მოდელების ოჯახის შემუშავება აუცილებელი გახდა, რადგან არსებული გადაწყვეტილებები არ მოიცავს ყველა ამოცანას და არ არის ოპტიმალური კომპანიისთვის.

  • OpenAI-მ ChatGPT-ის უფასო მინი-ვერსია გამოუშვა

    OpenAI-მ ChatGPT-ის უფასო მინი-ვერსია გამოუშვა

    , OpenAI-მ წარმოადგინა თავისი მძლავრი ChatGPT-ის უფრო პატარა და ხელმისაწვდომი ვერსია, სახელწოდებით GPT-4o mini Finam-ის. OpenAI ვარაუდობს, რომ ახალი პროდუქტი „მნიშვნელოვნად გააფართოვებს“ ხელოვნური ინტელექტის აპლიკაციების შემუშავების შესაძლებლობებს.

    ახალი GPT-4o mini მოდელი წინა ვერსიებთან შედარებით უფრო ინტელექტუალურ და ენერგოეფექტურ მოდელად არის წარმოდგენილი. ის GPT-3.5 Turbo-სთან შედარებით 60%-ით იაფია, რაც მას დეველოპერებისთვის უფრო ხელმისაწვდომს ხდის. ახალი მოდელის გამოყენების ღირებულება 1 მილიონ შეყვანის ტოკენზე 15 ცენტია და 1 მილიონ გამომავალ ტოკენზე 60 ცენტი. OpenAI-ის მონაცემებით, ეს 2500 გვერდიანი წიგნის ზომის ეკვივალენტურია.

    GPT-4o mini-ს დაბალი ფასი ხელოვნური ინტელექტით აღჭურვილი აპლიკაციების შექმნის ახალ შესაძლებლობებს ქმნის, რაც, თავის მხრივ, ხელოვნური ინტელექტის ტექნოლოგიების შემდგომ განვითარებასა და გავრცელებას შეუწყობს ხელს.

  • ხორვატიის ინოვაციური პროექტი: საჭის გარეშე რობოტაქსი ვერნე

    ხორვატიის ინოვაციური პროექტი: საჭის გარეშე რობოტაქსი ვერნე

    ხორვატიულმა კომპანია Rimac-მა, რომელიც ცნობილია თავისი ელექტრო ჰიპერმანქანებით, გამოაცხადა ინოვაციური ავტონომიური ტაქსის პროექტის, Verne-ს, დაწყების შესახებ. ოფიციალური პრეზენტაცია 26 ივნისს შედგა, იტყობინება Oxu.az კომპანიის პრესსამსახურზე დაყრდნობით. ახალი სერვისის ამოქმედება ზაგრებში 2026 წელს იგეგმება.

    ინოვაციური დიზაინი და ტექნოლოგია

    სრულიად ახალ პლატფორმაზე აგებული Verne წარმოადგენს კომპაქტურ ჰეჩბეკს უნიკალური მოცურების კარებით. სალონში განთავსებულია 43 დიუმიანი დისპლეი და ორი მგზავრისთვის მაქსიმალურ კომფორტს სთავაზობს, რაც ტაქსის ყველაზე გავრცელებულ გამოყენებას ასახავს. გარდა ამისა, Verne აღჭურვილია 17 დინამიკით და დამზადებულია გამძლე მასალებით.

    რობოტაქსი ვერნი საჭის გარეშე
    რობოტაქსი ვერნი საჭის გარეშე

    Verne-ის ავტონომიური მართვა კონტროლდება სენსორების, რადარებისა და ლიდარის კომბინაციით. აღსანიშნავი მახასიათებელია საქარე მინის საწმენდების არარსებობა, რაც ხაზს უსვამს კომპანიის ინოვაციურ მიდგომას დიზაინისადმი. მგზავრებს შეეძლებათ რობოტ-ტაქსის გამოძახება მობილური აპლიკაციის საშუალებით, მისი რეალურ დროში ადგილმდებარეობის თვალყურის დევნება და ინტერიერის პარამეტრების, როგორიცაა ტემპერატურა და სურნელი, მორგებაც კი.

    რობოტაქსი ვერნი
    რობოტაქსი ვერნი

    Verne თავდაპირველად ზაგრებში გაეშვება, თუმცა კომპანიას უკვე აქვს გეგმები, გააფართოვოს მომსახურება გერმანიაში, დიდ ბრიტანეთსა და ახლო აღმოსავლეთში. Rimac-მა ამ სერვისის შესათავაზებლად 11 ქალაქთან გააფორმა ხელშეკრულებები. პროექტის მიზანია არა მხოლოდ ტრანსპორტირების ალტერნატიული საშუალების უზრუნველყოფა, არამედ ოჯახებისთვის მეორე ან მესამე მანქანის საჭიროების შემცირება, რითაც შემცირდება საგზაო მოძრაობის საცობები და გაუმჯობესდება გარემო.

  • ჩინეთში რობოტ ძაღლებს სასტიკი გამოცდები ჩაუტარდათ

    ჩინეთში რობოტ ძაღლებს სასტიკი გამოცდები ჩაუტარდათ

    ჩინურმა კომპანია Unitree Robotics-მა თავისი Go2 და B2 რობოტ-ძაღლები მკაცრი ტესტების ქვეშ დააყენა, მათ შორის ჯოხით დარტყმა, ფეხების დარტყმა და მიწაზე დაგდება. ეს ექსპერიმენტები მიზნად ისახავს რობოტების წონასწორობის აღდგენის ალგორითმების გაუმჯობესებას ძლიერი ფიზიკური დარტყმების შემდეგ.

    კომპანიის მიერ გამოქვეყნებულ ვიდეოში ჩანს, თუ როგორ ურტყამენ თანამშრომლები რობოტებს ფეხებს, ხის ჯოხებს ურტყამენ და მიწაზე აგდებენ. ვიდეოში ასევე ნაჩვენებია, თუ როგორ ცდიან რობოტები უხეშ რელიეფზე და როგორ შეუძლიათ შეუჩერებლად სამი ზედიზედ სალტოს შესრულება. ვიდეოს აღწერაში ნათქვამია, რომ რობოტების მაღალი დონის ადაპტირება განპირობებულია გაძლიერებული სწავლების კონტროლის ალგორითმით.

    „Unitree Robotics“, რომელიც დააარსა სინქსინგ ვანგვომ, ცნობილია, როგორც ერთ-ერთი პირველი სტარტაპი, რომელმაც საჯაროდ რობოტი ძაღლები გაყიდვაში გაიტანა. WangWo-მ პირველი რობოტი ძაღლი, XDog, 2016 წელს, ასპირანტურაში სწავლის დროს შექმნა, ხოლო 2017 წლის სექტემბერში კომპანიამ ახალი ოთხფეხა ძაღლი, LaikaGo, წარადგინა, რომელსაც კოსმოსური ძაღლის, ლაიკას, სახელი დაერქვა.

    ცოტა ხნის წინ, ჩინეთის ცენტრალურმა ტელევიზიამ გაავრცელა ინფორმაცია ჩინეთის სახალხო-განმათავისუფლებელი არმიის (ჩინეთის სახალხო-განმათავისუფლებელი არმია) და კამბოჯის არმიის ერთობლივი სამხედრო წვრთნების, „ოქროს დრაკონი 2024“, შესახებ, რომლებშიც Unitree Robotics-ის Go2 ტიპის რობოტული ძაღლები გამოიყენეს. წვრთნები საბრძოლო სიტუაციებში რობოტული ძაღლების გამოყენების პრაქტიკულ ასპექტებს ეხებოდა და ამ ტექნოლოგიების პოტენციურ სამხედრო გამოყენებას აჩვენებდა.

  • Google-ი ცნობილი ადამიანებისა და ინფლუენსერების საფუძველზე ხელოვნური ინტელექტის მქონე ჩატბოტებს ქმნის

    Google-ი ცნობილი ადამიანებისა და ინფლუენსერების საფუძველზე ხელოვნური ინტელექტის მქონე ჩატბოტებს ქმნის

    Google მუშაობს ხელოვნური ინტელექტის მქონე ჩატბოტების შექმნაზე, რომლებიც ცნობილ ადამიანებსა და YouTube-ის ინფლუენსერებს ბაძავენ, რაც კომპანიის ხელოვნური ინტელექტის საერთო სტრატეგიას შეესაბამება.

    მიუხედავად იმისა, რომ იდეა ახალი არ არის — სტარტაპებმა, როგორიცაა Character.ai და სხვა მსხვილი კომპანიები, უკვე გამოუშვეს მსგავსი პროდუქტები — Google ცდილობს გააუმჯობესოს ტექნოლოგია. კომპანიის თქმით, კაცობრიობას „განსაკუთრებით აკლია ხელოვნური ინტელექტის მქონე ჩატბოტები, რომლებიც უკვე ცნობილ ადამიანებს ბაძავენ“.

    Google-ის ჩატბოტები Gemini-ის მასშტაბური ენობრივი მოდელებით იმუშავებენ. კომპანია პარტნიორობის დამყარების მიზნით მოლაპარაკებებს აწარმოებს გავლენიან ადამიანებთან და ცნობილ ადამიანებთან. გარდა ამისა, მუშავდება ფუნქცია, რომელიც მომხმარებლებს საშუალებას აძლევს შექმნან საკუთარი ჩატბოტები საკუთარი პიროვნებისა და გარეგნობის აღწერით. The Information-ის ცნობით, პროექტს ხელმძღვანელობს რაიან გერმიხი, Google-ის დიდი ხნის აღმასრულებელი დირექტორი, რომელიც პასუხისმგებელია Google Doodles-ზე, ათკაციან გუნდთან ერთად.

    ამჟამად უცნობია, კონკრეტულად რომელ ცნობილ ადამიანებთან ან გავლენიან პირებთან ითანამშრომლებს Google. შედარებისთვის, უკვე არსებობს ისეთი მნიშვნელოვანი ჩატბოტები, რომლებიც ისეთ ცნობილ ადამიანებზეა დაფუძნებული, როგორებიც არიან ჩარლი დ’ამელიო, მისტერ ბისტი, სნუპ დოგი, ტომ ბრედი და პერის ჰილტონი. შესაძლებელია, რომ Google-ის ჩატბოტები ექსპერიმენტული იყოს და მხოლოდ Google Labs-ზე გამოჩნდეს, კომპანიის ექსპერიმენტული პროდუქტების ვებსაიტზე.

    ამ პროექტის მიზანი გაურკვეველი რჩება, რადგან სხვა ცნობილ ადამიანებზე დაფუძნებულმა ჩატბოტებმა ფართო პოპულარობა ვერ მოიპოვეს. მაგალითად, სნუპ დოგზე დაფუძნებულ ჩატბოტს ინსტაგრამზე მხოლოდ 15,000 გამომწერი ჰყავს, მაშინ როცა ნამდვილი რეპერის ექაუნთს 87.5 მილიონი გამომწერი ჰყავს.

  • იაპონიაში შემუშავებულია ხმოვან ხელოვნური ინტელექტის ფილტრი, რომელიც ქოლ-ცენტრებში აგრესიის შემცირებას ისახავს მიზნად

    იაპონიაში შემუშავებულია ხმოვან ხელოვნური ინტელექტის ფილტრი, რომელიც ქოლ-ცენტრებში აგრესიის შემცირებას ისახავს მიზნად

    იაპონურმა კომპანია SoftBank-მა წარმოადგინა ხმოვანი ფილტრი, რომელიც ხელოვნური ინტელექტის გამოყენებით აგრესიულ ინტონაციას მშვიდ მეტყველებად გარდაქმნის. ტექნოლოგია შექმნილია ქოლ-ცენტრის თანამშრომლებისთვის სტრესის შესამცირებლად, რომლებიც ხშირად აწყდებიან აგრესიულ სატელეფონო საუბრებს.

    როგორც Oddity Central იტყობინება, „ემოციების ჩახშობის სისტემა ჩვენ შევიმუშავეთ მომხმარებელთა აგრესიის სოციალური პრობლემის საპასუხოდ ქოლ-ცენტრის თანამშრომლების მიმართ, ასევე მათი დასაცავად“, - ამბობს ფილტრის ერთ-ერთი შემქმნელი, SoftBank-ის წარმომადგენელი ტოშიუკი ნაკატანი.

    როგორ მუშაობს AI ფილტრი

    ხელოვნური ინტელექტის ფილტრი ორ ეტაპად მუშაობს. პირველ რიგში, ის ამოიცნობს გაბრაზებულ ხმას და ამოიცნობს ძირითად პუნქტებს. შემდეგ, პროგრამა აკუსტიკურ ინსტრუმენტებს იყენებს ყვირილის ნორმალურ მეტყველებად გარდასაქმნელად, რაც მას თავაზიან ტონს ანიჭებს. მნიშვნელოვანია, რომ ფილტრი არ ამახინჯებს საუბრის შინაარსს - „მეორე მხარის არც ერთი სიტყვა არ იცვლება“. ქოლ-ცენტრის აგენტები მაინც გაიგებენ ყველა სიტყვას, მაგრამ უფრო რბილი ტონით.

    განვითარების ფონი

    ქოლ-ცენტრის მომხმარებელთა აგრესიის პრობლემა და მისი გავლენა თანამშრომლებზე დიდი ხანია განიხილება. ზოგიერთი კომპანია სტრესის მართვის პროგრამებს ახორციელებს, მათ შორის რელაქსაციის ტექნიკას, მედიტაციას, იოგას და თერაპიას. თუმცა, SoftBank-მა გადაწყვიტა, ამ პრობლემის გადასაჭრელად უახლესი ტექნოლოგიები გამოეყენებინა. ხელოვნური ინტელექტის ფილტრის შემუშავებას სამი წელი დასჭირდა, რომლის დროსაც მათ გამოიყენეს 10 000-ზე მეტი აუდიო ნიმუში, რომლებიც 10 მსახიობის მიერ იყო ჩაწერილი. მათ ჩაწერეს მინიმუმ 100 გავრცელებული ფრაზა, მათ შორის ყვირილი, ბრალდებები, მუქარა და ბოდიშის მოხდის მოთხოვნა.

    გავლენა და მომავალი განხორციელება

    SoftBank-ის ახალ ტექნოლოგიას შეუძლია მნიშვნელოვნად გააუმჯობესოს სამუშაო გარემო ქოლ-ცენტრის თანამშრომლებისთვის, შეამციროს სტრესი და გადაღლა. თუმცა, დანერგვის თარიღი ჯერ არ გამოცხადებულა. კომპანიები, რომლებიც ცდილობენ თავიანთი თანამშრომლების სამუშაო პირობების გაუმჯობესებას, ინტერესით აკვირდებიან ამ ტექნოლოგიის განვითარებას.

    SoftBank-ის განვითარება წარმოადგენს მნიშვნელოვან წინგადადგმულ ნაბიჯს სოციალური პრობლემების გადასაჭრელად ხელოვნური ინტელექტის გამოყენების კუთხით. აგრესიული ინტონაციების მშვიდ ინტონაციებად გარდაქმნა ხელოვნური ინტელექტის ფილტრის გამოყენებით არა მხოლოდ ინოვაციური მიდგომაა, არამედ მნიშვნელოვანი წვლილი შეაქვს ქოლ-ცენტრის თანამშრომლების ფსიქო-ემოციური კეთილდღეობის გაუმჯობესებაში.

  • დემო ვერსია ყოველთვის კარგად გამოიყურება. სტივ ვოზნიაკმა Apple Intelligence-ზე სკეპტიკურად ისაუბრა

    დემო ვერსია ყოველთვის კარგად გამოიყურება. სტივ ვოზნიაკმა Apple Intelligence-ზე სკეპტიკურად ისაუბრა

    Apple-ის თანადამფუძნებელმა სტივ ვოზნიაკმა Bloomberg-თან ინტერვიუში Apple Intelligence-ის შესახებ ისაუბრა.

    მან თქვა, რომ WWDC-ზე წარმოდგენილი ფუნქციებით შთაბეჭდილება მოახდინა მასზე, თუმცა მათი რეალური სარგებელი მხოლოდ მაშინ გახდება ნათელი, როდესაც ისინი რეგულარული მომხმარებლებისთვის ხელმისაწვდომი გახდება.

    „პრობლემა ის არის, რომ დემო ვერსია ყოველთვის კარგად გამოიყურება, მაგრამ მე მჯერა, რომ თქვენ თვითონ უნდა სცადოთ, ნახოთ, როგორ მუშაობს და მხოლოდ ამის შემდეგ გამოთქვათ თქვენი აზრი.“ - სტივ ვოზნიაკი.

    ვოზნიაკი ასევე იმედოვნებს, რომ Apple-მა გააუმჯობესა Siri. მას სიამოვნებს ხმოვანი ასისტენტის გამოყენება, თუმცა ზოგჯერ ის მის მოთხოვნებს ვერ ხვდება.

    „თუ ისეთ რამეს იკითხავთ, რაც ნებისმიერ ადამიანს შეუძლია გაიგოს, მაგრამ ცოტა რთულია, ერთი დამატებითი სიტყვა, სირის ხანდახან უჭირს.“ - სტივ ვოზნიაკი.

    ვოზნიაკი იმედოვნებს, რომ Apple Intelligence საბოლოოდ გაუადვილებს მომხმარებლებს ცხოვრებას და ჩაანაცვლებს მესამე მხარის ზოგიერთ აპლიკაციას.

    წაიკითხეთ წყარო

  • სტაბილური Diffusion 3-ის გამოშვება ჩაიშალა: ნეირონული ქსელი ადამიანების ნაცვლად მონსტრებს იზიდავს

    სტაბილური Diffusion 3-ის გამოშვება ჩაიშალა: ნეირონული ქსელი ადამიანების ნაცვლად მონსტრებს იზიდავს

    ახალი სურათების გენერირების მოდელი ვერ ამუშავებს ადამიანის სურათებს.

    ოთხშაბათს, Stability AI-მ წარმოადგინა თავისი გამოსახულების სინთეზის მოდელის ახალი ვერსია, Stable Diffusion 3 Medium. ეს მოდელი ტექსტურ მოთხოვნებს სურათებად გარდაქმნის, თუმცა მისმა გამოშვებამ კრიტიკა გამოიწვია ადამიანის გამოსახულების დაბალი ხარისხის გამო, განსაკუთრებით Midjourney-სა და DALL-E 3-თან შედარებით. აღმოჩნდა, რომ SD3 Medium ხშირად წარმოქმნიდა ანატომიურად არასწორ სურათებს, რაც დაცინვას იწვევდა.

    სტაბილური დიფუზია 3
    სტაბილური დიფუზია 3

    Reddit-ზე გამოჩნდა თემა სახელწოდებით „ეს ნომერი ხუმრობაა? [SD3-2B]“, სადაც მომხმარებლები SD3 Medium-ის მიერ ადამიანების, განსაკუთრებით კი ხელებისა და ფეხების სურათების რენდერირებისას არსებული ხარვეზების მაგალითებს აზიარებენ.

    კიდევ ერთი თემა განიხილავს ბალახზე მწოლიარე გოგონების სურათების გენერირების პრობლემებს.

    ტრადიციულად, სურათების გენერატორებისთვის ხელების გენერირება რთული ამოცანა იყო სასწავლო მონაცემთა ნაკრებებში მაგალითების ნაკლებობის გამო. თანამედროვე მოდელებმა ისწავლეს ამ ამოცანის შესრულება, მაგრამ Stable Diffusion 3 Medium ერთი ნაბიჯით უკან იხევს.

    მომხმარებლები თვლიან, რომ SD3 Medium-ის გაუმართაობის მიზეზი ვარჯიშის მონაცემებიდან ზრდასრულთათვის განკუთვნილი კონტენტის ფილტრაციაა. „მოდელის მკაცრი ცენზურა ასევე შლის ანატომიურ მონაცემებს, რაც მოხდა“, - აღნიშნა ერთ-ერთმა მომხმარებელმა.

    მსგავსი პრობლემები წარმოიშვა 2022 წელს Stable Diffusion 2.0-ის გამოშვებისას. იმ დროს, ზრდასრულთათვის განკუთვნილი კონტენტის ფილტრაცია აფერხებდა მოდელის უნარს, გენერირებულიყო ადამიანის ანატომიის ზუსტი დონე. Stability AI-მ ეს პრობლემა გამოასწორა SD 2.1-სა და SD XL-ში, ნაწილობრივ აღადგინა დაკარგული შესაძლებლობები.

    ზოგიერთი მომხმარებელი მიიჩნევს, რომ ტრენინგის მონაცემების გასასუფთავებლად გამოყენებული NSFW ფილტრი ძალიან მკაცრი იყო. შესაძლოა, ამან გამოიწვია ის, რომ მონაცემთა ნაკრებიდან ამოიღეს ისეთი სურათები, რომლებიც არ შეიცავდა სექსუალურ შინაარსს, მაგრამ მნიშვნელოვანია მოდელის ტრენინგისთვის, რათა ზუსტად ასახოს ადამიანები სხვადასხვა სიტუაციაში. Reddit-ის ერთ-ერთმა მომხმარებელმა დაწერა: „[SD3] კარგად მუშაობს, თუ კადრში ადამიანები არ არიან. როგორც ჩანს, მათმა გაუმჯობესებულმა NSFW ფილტრმა გადაწყვიტა, რომ ყველაფერი, რაც ჰუმანოიდია, NSFW იყო“.

    წაიკითხეთ წყარო