Жаңа кескін генерациялау моделі адам кескіндерін өңдей алмайды.
Сәрсенбі күні Stability AI компаниясы өзінің кескін синтезі моделінің жаңа нұсқасын, Stable Diffusion 3 Medium-ды таныстырды. Бұл модель мәтіндік сұраныстарды кескіндерге түрлендіреді, бірақ оның шығарылуы, әсіресе Midjourney және DALL-E 3-пен салыстырғанда, адам кескіндерінің сапасының төмендігі үшін сынға ұшырады. SD3 Medium анатомиялық тұрғыдан дұрыс емес кескіндерді жиі шығаратыны анықталды, бұл мазаққа айналды.

Reddit-те «Бұл мәселе әзіл ме? [SD3-2B]» атты тақырып пайда болды, онда пайдаланушылар SD3 Medium-ның адамдардың, әсіресе қолдар мен аяқтардың суреттерін көрсетудегі сәтсіздіктерінің мысалдарымен бөлісті.

Тағы бір тақырыпта шөпте жатқан қыздардың суреттерін жасаудағы мәселелер талқыланады.

Қолдарды жасау дәстүрлі түрде кескін генераторлары үшін қиын міндет болып келді, себебі оқыту деректер жиынында мысалдардың болмауына байланысты. Қазіргі заманғы модельдер бұл тапсырманы шешуді үйренді, бірақ Stable Diffusion 3 Medium бір қадам артқа шегінеді.
Пайдаланушылар SD3 Medium-ның сәтсіздіктерінің себебі оқу деректерінен ересектерге арналған мазмұнды сүзу деп санайды. «Модельдің қатты цензурасы анатомиялық деректерді де жояды, солай болды», - деп атап өтті бір пайдаланушы.

Осыған ұқсас мәселелер 2022 жылы Stable Diffusion 2.0 шығарылымымен туындады. Сол кезде ересектерге арналған мазмұнды сүзу модельдің дәл адам анатомиясын жасау мүмкіндігін төмендетті. Stability AI мұны SD 2.1 және SD XL нұсқаларында түзетіп, жоғалған мүмкіндіктерді ішінара қалпына келтірді.

Кейбір пайдаланушылар жаттығу деректерін тазарту үшін қолданылған NSFW сүзгісі тым қатаң деп санайды. Бұл жыныстық мазмұнды қамтымайтын, бірақ модельді әртүрлі жағдайларда адамдарды дәл бейнелеуге үйрету үшін маңызды суреттердің деректер жиынтығынан алынып тасталуына әкелуі мүмкін. Бір Reddit пайдаланушысы: «[SD3] кадрда адамдар болмаған жағдайда жақсы жұмыс істейді. Олардың жақсартылған NSFW сүзгісі кез келген гуманоидты NSFW деп шешкен сияқты», - деп жазды.




