Тұрақты диффузия

Stable Diffusion 3 шығарылымы сәтсіз аяқталды: нейрондық желі адамдарды емес, құбыжықтарды тартады

Жаңа кескін генерациялау моделі адам кескіндерін өңдей алмайды.

Сәрсенбі күні Stability AI компаниясы өзінің кескін синтезі моделінің жаңа нұсқасын, Stable Diffusion 3 Medium-ды таныстырды. Бұл модель мәтіндік сұраныстарды кескіндерге түрлендіреді, бірақ оның шығарылуы, әсіресе Midjourney және DALL-E 3-пен салыстырғанда, адам кескіндерінің сапасының төмендігі үшін сынға ұшырады. SD3 Medium анатомиялық тұрғыдан дұрыс емес кескіндерді жиі шығаратыны анықталды, бұл мазаққа айналды.

Тұрақты диффузия 3

Reddit-те «Бұл мәселе әзіл ме? [SD3-2B]» атты тақырып пайда болды, онда пайдаланушылар SD3 Medium-ның адамдардың, әсіресе қолдар мен аяқтардың суреттерін көрсетудегі сәтсіздіктерінің мысалдарымен бөлісті.

Тағы бір тақырыпта шөпте жатқан қыздардың суреттерін жасаудағы мәселелер талқыланады.

Қолдарды жасау дәстүрлі түрде кескін генераторлары үшін қиын міндет болып келді, себебі оқыту деректер жиынында мысалдардың болмауына байланысты. Қазіргі заманғы модельдер бұл тапсырманы шешуді үйренді, бірақ Stable Diffusion 3 Medium бір қадам артқа шегінеді.

Пайдаланушылар SD3 Medium-ның сәтсіздіктерінің себебі оқу деректерінен ересектерге арналған мазмұнды сүзу деп санайды. «Модельдің қатты цензурасы анатомиялық деректерді де жояды, солай болды», - деп атап өтті бір пайдаланушы.

Осыған ұқсас мәселелер 2022 жылы Stable Diffusion 2.0 шығарылымымен туындады. Сол кезде ересектерге арналған мазмұнды сүзу модельдің дәл адам анатомиясын жасау мүмкіндігін төмендетті. Stability AI мұны SD 2.1 және SD XL нұсқаларында түзетіп, жоғалған мүмкіндіктерді ішінара қалпына келтірді.

Кейбір пайдаланушылар жаттығу деректерін тазарту үшін қолданылған NSFW сүзгісі тым қатаң деп санайды. Бұл жыныстық мазмұнды қамтымайтын, бірақ модельді әртүрлі жағдайларда адамдарды дәл бейнелеуге үйрету үшін маңызды суреттердің деректер жиынтығынан алынып тасталуына әкелуі мүмкін. Бір Reddit пайдаланушысы: «[SD3] кадрда адамдар болмаған жағдайда жақсы жұмыс істейді. Олардың жақсартылған NSFW сүзгісі кез келген гуманоидты NSFW деп шешкен сияқты», - деп жазды.

Дереккөзді оқыңыз

15.06.2024
Бір әуесқой сипаттамалар мен жиналған деректерге сүйене отырып, суретке түсіретін камера ойлап тапты

Инженер және әуесқой Бьорн Карманн мәтіндік сипаттамаға және орналасқан жер, ауа райы, күн мен уақыт туралы деректер жиынтығына негізделген фотосуреттер жасайтын Paragraphica деп аталатын құрылғы жасады.

Орналасқан жері, күні, уақыты және ауа райы туралы ақпаратқа негізделген мәтіндік сұрау

Құрылғының артқы жағында 15 дюймдік сенсорлық экраны бар сандық камера корпусы бар. Дегенмен, бұл камерада объектив пен сенсор жоқ. Оның орнына ол жұлдызды мұрынды көр меңнің тұмсығындағы өсінділерге ұқсайтын арнайы антеннамен жабдықталған.

Орналасқан жері қандай көрінеді?

Барлық фотосуреттер пайдаланушының нақты айналасындағы мәтіндік сипаттама негізінде жасалады. Гаджет сонымен қатар ашық дереккөздерден түсірілім уақыты, ауа райы, геолокация және тіпті күн туралы деректерді жинайды.

Жасалған кескін

Raspberry Pi 4 бір тақталы компьютері камераны қуаттандырады, ал соңғы кескін Stable Diffusion генеративті нейрондық желісі арқылы жасалады. Камераның жоғарғы панелінде орналасқан жер деректерін және соңғы кескінге жауапты нейрондық желі параметрлерін іздейтін аймақтың радиусын реттеу үшін үш айналмалы тұтқа орналасқан.

Дереккөзді оқыңыз

01.06.2023

Тұрақты диффузия

Stable Diffusion 3 шығарылымы сәтсіз аяқталды: нейрондық желі адамдарды емес, құбыжықтарды тартады

Бір әуесқой сипаттамалар мен жиналған деректерге сүйене отырып, суретке түсіретін камера ойлап тапты