Ключови изводи
- DALL·E е нова невронна мрежа, която може да рисува изображения въз основа на текст.
- Мрежата е един от нарастващия брой AI проекти, които могат да имитират творческите резултати на хората.
- Експертите казват, че изображенията, начертани от AI, не са оригинални творения.
Премести се, Пикасо. Нова невронна мрежа може да рисува изображения въз основа на текст.
DALL·E, портманто от имената на художника Салвадор Дали и WALL·E на Pixar, може да вземе всеки текст и да създаде изображение от него. Системата използва невронна мрежа, която е обучена върху милиарди картини и текстови примери. Това е един от нарастващия брой AI проекти, които могат да имитират, но не и да възпроизвеждат творческите резултати на човешките същества.
"Тъй като естественият език непрекъснато се развива и е много зависим от нюансите на контекста, обучението на машина да разбира езика достатъчно добре, за да нарисува картина, е много значително постижение", Тамара Шварц, професор по киберсигурност в York College of Pennsylvania, каза в интервю по имейл. „Представете си полицейски художник на скици, това е рядък талант, който има способността да създава картина въз основа на описание на свидетел.“
Използване на големи данни за създаване на изображения
DALL-E е създаден от изследователската компания за изкуствен интелект OpenAI и работи чрез натрупване на огромно количество данни от интернет. След това данните се обработват от модел на естествен език и се обучават да създават изображения от текст. DALL-E работи подобно на наскоро пуснатия GPT-3, езиков модел, създаден от OpenAI, който може да бъде подканен да генерира оригинални текстови пасажи. GPT-3 е обучен да използва половин трилион думи интернет текст и може да произведе изненадващо реалистичен текст.
Да научиш машина да разбира езика достатъчно добре, за да нарисува картина, е много значително постижение.
Майкъл Юрушкин, основател и главен технически директор на BroutonLab, компания за наука за данни, каза в интервю по имейл, че DALL-E е „един от малкото успешни опити на човечеството да подражава на нашата креативност и въображение“. Той добави: „По-лесно е да се разбере как AI прогнозира нещо, като премине през съответните данни, но разбирането как е в състояние да генерира чертежи от неща, за които никога преди не е „чувал“, е по-трудно.“
Шварц внимателно отбелязва, че AI не създава информация, а по-скоро взема езикови данни и ги трансформира в изображения.
"Първоначалната креативност идва от човека, който е конструирал задачата", каза Шварц. „Има известна „креативност“от страна на AI, защото той експериментира с различни комбинации от данни и след това избира от редица потенциални резултати. Човек обаче проучва резултатите и учи AI как да избира от многото комбинации."
Робот детективска работа?
Една машина може да експериментира с тази комбинация от данни и обекти много по-бързо от човек-художник. Шварц отбеляза, че DALL-E може един ден да си партнира с детектив, който се опитва да реконструира местопрестъпление чрез скица, базирана на свидетелски показания.
"Докато свидетелите дават показанията си, компютърът може да вземе тази устна информация на естествен език и да създаде чертеж на сцената или много рисунки на сцената", каза тя. „Тези визуализации могат след това да бъдат интегрирани, за да се създаде по-прецизен образ на изгубени доказателства. Тази визуализация може да бъде обогатена чрез интегриране на предишни изображения на местоположението преди престъплението.“
Няколко други управлявани от AI програми могат да създават изкуство. Например, Ai-Da използва система за роботизирана ръка и технология за лицево разпознаване, съчетана с изкуствен интелект, за да създава изкуство. Системата може да анализира изображение, поставено пред машината, което се подава в алгоритъм за генериране на движенията на ръцете на робота.
Въпреки това хората на изкуството не трябва да се притесняват, че роботизирани господари ще ги заменят, твърди Ахмед Елгамал, директор на лабораторията за изкуство и изкуствен интелект в университета Рутгерс, в The New York Times миналата година.
„Докато дефиницията на изкуството непрекъснато се развива, в основата си то е форма на комуникация между хората“, пише той. „Без човек-художник зад машината, AI може да направи малко повече от игра с формата, независимо дали това означава манипулиране на пиксели на екрана или бележки в музикална книга. Тези дейности могат да бъдат ангажиращи и възприемащо интригуващи, но им липсва смисъл без взаимодействие между артист и публика."
След като разгледах работата на DALL-E, разбирам мисълта на Elgammal, че създадените от AI изображения не са изкуство. От друга страна, те са по-добри от всяко изкуство, което бих могъл да създам. И така, наистина, каква е разликата?