Хакерите са адски решени да подобрят AI

Съдържание:

Хакерите са адски решени да подобрят AI
Хакерите са адски решени да подобрят AI
Anonim

Ключови изводи

  • Нов колектив от разработчици изгражда AI модели с отворен код.
  • Групата използва масивни модели за езиково обучение, които ще пусне под отворени лицензи.
  • ИИ с отворен код може да помогне потенциално променящата играта сила на новата технология да стане по-малко податлива на пристрастия и грешки.
Image
Image

Има много изследвания на изкуствения интелект от големи компании (AI), но една онлайн група иска да демократизира процеса.

EleutherAI е наскоро сформиран колектив от изследователи-доброволци, инженери и разработчици, фокусирани върху изследвания на AI с отворен код. Организацията използва кодовите бази GPT-Neo и GPT-NeoX, за да обучава масивни езикови модели, които планира да пусне под отворени лицензи.

"Данните с отворен код са от полза за изследователите, защото учените разполагат с повече безплатни ресурси, които да използват за обучение на модели и завършване на изследвания", каза Едуард Куи, главен изпълнителен директор на компанията за изкуствен интелект Graviti, в интервю за Lifewire по имейл. Компанията му не участва в EueutherAI. „Знаем, че десетки AI проекти бяха задържани поради общата липса на висококачествени данни от реални случаи на употреба, така че е жизненоважно да се установят насоки, които гарантират качеството на данните, с помощта на участващата общност.“

Това е пътят

Началото на EleutherAI беше скромно. Миналата година независим изследовател на изкуствен интелект на име Конър Лийхи публикува следното съобщение на сървър на Discord: „Хей, момчета, нека [SIC] даде на OpenAI да се бори за парите си като в добрите стари дни.“

И така, групата беше сформирана. Вече има стотици сътрудници, които публикуват своя код в онлайн хранилището на софтуер GitHub.

Усилията за AI с отворен код не са нещо ново. Всъщност платформата за управление на работния процес Airflow на Airbnb и механизмът за откриване на данни на Lyft са резултатите от използването на инструменти с отворен код, за да се даде възможност на екипите за данни да работят по-добре с данни, посочи Али Рехман, ръководител на проекти за софтуерната компания CloudiTwins в имейл интервю с Lifewire.

„Точно както революцията на отворения код доведе до трансформация на разработката на софтуер, така също тя движи развитието и демократизирането на науката за данни и изкуствения интелект“, каза Рехман. „Отвореният код се превърна в критичен фактор за решенията за наука за корпоративни данни, като повечето специалисти по данни използват инструменти с отворен код.“

Отваряне на вратата

Разработването на AI с отворен код може да помогне потенциално променящата играта сила на новата технология да стане по-малко податлива на пристрастия и грешки, твърдят някои наблюдатели.

Изследванията на AI сега се провеждат предимно на открито, като почти всички компании, изследователски лаборатории и университети представят резултатите си незабавно в научни публикации, каза Куш Варшни, изследовател на AI в IBM, пред Lifewire в интервю по имейл.

„Тази отворена общност е от съществено значение, тъй като осигурява подобрени нива на проверки и баланси, за да гарантира, че AI се изследва, създава, внедрява и прилага отговорно“, добави Варшни. „Това е особено критично в ситуации, в които тези системи могат да повлияят на живота на нашите най-уязвими членове на обществото. Тази отвореност се отнася не само за общо машинно обучение и алгоритми за задълбочено обучение, но и за елементи на надежден AI.“

Rehman каза, че една от критичните разлики между частния софтуер и софтуера с отворен код е гъвкавостта и персонализирането. Патентованото изследване на AI ще има проблеми със сигурността, актуализациите и оптимизациите.

Image
Image

„Това е така, защото базираният на общността подход с отворен код получава ценен принос от хиляди експерти в индустрията, които идентифицират потенциални уязвимости в сигурността, които след това се коригират по-бързо“, добави Реман.„Консенсусът на общността означава, че качеството е гарантирано и новите възможности се откриват по-лесно.“

Друг проблем е, че патентованите AI изследвания няма да бъдат оперативно съвместими, което означава, че не могат да работят с различни формати на данни и вероятно ще имат блокиране на доставчика, което не позволява на компаниите да тестват и изпробват софтуера, преди да се ангажират с решение, Рехман каза.

Но не всеки аспект от изследването на AI трябва да бъде с отворен код, каза Крис Кент, главен изпълнителен директор на компанията за медицински AI Reveal Surgical, в интервю за Lifewire по имейл. „Важно е да защитим икономическите стимули, които движат комерсиалното развитие на ключови приложения на AI“, каза той.

Въпреки това, изследванията на AI се нуждаят от стабилен компонент с отворен код, каза Кент. Той добави, че отвореният код работи за изграждане на доверие и използване на масиви от данни, които не са или не трябва да се контролират от отделни институции или компании.

„Подходът с отворен код е най-добрият начин за идентифициране и компенсиране на основните пристрастия, които може да съществуват в комплектите за обучение, и ще доведе до по-холистични, креативни и надеждни приложения на AI,“каза Кент. йени

Препоръчано: