НЕЙРОМЕРЕЖІ. СУЧАСНЕ І ОЧІКУВАНЕ МАЙБУТНЄ

mazhugaanastasia
4 авг. 2023 г.
8 мин. чтения

(2 частина)

ЧОМУ НЕЙРОМЕРЕЖА НЕ КАЛЬКУЛЯТОР

Калькулятори, як правило, призначені для виконання швидких математичних обчислень, таких як арифметичні операції, розрахунки процентів, квадратних коренів тощо. Вони дуже ефективні в обробці числових даних та розрахунках, і можуть забезпечити точні та швидкі результати.

Нейромережі і калькулятори - це два різних інструменти, які використовуються для різних завдань. Основна відмінність полягає в їх функціональності та спроможностях.

Нейромережі, з іншого боку, використовуються для розв'язання складних задач, які не завжди можна вирішити за допомогою простих математичних формул або правил. Вони здатні до навчання на основі великих обсягів даних та розпізнавання складних залежностей у цих даних. Нейромережі можуть застосовуватись у багатьох областях, таких як комп'ютерний зір, обробка природної мови, прогнозування, розпізнавання шаблонів, голосовий інтерфейс, рекомендації, автономні транспортні засоби тощо.

Для прикладу, ми можемо навчити нейромережу додавати 1 до певного числа. Для цього ми їй ставимо навчальні завдання:

1+1 =2

2+1 =3

3+1 =4

4+1 =5 і так далі.

Шестирічна дитина, яка вміє рахувати до 10 одразу зловить закономірність і сама почне передбачати відповідь: 7 +1 = 8, хоча додавати ще не вміє. Процес навчання і полягає в тому, щоб зрозуміти цю залежність.

Після навчання нейромережа також сформує такі зв'язки, які будуть давати правильний результат, видаючи наступне число після заданого.

І перевага нейромережі, що вона може знаходити недоступні для людини закономірності. Нейромережі можуть розпізнавати складні закономірності, виявляти скриті зв'язки та зробити передбачення на основі великого обсягу даних. Вони здатні до аналізу неструктурованих даних, таких як зображення, текст, звук, що робить їх корисними у багатьох сферах, де потрібна обробка складних і нелінійних даних.

Таким чином, калькулятори і нейромережі мають різні застосування і використовуються для різних завдань.

Узагальнимо відповідь на питання чим нейромережі відрізняється від калькулятора? Калькулятор рахує відповідь, а нейромережа видає найбільш очікувану відповідь відповідно до своєї бази знань.

АРХІТЕКТУРА НЕЙРОМЕРЕЖ

Архітектуру нейромережі можна розділити на два напрямки: архітектура математичної моделі нейромережі та архітектура програмного забезпечення, яке реалізує функції нейромережі.

Для початку наведемо архітектури математичних моделей, які найбільше використовуються:

Нейромережі прямого звязку (Feedforward). Сигнали передаються в одному напрямку від одного шару до іншого. Це найпростіша структура призначені для класифікації чи прогнозування.

Нейромережі зі зворотнім зв'язком (Recurrent): В цій структурі нейрони можуть мати зв'язки не тільки вперед, але й назад, створюючи цикли в мережі. Використовується, наприклад, у машинному перекладі, де контекст та попередній контекст важливі для правильного перекладу.

Згорткові (Convolutional) нейромережі: дозволяє локальну обробку даних та розпізнавання властивостей в зображеннях. Згорткові нейромережі ефективні в розпізнаванні об'єктів та виявленні патернів в зображеннях.

Окрім вказаних, існують Рекурентні нейромережі з довготривалою пам'яттю (Long Short-Term Memory, LSTM), гортково-рекурентні нейромережі (Convolutional Recurrent Neural Networks), Генеративно-протилежні нейромережі (Generative Adversarial Networks) та інші.

Архітектури неромереж розвиваються та модифікуються із метою підвищення ефективності навчання, зменшення помилок в роботі, виконання складних комплексних завдань.

Для прикладу ChatGTP - це модель глибокої нейромережі, яка базується на архітектурі GPT (Generative Pre-trained Transformer). GPT використовує трансформерну архітектуру та багатошарові рекурентні нейромережі (RNN) для генерації тексту та відповідей на запитання.

ВПРОВАДЖЕННЯ

З точки зору прикладного програмного забезпечення, при реалізації функцій нейромережі, визначаємо три абстрактних рівня нейромережі.

Базовий рівень - це основана частина нейромережі, яка формується в процесі основного глибокого навчання.
Рівень адаптації - адаптація під певне підприємство, користувача, законодавство. Цей рівень містить унікальний контекст кожної практичної реалізації нейромережі.
Контекстний рівень - контекст конкретного користувача чи підприємства. Результат навчання мережі при взаємодії конкретних суб'єктів з нейромережею.

Наприклад, нейромережа по розпізнаванню рукописного тексту буде мати на першому рівні базові функції по розпізнаванню рукописного тексту, навчений розпізнавати кирилицю. На другому рівні - це буде адаптація під завдання підприємства чи організації, яка використовує специфічні символи, форму, комбінації знаків не характерним іншим прикладом застосування нейромережі. На третьому рівні це може бути частина нейромережі, яка враховує унікальні характеристики в процесі виконання кожної конкретної задачі. Це може контекстні особливості взаємодії з певним користувачем чи контекст завдання, яке сьогодні користувач задає нейромережі.

Іншим прикладом можна розглянути ПЗ із функціями персонального асистенту для смартфонів. Базовий рівень - це програмний продукт, який вміє взаємодіяти з користувачем, розуміти мову, запам'ятовувати завдання, робити помітки, події в календарі, писати листи. Рівень адаптації - це адаптація програми під смартфони Apple, Google чи Tesla. Контекстний рівень - результат вивчення звичок користувача та розуміння нейромережею контексту спілкування з конкретним користувачем (чоловік чи жінка, який вік, які інтереси, яка історія попереднього спілкування).

Те саме стосується (чи буде стосуватись) нейромереж, які в найближчому часі будуть адаптовані та впроваджені у кожен автомат про продажі сендвічів в бізнес-центрах.

КОМПЕТЕНЦІЇ ІНТЕГРАТОРА

Визначається 3 рівня компетенції у галузі впровадження нейромереж.

1-ий рівень: Робоча нейромережа.

Це компетенції описати математичну модель нейромережі під певну задачу та створити комп'ютерну програму, яка здатна реалізувати таку модель.

Можна сказати, що нейромережі уже існують, тому який сенс ї писати з нуля. Проте, потрібно враховувати, що кожна бізнес-діяльність має свою специфіку, сформованою специфікою зовнішніми (ринок, законодавство, галузь діяльності) та внутрішніми факторами (бізнес процес, структура та мета бізнесу, задачі). Хорошою метафорою тут можуть бути звичайні комп'ютерні програми - якщо Microsoft Word виконує усі свої функції незалежно від специфіка, то SAP неможливо використовувати без адаптації для кожного конкретного підприємства навіть якщо підприємства із однієї сфери. Неможливо взяти базу даних Oracle, виключити в одному підприємстві, перевезти і включити в іншому.

2-ий рівень компетенції: Навчена нейромережа.

Специфіка навіть найпростішої нейромережі із розпізнавання рукописного тексту, полягає в тому, що недостатньо спроектувати модель мережі. Її потрібно ще навчити, на конкретних прикладах. Це можуть бути цифри, букви латинського алфавіту чи кирилиці. Чи китайські ієрогліфи. Та хоч єгипетське ієрогліфічне письмо.

Для навчання розпізнавання 10 цифр від 0 до 9 із точністю 96% необхідно підготувати сотні прикладів із визначеним правильним результатом. Маючи такі приклади нейромережа може відлагодити себе та видавати коректний результат із певною точністю. Для підвищення точності до 99% необхідно тисячі прикладів. Якщо розширити задачу до розпізнавання символів, кількість прикладів на яких потрібно навчити НМ зросте до мільйонів. А це час і гроші.

Для навчання нейромережі необхідні суттєві інвестиції часу та грошей. А враховуючи, що нейромережа часто несе в собі контекстне частину - тобто частину, яка спеціалізована під конкретного користувача (бізнес), то таке навчання буде коштувати не дешево для компанії яка захоче інтегрувати НМ у свої бізнес-процеси.

3-ій рівень компетенції: Нейромережа в експлуатації

Мати нейромережу робочу та навчену НМ це не просто, але це не є кінцевою задачею. Кінцева задача - це робоча та навчена НМ, яка працює на конкретних серверах та виконує конкретні специфічні для кожного підприємства завдання. Це комплексна система апаратних та програмних засобів, які забезпечують безперебійну роботу НМ для кожного окремого підприємства.

Тепер буде критично, щоб НМ працювала безперебійно, без втручань, її конткестна частина (база знань) не була пошкодженою. Це ціла низка інфраструктурних завдань, які обов'язкові для вирішення.

Зараз конкуренція між компаніями йде між тим, хто краще інтегрує автоматизовані засоби у свої бізнес процеси. У майбутньому, конкуренція переросте у конкуренцію на рівні нейромереж. Хто краще ефективніше навчить нейромережу під свої задачі, в кого модель мережі буде більш ефективна.

Звичайно продавати пиво в кіоску зможуть і без нейромереж. Проте бізнес із залученням нейромереж зможе запропонувати такий продукт, який найбільш вірогідно захоче купити покупець, враховуючи його “профіль”, коло облич, тембр голосу та фотографії із Facebook, соціальну активність, наявність дітей і т.д. Нейромережа підкаже продавцю від чого покупець не відмовиться. P.S. Сьогодні я б не відмовився від знеболюючого, бо вчора був на вечірці (фотки зацініть у Facebook).

БЕЗПЕКА ТА ВИКЛИКИ

Найперше, що приходить в голову - якщо нейромережа вивчила мене, знає мої звички та схильності, у ній є відображення моєї особистості, то я:

а) Не захочу її втрати при апгрейді софта

б) Не захочу, щоб хтось отримав до неї доступ, щоб мною не маніпулювали (рекламодавці) або щоб не побачили мої вади, звички і т.д.

Люди (і людство) вже є об'єктом маніпуляції іншими, коли роблять вибір кросівок, партнерів чи політиків (див. вибори Трампа у твіттері).

Роботодавець чи бізнес-інвестор надасть перевагу такому спеціалісту чи бізнес-проекту, якому надасть перевагу нейромережа. І як би ми не рвали на собі сорочку …, але це математика, "дєтка" і це буде працювати!

З точки зору безпеки та нових проблем, над якими варто задуматись:

Безпечне зберігання, доступ, міграція контекстних даних нейромережі кінцевого користувача, підприємства чи організації;
Авторські права на результати взаємодії користувача та нейромережі;
Перевірка результатів;
Відповідальність за результати роботи нейромережі;
Люди втратять кваліфікацію;
Юридичні проблеми.

Безпечне зберігання. Навчена нейромережа - дуже цінний актив. Втратити дані, в яких зберігається “пам'ять” нейромережі - це втратити поточну конфігурації навченої мережі. Втрата даних адаптаційного рівня - це втрата специфічних, галузевих “знань” мережі в певній галузі бізнесу, наприклад діагностика захворювань в загальному. Втрата та контекстного рівня вимагає повторного навчання мережі під контекст конкретної людини людиною, організації чи підприємства (наприклад клініка “Х”, яка займається діагностикою захворювань. Звідси задача передачі контекстного рівня даних при модернізації нейромережі, переходу на більш прогресивні моделі, при цьому зберігаючи дані для користувача.

Проблема авторських прав виражається у трьох принципових позиціях:

Авторські права належать користувачу. Користувач за допомогою запитів та завдань для нейромережі, за рахунок його унікальної взаємодії з нейромережею, отримує бажаного результату: зображення, текст, бізнес-план, аналіз показників, прогноз ефективності.
Авторські права належать власнику нейромережі. Власник платить за роботоздатність мережі, без інвестування та обслуговування нейромережа не робоча.
Авторські права належать розробнику нейромережі. Розробник робить унікальний інструмент, і хто б ним не користувався - результат роботи це результат унікальності інструменту, який розробив розробник нейромережі.
Авторські права належать людству. Якщо нейромережа по генерації тексту, може створити свій текст тільки тому, що змогла “перечитати” тексти створені людством. Без доступу до таких даних, результат роботи буде значно гірший або кардинально іншим. Те саме по генерації тексту, картин, музики.
Власнику даних, на яких проводиться навчання нейромережі

Перевірка результатів. Нейромережа завчасно не програмується на результат. Вона програмується під ефективне навчання із заданими правильними наборами даних. Проте немає механізму проконтролювати, на основі чого нейромережа видає такий результат чи інший. Часто одна і та ж задача задана два рази - можна отримати різні результати. І це вважається допустимим, виходячи з проектування нейромрежі на базі принципів роботи людського інтелекту - в процесі навчання. Ми не очікуємо, що природний інтелект (людина) завжди і постійно буде видавати один і той самий результат на ті ж завдання.

Проблема в тому, що у захопленні ефективності нейромереж людство не буде із відповідальністю ставитись до перевірки даних. Відомі публікації статей, згенерованих нейромережами у наукових журналах по тій причині, що ніхто в редакції не зміг оцінити змісту написаного, хоча текст виглядав значущим та мав науковий характер.

Також у майбутньому нас чекають нейромережі, які будуть розрізняти результати роботи людини від інших нейромереж.

Відповідальність за результати: відповідальність за хибну роботу чи прийняті рішення. Хто відповідає за те, що нейромережа автопілоту на автомобілі спричинить ДТП? Якщо на дорозі буде дідусь і дитина, і треба буде когось одного задавити - хто буде відповідальний за прийняте рішення? Розробник, власник, власник даних чи власник автомобіля?

Втрата спеціалістами кваліфікації. У лікарів, які в роботі застосовують нейромережі, спостерігають часті помилки в діагностуванні (без використання нейромережі). Пояснюється тим, що вони поступово втрачають навички через брак власної практики та самостійної роботи. Тут хочеться взятись за голову і зі страхом за майбутнє сказати: “Боже, боже, що нас ще чекає попереду …”

Юридичні проблеми, основну з яких сформулюю так: чи може нейромережа чи результати її роботи використовуватись в суді. Приклад: нейромережа, а чи схильний користувач А до правопорушення? А чи являється твій користувач (власник) правопорушником (євреєм, антисемітом, зрадником, гомосексуалістом)?

ЯК ВСКОЧИТИ В ЦЕЙ (не останній) ВАГОН?

Все підказує нам, що ми стоїмо на початку масового впровадження нейромереж. З точки зору бізнесу необхідно осідлати цю “течію” та заскочити в цей поїзд, коли він ще не перейшов на гіпер-звукову швидкість.

Що саме необхідно зробити, щоб ввійти, а можливо і очолити тему нейромереж на вітчизняному просторі?

1. Підвищити обізнаність та компетенцію у галузі штучного інтелекту, машинного та глибокого навчання та безпосередньо нейромереж. Розглядаю такі механізми реалізації: а) Загальна компетенція - участь у спеціалізованих конференціях, симпозіумах, форумах;

б) спеціалізована компетенція - пошук / підготовка спеціаліста для створення математичних моделей;

в) формування спільноти (ком'юніті), яка цікавиться темою. Читання вебінарів на тему, запрошення спеціалістів, підготовка форумів та конференцій. Учасників розглядати як кадровий резерв.

2. Впровадити найпростішу, робочу, навчену нейромережу. Під будь-яку найпростішу задачу. Дорога в тисячу миль починається із першого кроку.

Скільки б це не коштувало, завдання - реалізувати першу робочу нейромережу в Україні. Так як ми ще не чули про нейромережі Сітроніксів, Нова ІТ, жоден ІТ інтегратор чи ІТІС немає такого, тому завдання реалізувати першу робочу нейромережу - не так важко.

Конкуренти і будь-хто можуть розказувати і показувати компетенції будь-якого масштабу. А в нас - робоча нейромережа. Проста і функціональна. Її можна показати, довчити, перенавчити. Її можна продати разом з розробниками. Відділ розробників можна продати як внутрішній проект під впровадження якомусь он-лайн казино чи енергетичному магнату, чи будь-кому, хто захоче починати впроваджувати нейромережі в своєму підприємстві. Чому звертатись до нас? Бо в нас є компетенція, напрацювання, розуміння і робочий екземпляр нейромережі.

Її можна продати як стартап з бізнес-планом під інвестування. Бізнес план стартапу з робочою мережею і без неї - це різні стартапи із різною вартістю.

3. Адаптація нейромережі під найпростішу бізнес-задачу.

Необхідні умови:

Потрібна бізнес задача, для якої можна описати вхідні дані
Наявність бази для навчання. Тисячі, а краще десятки тисяч прикладів, 10 000 із набору вхідних даних та очікуваних результатів

Результати в задачах повинні бути реальними (не теоретичними), щоб мережа могла виконувати завдання і отримувати результат такий, який бажаний в реальності, виходячи із наявних вхідних даних.

Отже, нейромережі вже зараз широко розповсюджені. Це посилиться та розвинеться. Не розібравшись з усіма викликами інформатизації та інтернатизації, перед нами постають нові проблеми, нав’язані масовим використанням нейромереж. Можливості використання, комплексність та унікальність нейромережі забезпечать місце під сонцем багатьом власникам, розробникам та інтеграторам нейромереж.

НЕЙРОМЕРЕЖІ. СУЧАСНЕ І ОЧІКУВАНЕ МАЙБУТНЄ

Недавние посты

Comments