Плани Open AI щодо покращення поведінки ChatGPT

16/2/23

У цій статті є технічні терміни, частина з них спрощена для вашої зручності та розуміння.

Open AI багато думає про поведінку систем штучного інтелекту, які вони створюють. З моменту запуску ChatGPT користувачі ділилися результатами, які вони вважають політично упередженими, образливими чи іншими неприйнятними.

Нейромережі Open AI

На відміну від звичайного програмного забезпечення, моделі Open AI є масивними нейронними мережами.

Їхня поведінка вивчається з широкого діапазону даних, а не програмується явно. Хоча це не ідеальна аналогія, процес більше схожий на дресирування собаки, ніж на звичайне програмування.

На сьогодні цей процес недосконалий. Удосконалення методів узгодження систем штучного інтелекту з людськими цінностями є головним пріоритетом для компанії Open AI, особливо тому, що системи штучного інтелекту стають все більш ефективними.

Двоетапний процес: попереднє навчання та тонке налаштування

Роль рецензентів та політики

У деяких випадках даються вказівки рецензентам щодо певного типу результату (наприклад, «не виконувати запити щодо незаконного вмісту»).

В інших випадках вказівки мають більш високий рівень (наприклад, «уникайте займати позицію щодо суперечливих тем»).

Важливо відзначити, що співпраця з рецензентами не є одноразовою — це безперервні стосунки, у яких багато допомагають у розвитку продуктів ШІ від Open AI.

Значною частиною процесу є підтримка надійного зворотного зв’язку з рецензентами, що включає щотижневі зустрічі для вирішення питань, які вони можуть мати, або надання роз’яснень щодо вказівок. Це процес зворотного зв’язку, як тренується модель, щоб вона з часом ставала все кращою.

Усунення упереджень

У вказівках Open AI чітко зазначено, що рецензенти не повинні надавати перевагу жодній політичній групі. Упередження, які все ж можуть виникнути в результаті описаного вище процесу, є помилками, а не функціями.

Open AI постійно працює над покращенням чіткості цих інструкцій. У рамках поточних ініціатив щодо прозорості вони працють над тим, щоб ділитися зведеною демографічною інформацією про рецензентів у спосіб, який не порушує правила та норми конфіденційності, оскільки це є додатковим джерелом потенційної упередженості у вихідних даних системи.

Open AI досліджує процес тонкого налаштування, для того щоб процес був більш зрозумілим та керованим.

Покращення поведінки за замовчуванням

Open AI хоче, щоб якомога більше користувачів знайшли системи штучного інтелекту корисними для них «з коробки» та відчули, що технологія розуміє та поважає їхні цінності.

З цією метою вони інвестують в дослідження та розробку, щоб зменшити як явні, так і ледве помітні упередження у тому, як ChatGPT реагує на різні вхідні дані. У деяких випадках ChatGPT наразі відмовляє у виводах, які не повинен, а в деяких випадках він не відмовляє, коли повинен. Вони важають, що покращення в обох аспектах можливе.

Крім того, у є можливості для вдосконалення в інших вимірах поведінки системи, таких як «вигадування».