· tutorial · Przeczytasz w 5 min

Jak uzyskać dostęp do GPT-4 przez API OpenAI?

Możliwości twojej aplikacji mogą znacząco wzrosnąć dzięki integracji z modelami językowymi

TL;DR

Dostęp do GPT-4 wymaga zapisania się na waitlistę OpenAI. Po uzyskaniu dostępu model ten możemy wykorzystywać przez REST API, a całą integrację opisujemy w poniższym artkule.

Nowe możliwości

Publiczny dostęp do modeli językowych o możliwościach podobnych do GPT-4 sprawił, że wzbogacanie projektów o nowe funkcje oparte o tekst stało się zaskakująco łatwe. To, co kiedyś wymagało zespołu naukowców i budowanych w zaciszu biura modeli sztucznej inteligencji, teraz jest realizowane w zdecydowanie bardziej dostępny sposób.

Zadania takie jak ocena sentymentu danego fragmentu tekstu, ekstrakcja najważniejszych pojęć, podsumowywanie dokumentów i wyszukiwanie podobieństw pomiędzy zbiorami danych może teraz dla ciebie realizować wynajęty model GPT-4, którego za stosunkowo niewielką opłatą wykorzystasz do realizacji twoich planów.

Dostęp do GPT-4

Na dzisiaj (stan na 1 czerwca 2023r.) dostęp do GPT-4 poprzez API nie jest jeszcze udostępniany automatycznie. Firma OpenAI przyznaje do niego dostęp stopniowo, aby kontrolować wykorzystywane zasoby i zarządzać tym narzędziem w odpowiedzialny sposób. Ja sam po zapisie do listy oczekujących czekałem na niego ok. 7 dni, więc warto zapisać się na listę zaraz po przeczytaniu tego artykułu.

Aby zapis na listę był możliwy, musisz założyć nowe (na początku darmowe) konto na platformie OpenAI, która dostępna jest pod adresem platform.openai.com - w pierwszym kroku nie musisz jeszcze konfigurować płatności, ale niezbędny jest numer telefonu dla ustawienia dwustopniowej autentykacji.

Po założeniu konta czas wejść do ustawień twojej organizacji i pobrać Organisation ID (poniżej oznaczona numerem 3), której użyjemy w trakcie zapisywania się do listy oczekujących.

Pobierz Org ID

Po uzyskaniu ID twojego konta czas się zapisać, podajac przy okazji niezbędne dane - tutaj.

Lista oczekujących

Po samym zapisie pozostaje tylko czekać na otrzymanie maila takiego jak ten poniżej tak szybko jak to możliwe:

Mail dostępowy

Wykorzystanie GPT-4

Pierwszą rzeczą jaką musimy wykonać po uzyskaniu dostępu do GPT-4 jest stworzenie klucza dostępowego. Można go w łatwy sposób wygenerować z poziomu ustawień konta:

Klucz dostępowy

Kolejnym krokiem jest skonfigurowanie płatności i ustawienie limitów korzystania z API - w moim przypadku dla celów testowych zdefiniowałem wartość $20 miesięcznie i właśnie od takiej kwoty API zacznie zwracać mi błędy, przy okazji dbając o mój budżet domowy.

Ograniczenia kosztów

Mając wygenerowany klucz i będąc na koncie płatnym nie pozostaje nam nic innego, jak przejść do dokumentacji samego modelu aby zapoznać się z właściwą integracją. Sam GPT-4 jest częścią tzw. Chat API i jest tylko jednym z wielu modeli które możemy testować w tym miejscu.

Przykładowe zapytanie w projekcie opartym o JavaScript i Node.js może wyglądać następująco:

const { Configuration, OpenAIApi } = require("openai");

const configuration = new Configuration({
  apiKey: process.env.OPENAI_API_KEY,
});
const openai = new OpenAIApi(configuration);

const completion = await openai.createChatCompletion({
  model: "gpt-4",
  messages: [{role: "user", content: "Witaj świecie!"}],
});
console.log(completion.data.choices[0].message);

Paczka z której korzystamy to openai, pod zmienną OPENAI_API_KEY kryje się wygenerowany wcześniej klucz, a przy pomocy asynchronicznej funkcji createChatCompletion oczekujemy na odpowiedź z samego API.

Poza przekazywanym rodzajem modelu z którego chcemy skorzystać musimy też zdefiniować listę wiadomości którą przetworzy sam model, a w przypadku GPT-4 możemy te wiadomości opisać przy pomocy trzech ról - user, system oraz assistant, co pomoże samemu modelowi lepiej zrozumieć kontekst i relację wiadomości względem siebie.

Zauważ, że odpowiedź jest nieco bardziej złożona i może zawierać kilka wartości zaproponowanych przez model, w zależności od parametrów wejściowych i dodatkowych opcji konfiguracji takich jak chociaż temperatura.

Ten podstawowy opis samego API w zupełności wystarczy do stworzenia pierwszy eksperymentów opartych o GPT-4 - na tym etapie nie pozostaje ci nic innego jak tylko uruchomić wyobraźnię i zaprojektować takie rozwiązania oparte o modele językowe, z których skorzysta użytkownik końcowy i odbiorcy twojej pracy.

Ile to kosztuje?

Biorąc pod uwagę zaawansowane możliwości samego modelu, cennik zdefiniowany przez OpenAI nie jest szczególnie kontrowersyjny. Podstawą rozliczenia jest liczba tzw. tokenów wykorzystywanych w komunikacji z modelem, a na całościowy koszt wpływa zarówno rozmiar wiadomości od użytkownika, jak i rozmiar generowanych odpowiedzi.

Czym jest token? Token to podstawowa jednostka informacji (słów, znaków) którą wykorzystują modele językowe do generowania i przewidywania tekstu. Zgodnie z dokumentacją OpenAI można założyć, że tysiąc tokenów to ok. 750 słów, a wg Wikipedii przeciętna książka w języku angielskim zawiera ok. 250-300 słów na stronę, a więc mniej niż pięćset tokenów.

Dlaczego to ważne? Dlatego, że ceny zdefiniowane są właśnie w relacji do wykorzystywanych tokenów. Na dzisiaj rozliczenie za opisywany dzisiaj model wygląda następująco:

ModelPromptCompletion
8k context$0.03 / 1K tokens$0.06 / 1K tokens
32k context$0.06 / 1K tokens$0.12 / 1K tokens

Dla pełnego zrozumienia tej tabelki dodam, że kontekstem (albo context window) nazywamy łączny rozmiar tekstu z którym może pracować GPT-4, biorąć pod uwagę zarówno wiadomości od użytkownika albo generowane odpowiedzi. 8k/32k oznacza możliwość utrzymywania sensownej “konwersacji” na zbiorze 8 lub 32 tysięcy tokenów z wybranym modelem.

Co do samych kosztów, za 750 słów promptu użytkownika zapłacimy 3 centy, a za 750 słów wygenerowanego tekstu zapłacimy 6 centów. Mając takie dane możesz teraz w łatwy sposób zdefiniować swój budżet korzystania z GPT-4 (np. 50zł / miesiąc) i sprawdzić, ile tekstu możesz faktycznie przeprocesować z narzędziem, które dzisiaj opisuję.

Do liczenia tokenów możesz też wykorzystać narzędzia takie jak:

Co dalej?

Możliwości jakie daje nam GPT-4 za stosunkowo niewielką opłatą są naprawdę zdumiewające, a głównym ograniczeniem jest na dzisiaj człowiek i jego wyobraźnia. Co więcej, korzystając z API firmy OpenAI uzyskujemy dostęp nie tylko do GPT-3.5/4, ale również do modeli przetwarzających obrazy (DALL-E) lub dźwięk (Whisper), co podnosi możliwości całej integracji o kolejne kilka poziomów.

W jednym z ostatnich filmów na naszym kanale zaprezentowałem kilka przykładowych projektów które możesz zbudować z poznanymi właśnie narzędziami, więc zapraszam cię teraz do jego obejrzenia i podzielenia się własnymi projektami w komentarzach pod filmem:

Miniaturka filmu
Podaj dalej:

Newsletter Opanuj AI

Subskrybuj ręcznie selekcjonowane materiały z obszarów AI i rynku nowych technologii, które pomagają dowozić lepsze rezultaty i budować kulturę innowacji

Zapisując się do newslettera akceptujesz naszą politykę prywatności.

Zawsze na czas
Otrzymuj regularnie materiały z obszarów AI i nowych technologii, które wykorzystasz współpracując w zespole i tworząc nowe produkty
Wysoka jakość
Materiały zamieszczane w newsletterze przechodzą proces selekcji, gdzie wymagamy jakości i możliwej do wykorzystania wiedzy