OpenAI ogłosiło dzisiaj wprowadzenie „mini” modelu po obniżonej cenie, który według niego pozwoli większej liczbie firm i programów korzystać z sztucznej inteligencji. Firma twierdzi, że nowy model, nazwany GPT-4o mini i dostępny od dziś, jest o 60 procent tańszy od najtańszego istniejącego modelu OpenAI, a jednocześnie oferuje wyższą wydajność.
OpenAI opisuje to posunięcie jako część wysiłków, aby sztuczna inteligencja była „jak najbardziej dostępna”, ale odzwierciedla także rosnącą konkurencję wśród dostawców usług sztucznej inteligencji w chmurze, a także rosnące zainteresowanie małymi, bezpłatnymi modelami sztucznej inteligencji o otwartym kodzie źródłowym. Oczekuje się, że Meta wypuści w przyszłym tygodniu największą wersję swojej bardzo wydajnej bezpłatnej oferty, Llama 3.
„Głównym celem OpenAI jest bezpieczne budowanie i rozpowszechnianie sztucznej inteligencji oraz jej powszechne udostępnianie” – mówi WIRED Olivier Godment, menedżer produktu w OpenAI odpowiedzialny za nowy model. „Udostępnianie inteligencji po niższych kosztach jest jednym z najbardziej efektywnych sposoby, abyśmy to zrobili.”
Goodment twierdzi, że firma opracowała tańszą ofertę, ulepszając architekturę modelu oraz udoskonalając dane szkoleniowe i system szkoleniowy. OpenAI twierdzi, że GPT-4o mini przewyższa inne „małe” modele na rynku w kilku popularnych testach porównawczych.
OpenAI zyskało znaczącą pozycję na rynku sztucznej inteligencji w chmurze dzięki imponującym możliwościom swojego chatbota ChatGPT, który zadebiutował pod koniec 2022 r. Firma zapewnia osobom z zewnątrz dostęp do dużego modelu językowego, na którym opiera się ChatGPT, zwanego GPT-4o, za opłatą . Oferuje również mniej wydajny model, zwany GPT-3.5 Turbo, za około jedną dziesiątą ceny GPT-4o.
Zainteresowanie modelami językowymi wywołane ogromnym sukcesem ChatGPT skłoniło konkurencję do opracowania podobnych ofert. Google, pionier w dziedzinie sztucznej inteligencji, poczynił ogromne wysiłki, aby zbudować i wprowadzić na rynek duży model językowy i chatbota pod marką Gemini. Startupy takie jak Anthropic, Cohere i AI21 również zebrały miliony na rozwój i sprzedaż własnych, dużych modeli językowych klientom korporacyjnym i programistom.
Budowanie dużych, wydajniejszych modeli językowych wymaga ogromnych zasobów finansowych, ale niektóre firmy zdecydowały się udostępnić swoje dzieła na zasadach open source, aby przyciągnąć programistów do swoich ekosystemów. Najbardziej znanym modelem sztucznej inteligencji typu open source jest Lama firmy Meta; Można go pobrać i używać bezpłatnie, ale jego licencja nakłada pewne ograniczenia na wykorzystanie komercyjne.
W kwietniu ubiegłego roku Meta ogłosiła Llamę 3, swój najpotężniejszy darmowy model. Firma wypuściła małą wersję modelu z 8 miliardami parametrów – co stanowi przybliżoną miarę przenośności i złożoności modelu – a także mocniejszą, średniej wielkości wersję z 70 miliardami parametrów. Model średniej wielkości zbliża się do najlepszych ofert OpenAI w kilku benchmarkach.
Wiele źródeł potwierdziło WIRED, że Meta planuje wypuścić największą wersję Llama 3, zawierającą 400 miliardów parametrów, 23 lipca, choć twierdzą, że data premiery może ulec zmianie. Nie jest jasne, jakie możliwości ma ta wersja Llama 3, ale niektóre firmy zwróciły uwagę na modele sztucznej inteligencji typu open source, ponieważ są one tańsze, można je dostosowywać i zapewniają większą kontrolę nad modelem i dostarczanymi do niego danymi.
Goodment zdaje sobie sprawę, że potrzeby klientów ewoluują. „Na rynku coraz częściej widzimy programistów i firmy łączące małe i duże modele w celu stworzenia najlepszego produktu przy odpowiedniej dla nich cenie i opóźnieniu” – mówi.
Goodment twierdzi, że oferta chmurowa OpenAI zapewnia klientom modele, które zostały lepiej przetestowane pod kątem bezpieczeństwa niż modele konkurencyjnych firm. Dodaje, że OpenAI może docelowo opracować modele, które klienci będą mogli uruchamiać na własnych urządzeniach. „Jeśli zobaczymy przytłaczający popyt, być może otworzymy te drzwi” – mówi.
. „Telewizyjny pionier. Fan alkoholu. Namiętny komunikator. Oddany badacz kawy. Boczek ninja”.
More Stories
Z pewnością wygląda na to, że PS5 Pro zostanie zaprezentowane w ciągu najbliższych kilku tygodni
Wycieki ujawniają nazwę i projekt rzekomego urządzenia PS5 Pro
Apple wprowadza usuwanie obiektów AI na zdjęciach wraz z najnowszą aktualizacją iOS