OpenAI obniża koszty wykorzystania sztucznej inteligencji poprzez „miniaturowy” model

OpenAI ogłosiło dzisiaj wprowadzenie „mini” modelu po obniżonej cenie, który według niego pozwoli większej liczbie firm i programów korzystać z sztucznej inteligencji. Firma twierdzi, że nowy model, nazwany GPT-4o mini i dostępny od dziś, jest o 60 procent tańszy od najtańszego istniejącego modelu OpenAI, a jednocześnie oferuje wyższą wydajność.

OpenAI opisuje to posunięcie jako część wysiłków, aby sztuczna inteligencja była „jak najbardziej dostępna”, ale odzwierciedla także rosnącą konkurencję wśród dostawców usług sztucznej inteligencji w chmurze, a także rosnące zainteresowanie małymi, bezpłatnymi modelami sztucznej inteligencji o otwartym kodzie źródłowym. Oczekuje się, że Meta wypuści w przyszłym tygodniu największą wersję swojej bardzo wydajnej bezpłatnej oferty, Llama 3.

„Głównym celem OpenAI jest bezpieczne budowanie i rozpowszechnianie sztucznej inteligencji oraz jej powszechne udostępnianie” – mówi WIRED Olivier Godment, menedżer produktu w OpenAI odpowiedzialny za nowy model. „Udostępnianie inteligencji po niższych kosztach jest jednym z najbardziej efektywnych sposoby, abyśmy to zrobili.”

Goodment twierdzi, że firma opracowała tańszą ofertę, ulepszając architekturę modelu oraz udoskonalając dane szkoleniowe i system szkoleniowy. OpenAI twierdzi, że GPT-4o mini przewyższa inne „małe” modele na rynku w kilku popularnych testach porównawczych.

OpenAI zyskało znaczącą pozycję na rynku sztucznej inteligencji w chmurze dzięki imponującym możliwościom swojego chatbota ChatGPT, który zadebiutował pod koniec 2022 r. Firma zapewnia osobom z zewnątrz dostęp do dużego modelu językowego, na którym opiera się ChatGPT, zwanego GPT-4o, za opłatą . Oferuje również mniej wydajny model, zwany GPT-3.5 Turbo, za około jedną dziesiątą ceny GPT-4o.

Zainteresowanie modelami językowymi wywołane ogromnym sukcesem ChatGPT skłoniło konkurencję do opracowania podobnych ofert. Google, pionier w dziedzinie sztucznej inteligencji, poczynił ogromne wysiłki, aby zbudować i wprowadzić na rynek duży model językowy i chatbota pod marką Gemini. Startupy takie jak Anthropic, Cohere i AI21 również zebrały miliony na rozwój i sprzedaż własnych, dużych modeli językowych klientom korporacyjnym i programistom.

READ Apple Watch Series 7 jest już w sprzedaży za 284 USD

Budowanie dużych, wydajniejszych modeli językowych wymaga ogromnych zasobów finansowych, ale niektóre firmy zdecydowały się udostępnić swoje dzieła na zasadach open source, aby przyciągnąć programistów do swoich ekosystemów. Najbardziej znanym modelem sztucznej inteligencji typu open source jest Lama firmy Meta; Można go pobrać i używać bezpłatnie, ale jego licencja nakłada pewne ograniczenia na wykorzystanie komercyjne.

W kwietniu ubiegłego roku Meta ogłosiła Llamę 3, swój najpotężniejszy darmowy model. Firma wypuściła małą wersję modelu z 8 miliardami parametrów – co stanowi przybliżoną miarę przenośności i złożoności modelu – a także mocniejszą, średniej wielkości wersję z 70 miliardami parametrów. Model średniej wielkości zbliża się do najlepszych ofert OpenAI w kilku benchmarkach.

Wiele źródeł potwierdziło WIRED, że Meta planuje wypuścić największą wersję Llama 3, zawierającą 400 miliardów parametrów, 23 lipca, choć twierdzą, że data premiery może ulec zmianie. Nie jest jasne, jakie możliwości ma ta wersja Llama 3, ale niektóre firmy zwróciły uwagę na modele sztucznej inteligencji typu open source, ponieważ są one tańsze, można je dostosowywać i zapewniają większą kontrolę nad modelem i dostarczanymi do niego danymi.

Goodment zdaje sobie sprawę, że potrzeby klientów ewoluują. „Na rynku coraz częściej widzimy programistów i firmy łączące małe i duże modele w celu stworzenia najlepszego produktu przy odpowiedniej dla nich cenie i opóźnieniu” – mówi.

Goodment twierdzi, że oferta chmurowa OpenAI zapewnia klientom modele, które zostały lepiej przetestowane pod kątem bezpieczeństwa niż modele konkurencyjnych firm. Dodaje, że OpenAI może docelowo opracować modele, które klienci będą mogli uruchamiać na własnych urządzeniach. „Jeśli zobaczymy przytłaczający popyt, być może otworzymy te drzwi” – mówi.

Ayhan

. „Telewizyjny pionier. Fan alkoholu. Namiętny komunikator. Oddany badacz kawy. Boczek ninja”.

READ Chiński procesor Zhaoxin KX-6000G ze zintegrowanym GPU GT10C0 oferuje taką samą wydajność jak NVIDIA GT 630

OpenAI obniża koszty wykorzystania sztucznej inteligencji poprzez „miniaturowy” model

Microsoft poprawia wydajność procesora Ryzen dzięki najnowszej aktualizacji systemu Windows 11

Apple wprowadza usuwanie obiektów AI na zdjęciach wraz z najnowszą aktualizacją iOS

Z pewnością wygląda na to, że PS5 Pro zostanie zaprezentowane w ciągu najbliższych kilku tygodni

Microsoft poprawia wydajność procesora Ryzen dzięki najnowszej aktualizacji systemu Windows 11

Identyczne ślady dinozaurów odkryto na dwóch kontynentach

Stowarzyszenie Graczy NFL pozywa DraftKings na kwotę około 65 milionów dolarów

Apple wprowadza usuwanie obiektów AI na zdjęciach wraz z najnowszą aktualizacją iOS

Dodaj komentarz Anuluj pisanie odpowiedzi

More Stories

Microsoft poprawia wydajność procesora Ryzen dzięki najnowszej aktualizacji systemu Windows 11

Apple wprowadza usuwanie obiektów AI na zdjęciach wraz z najnowszą aktualizacją iOS

Z pewnością wygląda na to, że PS5 Pro zostanie zaprezentowane w ciągu najbliższych kilku tygodni

You may have missed

Microsoft poprawia wydajność procesora Ryzen dzięki najnowszej aktualizacji systemu Windows 11

Identyczne ślady dinozaurów odkryto na dwóch kontynentach

Stowarzyszenie Graczy NFL pozywa DraftKings na kwotę około 65 milionów dolarów

Apple wprowadza usuwanie obiektów AI na zdjęciach wraz z najnowszą aktualizacją iOS