Wall Street analizuje ile naprawdę wydano na DeepSeek i obala mit taniego AI
Wokół DeepSeek narosło wiele plotek, a dynamiczna narracja w portalach społecznościowych szybko przysłoniła fakty. Taki efekt wystąpił w przypadku chińskiej firmy DeepSeek, która w miniony weekend stała się bohaterem wirusowych postów sugerujących, że stworzyła zdolności sztucznej inteligencji OpenAI za zaledwie 6 milionów dolarów – o wiele mniej niż miliardy wydane przez amerykańskie giganty technologiczne. Szybki wzrost zainteresowania wywołał pytania o pozycję USA na rynku AI i spowodował spadek wartości akcji technologicznych firm. W poniedziałek Indeks Nasdaq Composite zakończył dzień spadkiem o 3,1%, a lider rynku, Nvidia, straciła aż 17%.
Jednakże rzeczywistość okazuje się bardziej złożona. DeepSeek nie stworzyło kopii technologii OpenAI, wydając jedynie kilka milionów dolarów.
Kwota 6 milionów dolarów pojawiła się po raz pierwszy w dokumencie technicznym DeepSeek z końca grudnia, który dotyczył modelu DeepSeek-V3. W opracowaniu tym start-up oszacował, że ostatni etap szkolenia modelu, trwający 2,8 miliona godzin na GPU, kosztowałby 5.6 miliona dolarów, gdyby wynajmowano odpowiednią moc obliczeniową w chmurze. Warto jednak zaznaczyć, że DeepSeek pominął koszty związane z wcześniejszymi badaniami, eksperymentami z architekturami, algorytmami oraz danymi.
Oznacza to, że ta kwota nie uwzględnia wydatków na badania i rozwój, wynagrodzenia pracowników, zakup GPU czy testy. Porównanie kosztów ostatniego etapu szkolenia DeepSeek z całkowitymi wydatkami amerykańskich firm na infrastrukturę AI to jak porównywanie kosztu zakupu pociągu bez uwzględnienia konieczności stworzenia całej infrastruktury kolejowej, która umożliwia jego zastosowanie. Nie ma co ukrywać, ale taka narracja została sprowokowana przez samych Chińczyków. Rzeczywisty koszt DeepSeek jest prawdopodobnie znacznie wyższy.
Analiza opublikowana przez analityka Bernsteina, Stacy’ego Rasgona, wskazuje na poważne nieporozumienie w kwestii kwoty 5 milionów dolarów. Rasgon stanowczo stwierdził, że twierdzenie, jakoby Chiny skopiowały OpenAI za tę sumę, jest całkowicie nieprawdziwe.
Z kolei Gavin Baker, zarządzający funduszem technologicznym, uznał podanie 6 milionów dolarów jako kosztu szkolenia za „głębokie nieporozumienie”, podkreślając, że nawet najbardziej utalentowany zespół nie byłby w stanie wytrenować modelu DeepSeek od podstaw za tak niewielką kwotę.
Wielu ekspertów z dziedziny sztucznej inteligencji podejrzewa, że DeepSeek mogło połączyć wyniki amerykańskich modeli z własnymi osiągnięciami, stosując technikę destylacji – proces optymalizacji mniejszych modeli za pomocą większych, aby poprawić ich wydajność.
Tymczasem nowe doniesienia z Chin podważają popularny mit o taniej sztucznej inteligencji. Chiny ogłosiły niedawno plany przeznaczenia 137 miliardów dolarów na rozwój AI w nadchodzących latach. Założyciel DeepSeek, Liang Wenfeng, miał ponoć powiedzieć chińskiemu premierowi Li Qiangowi, że amerykańskie ograniczenia eksportowe na GPU do AI stanowią „wąskie gardło” w rozwoju technologii.
Te wydarzenia pokazują, że globalne firmy technologiczne wciąż będą musiały inwestować w infrastrukturę AI, aby rozwijać nowe, zaawansowane modele i generację sztucznej inteligencji.
Akcje Nvidia zaliczają mocne spadki. Analitycy komentują jak DeepSeek wpłynie na przyszłości spółki
W obliczu zamieszania wywołanego przez DeepSeek, Mark Zuckerberg, CEO Meta Platforms, ogłosił w piątek, że jego firma przeznaczy od 60 do 65 miliardów dolarów na wydatki inwestycyjne w 2025 roku, przy jednoczesnym znaczny powiększeniu zespołów AI. W październiku Meta prognozowała wydatki na 2024 rok na poziomie 38-40 miliardów dolarów. „To będzie przełomowy rok dla sztucznej inteligencji” – zapowiedział Zuckerberg, dodając, że firma buduje centrum danych o mocy 2+ gigawatów i planuje posiadanie ponad 1,3 miliona GPU do końca roku.
Choć cała sytuacja wokół DeepSeek wywołała wiele emocji, niektóre kwestie pozostają kluczowe. Wraz z pojawieniem się nowych modeli, pojawiły się pytania dotyczące wymagań obliczeniowych dla wnioskowania AI, czyli procesu generowania wyników z modeli.
Chiński start-up DeepSeek zastosował techniki takie jak „Mixture of Experts”, które umożliwiają niezwykle efektywne wnioskowanie z mniejszych modeli destylowanych. New Street Research ocenia, że koszt wnioskowania z DeepSeek-V3 jest o około 90% niższy niż porównywalnych modeli OpenAI.
W wyniku tej sytuacji akcje Nvidii spadły w poniedziałek w obliczu obaw o przyszły popyt na szkolenie i wnioskowanie. Rzecznik Nvidii nazwał osiągnięcia DeepSeek „doskonałym postępem w AI i świetnym przykładem Test Time Scaling”, podkreślając, że wnioskowanie wymaga dużej liczby GPU Nvidii oraz wydajnej sieci.
DeepSeek może wskazywać na bardziej wydajne modele AI, a jeśli to prawda, amerykańscy dostawcy mogą ostatecznie podjąć próbę skopiowania tych technologii. Jednak to nie oznacza, że chipy AI staną się nagle łatwo dostępne w nadmiarze. Historia pokazuje, że innowacje technologiczne skutkują wzrostem popytu, a podaż staje się wciąż niewystarczająca.
„Deep Learning ma legendarne, ogromne zapotrzebowanie na obliczenia, jak żaden inny algorytm w sztucznej inteligencji” – stwierdził Andrej Karpathy, były dyrektor AI Tesli i współzałożyciel OpenAI. „Nigdy nie postawiłbym zakładu przeciwko obliczeniom jako górnej granicy osiągalnej inteligencji w długim okresie.”
Były CEO Intela, Pat Gelsinger, podkreślił podobną kwestię, mówiąc, że „obliczenia podlegają prawu gazu”, co oznacza, że ich tańsze wytwarzanie może poszerzyć rynek, zwiększając dostępność AI.1
Tymczasem Satya Nadella, CEO Microsoftu, przypomniał o paradoksie Jevonsa, formułowanym przez ekonomistę w 1865 roku, który zauważył, że ulepszenia efektywności prowadzą do wzrostu konsumpcji, ponieważ pojawiają się nowe zastosowania technologii. „Wraz z rosnącą efektywnością AI, jego użycie wystrzeli w górę, stając się towarem, którego nie będziemy w stanie zaspokoić” – zauważył Nadella.
Ostatecznie, jeśli AI stanie się bardziej zaawansowane, deweloperzy i przedsiębiorstwa znajdą sposoby na wykorzystanie nowych możliwości technologicznych, mimo chwilowych wahań na rynku. Przyszłość rynku AI, pomimo obaw, pozostaje wciąż pełna potencjału.