DeepSeek je oslavován jako lepší ChatGPT. Bývalý zaměstnanec Microsoftu vysvětluje, proč je nový chatbot s umělou inteligencí hitem jako bomba
Momentka ze Sputniku
– Bývalý zaměstnanec Microsoftu Dave Plummer na svém kanálu na YouTube Dave’s Garage hovoří o čínském chatbotu s umělou inteligencí DeepSeek. Vysvětluje, v čem je DeepSeek tak výjimečný ve srovnání se svými konkurenty, jako je ChatGPT
Ferrari z náhradních dílů
DeepSeek byl voblasti školenímnohem levnější než ChatGPT a srovnatelné LLM. Nicméně faktor, o který by měl být skutečně levnější, je sporný
Bývalý zaměstnanec Microsoftu Plummer hovoří na svém kanálu na YouTube, stejně jako další zdrojeo necelých 6 milionech dolarů, které údajně do DeepSeek přitekly. To je zlomek miliard investovaných do modelů konkurence.Přesto může umělá inteligence držet krok s vlajkovými loděmi, jako je ChatGPT.
Vývojáři UI navíc údajně neměli přístup k nejnovějším čipům Nvidia Ostatně jejich výkon je prý natolik nedílnou součástí rozmachu UI, že seNvidia vyšvihla mezi nejcennější korporace. A to přestože hlavní produkt, pro který mnozí Nvidii znají, tedy herní grafické karty, patří jen ke vzdáleným favoritům společnosti
Podle Plummera je
DeepSeek jako
Ferrari postavené z náhradních dílů – stejně dobré, ale mnohem levnější.
Jako mistr a učeň
To je možné díky jinému typu školení. Stejně jako model, na kterém je založen ChatGPT, je i DeepSeek velkojazyčný model.Je to všakdistilovaný model
(distilovaný model
).
To znamená, že menší model je vycvičen s pomocí velkých modelů tak, aby poskytoval výsledky co nejpodobnější těm velkým – ale s mnohem menšími prostředky.
To znamená, že ačkoli obrovské modely mají stále větší znalostní bázi, menší model dosahuje ve většině aplikací téměř stejně dobrých výsledků.
Plummer to srovnává ve svém videu:
Je to, jako by mistr zaučoval svého učně – učeň nemusí umět všechno, ale práci zvládne stejně dobře.
Jedním z těchto mistrů
byl open source model Llama od společnosti Meta, ale také ChatGPT od OpenAI.
Tato destilace znalostí činí DeepSeek výrazně efektivnějším z hlediska zdrojů Také již nevyžaduje k provozu obrovský hardware se stovkami GPU v obrovských datových centrech, jako je tomu u velkých modelů
To však také vede Plummera k otázce:
Jestliže si můžete postavit Ferrari v garáži z dílů od Chevroletu, co to znamená pro hodnotu Ferrari?
Paměť počítačové revoluce
Pro drahé originální Ferrari to samozřejmě na první pohled neznamená nic dobrého
Pro uživatele je však výhodou, že mohou model spustit i lokálně na svém domácím hardwaru DeepSeek samozřejmě nelze spustit lokálně na každém malém pracovním notebooku. Plummer vyžaduje pro největší model DeepSeek procesor AMD Threadripper s grafickým procesorem Nvidia RTX 6000 (48 GB VRAM) Menší varianty dokonce běžely naMacBooku Pro
Připomíná mu tento vývoj dobu počítačové revoluce.
Připomíná mi to začátky osobních počítačů – nebyly tak dobré jako mainframy, ale změnily svět.
Když se počítače ještě považovaly za mainframy (Mainframy
) pro podnikové aplikace, nikdo si nedokázal představit, že jednoho dne je bude mít každý doma za přijatelnou cenu.
Momentka ze Sputniku
Na rozdíl od revoluce v osobních počítačích je však dnes třeba zvážit i geopolitické důsledky DeepSeek je čínský model, který konkuruje zejména americkým společnostem ze Silicon Valley
Plummer to označuje za moment Sputniku
Jedná se o narážku na sovětskou družici Sputnik, jejíž vypuštění v roce 1957 znamenalo začátek vesmírných závodů (Space Race
) anovou fázi systémového soupeření mezi Sovětským svazem a Západem ve studené válce.
Podobně vede vývoj DeepSeek ke geopolitickému napětí, které odráží soupeření mezi USA jako technologickým hegemonem a Čínou jako nastupující světovou velmocí.
Toto technologické soupeření není jen bojem o inovace, ale také symbolem systémového soupeření mezi kapitalistickou demokracií USA a státním kapitalismem Číny.