DeepSeek: (- Odborník Microsoftu vysvětluje, co je základem jeho obrovského úspěchu.

0
2

DeepSeek je oslavován jako lepší ChatGPT. Bývalý zaměstnanec Microsoftu vysvětluje, proč je nový chatbot s umělou inteligencí hitem jako bomba

Momentka ze Sputniku– Bývalý zaměstnanec Microsoftu Dave Plummer na svém kanálu na YouTube Dave’s Garage hovoří o čínském chatbotu s umělou inteligencí DeepSeek. Vysvětluje, v čem je DeepSeek tak výjimečný ve srovnání se svými konkurenty, jako je ChatGPT

Stejně jako ostatní LLM i DeepSeek filtruje své odpovědi na problematická témata a odmítne odpovědět například na otázku týkající se předpisu léků. DeepSeek také podléhá čínské státní cenzuře. UI se například vyhýbá vyjádřenímk masakru na náměstí Nebeského klidu, útlaku Ujgurů v oblasti Sin-ťiang nebo politické nezávislosti Tchaj-wanu.

Výpovědi obsahující jméno čínské hlavy státu Si Ťin-pchinga jsou rovněž zadržovány Tato cenzura je aktivně kontrolována čínským úřadem, ale lze jioklamatpoložením správných otázeknebo obejít pomocímístního provozu LLM.

Ferrari z náhradních dílů

DeepSeek byl voblasti školenímnohem levnější než ChatGPT a srovnatelné LLM. Nicméně faktor, o který by měl být skutečně levnější, je sporný

Bývalý zaměstnanec Microsoftu Plummer hovoří na svém kanálu na YouTube, stejně jako další zdrojeo necelých 6 milionech dolarů, které údajně do DeepSeek přitekly. To je zlomek miliard investovaných do modelů konkurence.Přesto může umělá inteligence držet krok s vlajkovými loděmi, jako je ChatGPT.

Vývojáři UI navíc údajně neměli přístup k nejnovějším čipům Nvidia Ostatně jejich výkon je prý natolik nedílnou součástí rozmachu UI, že seNvidia vyšvihla mezi nejcennější korporace. A to přestože hlavní produkt, pro který mnozí Nvidii znají, tedy herní grafické karty, patří jen ke vzdáleným favoritům společnosti

Podle Plummera je

DeepSeek jako

Ferrari postavené z náhradních dílů – stejně dobré, ale mnohem levnější.

Jako mistr a učeň

To je možné díky jinému typu školení. Stejně jako model, na kterém je založen ChatGPT, je i DeepSeek velkojazyčný model.Je to všakdistilovaný model(distilovaný model).

To znamená, že menší model je vycvičen s pomocí velkých modelů tak, aby poskytoval výsledky co nejpodobnější těm velkým – ale s mnohem menšími prostředky.

To znamená, že ačkoli obrovské modely mají stále větší znalostní bázi, menší model dosahuje ve většině aplikací téměř stejně dobrých výsledků.

Plummer to srovnává ve svém videu:

Je to, jako by mistr zaučoval svého učně – učeň nemusí umět všechno, ale práci zvládne stejně dobře.

Jedním z těchto mistrůbyl open source model Llama od společnosti Meta, ale také ChatGPT od OpenAI.

Tato destilace znalostí činí DeepSeek výrazně efektivnějším z hlediska zdrojů Také již nevyžaduje k provozu obrovský hardware se stovkami GPU v obrovských datových centrech, jako je tomu u velkých modelů

To však také vede Plummera k otázce:

Jestliže si můžete postavit Ferrari v garáži z dílů od Chevroletu, co to znamená pro hodnotu Ferrari?

Paměť počítačové revoluce

Pro drahé originální Ferrari to samozřejmě na první pohled neznamená nic dobrého

Pro uživatele je však výhodou, že mohou model spustit i lokálně na svém domácím hardwaru DeepSeek samozřejmě nelze spustit lokálně na každém malém pracovním notebooku. Plummer vyžaduje pro největší model DeepSeek procesor AMD Threadripper s grafickým procesorem Nvidia RTX 6000 (48 GB VRAM) Menší varianty dokonce běžely naMacBooku Pro

Připomíná mu tento vývoj dobu počítačové revoluce.

Připomíná mi to začátky osobních počítačů – nebyly tak dobré jako mainframy, ale změnily svět.

Když se počítače ještě považovaly za mainframy (Mainframy) pro podnikové aplikace, nikdo si nedokázal představit, že jednoho dne je bude mít každý doma za přijatelnou cenu.

Momentka ze Sputniku

Na rozdíl od revoluce v osobních počítačích je však dnes třeba zvážit i geopolitické důsledky DeepSeek je čínský model, který konkuruje zejména americkým společnostem ze Silicon Valley

Plummer to označuje za moment Sputniku Jedná se o narážku na sovětskou družici Sputnik, jejíž vypuštění v roce 1957 znamenalo začátek vesmírných závodů (Space Race) anovou fázi systémového soupeření mezi Sovětským svazem a Západem ve studené válce.

Podobně vede vývoj DeepSeek ke geopolitickému napětí, které odráží soupeření mezi USA jako technologickým hegemonem a Čínou jako nastupující světovou velmocí.

Toto technologické soupeření není jen bojem o inovace, ale také symbolem systémového soupeření mezi kapitalistickou demokracií USA a státním kapitalismem Číny.