DeepSeek em todo o lado: O que é e quais são as capacidades do concorrente viral do ChatGPT?

0
2

Este chatbot está atualmente a tomar de assalto milhões de telemóveis, browsers e PCs. Pode saber tudo sobre ele aqui

Descobriu-se de um dia para o outro: DeepSeek. Por um lado, o nome pertence ao criador chinês especializado em inteligência artificial. É também o nome do seu chatbot apoiado por IA.
O

DeepSeek é uma alternativa séria a modelos como o ChatGPT, Gemini e semelhantes e já está a causar grande agitação, por exemploem Nvidia

Especialmente excitante: o DeepSeek já alcançou ou até ultrapassou o ChatGPTem termos de downloads nas lojas de aplicações. Mas o que torna o DeepSeek tão popular entre os utilizadores e o que é que o bot pode fazer exatamente?

As respostas que contenham o nome do chefe de Estado chinês, Xi Jinping, também são recusadas. Esta censura é ativamente monitorizada por uma autoridade chinesamas podeser enganadacom a pergunta certaou contornada pelaoperação local do LLM.

DeepSeek: Caraterísticas e razões para o entusiasmo

Os gráficos de download na App Store e as discussões animadas no Redditindicam que o DeepSeek é muito popular entre os utilizadores. Há várias razões para isso:

1 Funções gratuitas e versáteis

DeepSeek oferece o seu chatbot de IA gratuitamente no site oficial – sem subscrições, sem custos ocultos. Em alternativa, existe também uma aplicação para utilizadores móveis (iOS&Android) e para o PC.

A IA funciona em tempo real, responde a perguntas, explica temas complexos, analisa documentos e ajuda na programação. Também é capaz de criar conteúdos – desde artigos e poemas a modelos estruturais.

Como o conhece do ChatGPT.

Mas a IA pode fazer ainda mais: Se utilizar o Modelo de raciocínio R1, pode ver o processo de pensamento pelo qual o chatbot passa. Isto permite-lhe compreender melhor o resultado, obter mais informações e melhorar as suas capacidades de resposta, percebendo a que afirmações o bot reage e como

Além disso, o gerador de imagens do DeepSeek já está disponível no Github e espera-se que em breve seja integrado na aplicação.

2. código aberto em vez de caixa preta

Uma das maiores vantagens do DeepSeek é a sua abertura. O código é completamente aberto, o que significa que os programadores e investigadores podem visualizá-lo livremente, adaptá-lo e até utilizá-lo para fins comerciais

Se estiver interessado:Aqui está a página do Github

Em contrapartida, existem outros fornecedores cujos modelos de IA funcionam em sistemas opacos e têm termos de utilização rigorosos. O DeepSeek mostra que o código aberto não é automaticamente inferior: Em testes, o modelo provou que consegue acompanhar as melhores alternativas privadas.
Dois modelos que estão a causar furor

3.

Os dois principais modelos de IA da DeepSeek, nomeadamente o V3 e o modelo de raciocínio R1, são particularmente impressionantes em testes de matemática, programação e problemas com palavras.
Uma coisa em particular está a causar sensação: o bom desempenho em comparação com o ChatGPT, que foi alcançado a custos comparativamente extremamente baixos. Este facto é interessante tanto para a economia como para os programadores. Isto deve-se ao facto de os custos de utilização da API do DeepSeek serem significativamente mais baixos do que os do ChatGPT.

E nós, utilizadores?Podemos utilizar a IA da China gratuitamente e, mais cedo ou mais tarde, beneficiaremos do facto de o DeepSeek aumentar a pressão (de preços) sobre concorrentes como o ChatGPT, o Gemini e o Claude. Desde que o entusiasmo se transforme em interesse permanente a longo prazo.

Aqui estão os pormenores:

  1. DeepSeek V3:

    • Referências fortes: O Large Language Model (LLM) superou o Llama 3.1 e o GPT-4o em referências como tarefas de programação.
    • Formação económica: A formação da V3 terá custado apenas 5,5 milhões de dólares americanos, em comparação com os 80 milhões da OpenAI.
    • Tokens favoráveis: Também impressionante: 1 milhão de tokens custa apenas 55 cêntimos, enquanto a OpenAI cobra 15 dólares pela mesma quantidade.

  1. DeepSeek R1:

    • Referências fortes: O R1 impressiona com um desempenho extraordinário na área do raciocínio lógico e supera outros modelos em testes matemáticos como o MATH-500.
    • Aprendizagem por reforço puro: A capacidade do R1 para dominar tarefas de matemática, código e raciocínio é possível graças à utilização deaprendizagem por reforço puro. Esta técnica permite que o modelo de IA aprenda de forma autónoma e tome decisões com base no ambiente e nos incentivos. Um marco técnico.
    • Eficiência de custos: Isto torna-o no primeiro modelo chinês de fonte aberta a funcionar em pé de igualdade com os líderes de mercado, com custos 90 a 97 por cento mais baixos.

Mas atenção: Algunsanalistas salientamque o valor real da empresa chinesa não é conhecido, pelo que não podemos dizer com certeza se estas afirmações são verdadeiras.

E esse não é o único problema com o DeepSeek.

Um chatbot com um lado negro?

Como muitos modelos de IA, o DeepSeek também reflecte os valores do seu país de origem. O chatbot segue as diretrizes do governo chinês, o que significa que temas políticos ou sensíveis como Tiananmen ou a autonomia de Taiwan não são respondidos.

Em geral, as perguntas sobre violações dos direitos humanos na China não são respondidas

No entanto, esta censura só se aplica à versão online. Aqueles que operam o DeepSeek localmente têm um controlo sem restrições!

O que achas do DeepSeek? Já o experimentaste? Como você acha que ele se compara ao ChatGPT e similares?

Você acha que o país de origem do DeepSeek é problemático? Deixe-nos saber a sua opinião nos comentários! Por favor, mantenha a discussão objetiva e tenha consideração pelos outros