Tópico dedicado à API e ao modelo DeepSeek, cobrindo desde o…
INEMA
olha as dicas de apis
api-docs.deepseek.com/news/news0725 ↗
A DeepSeek lançou recentemente o modelo DeepSeek-V3-0324, trazendo melhorias significativas em várias áreas:
-
Aprimoramento no desempenho de raciocínio: O modelo agora oferece uma capacidade de raciocínio mais robusta, permitindo lidar com tarefas complexas de maneira mais eficaz.
-
Habilidades avançadas em desenvolvimento front-end: O DeepSeek-V3-0324 demonstra competências aprimoradas em tarefas relacionadas ao desenvolvimento de interfaces de usuário, facilitando a criação de aplicações web mais sofisticadas.
-
Capacidades mais inteligentes no uso de ferramentas: O modelo apresenta uma utilização mais eficiente e inteligente de diversas ferramentas, otimizando processos e melhorando a produtividade em diferentes contextos.
Para tarefas de raciocínio não complexas, é recomendado utilizar o V3 com a opção "DeepThink" desativada. Além disso, a utilização da API permanece inalterada, e os modelos agora são disponibilizados sob a licença MIT, assim como o DeepSeek-R1. Os pesos do modelo estão disponíveis em código aberto no Hugging Face:
Essas atualizações reforçam o compromisso da DeepSeek em oferecer modelos de IA avançados e acessíveis à comunidade.
api-docs.deepseek.com/news/news250325 ↗
os paramentos de temperatura sao diferentes olha so
calculo de tokens api-docs.deepseek.com ↗
o Deepseek nao faz Threads , entao se quiser manter as conversas anteriores mvoce tme ter informacoes armazenadas e enviar cada vez tudo
Tem muitas boa informacoes
preco aumentando agora dia 8/2/2025
api-docs.deepseek.com/quick_start/pricing ↗
Tem muitoas boas INformacoes nestes documentos
voce tem fazer o teu finituning se quiser
ele tem processado o treinamento dele.
Esse anúncio apresenta o modelo DeepSeek V3, que está causando grande impacto no mundo da inteligência artificial por sua eficiência e desempenho superior. Aqui estão os pontos principais destacados:
-
Desempenho em benchmarks: - Math 500 Benchmark: Pontuação de 90.2%, superando significativamente o GPT-4.0 (74.6%). - Codeforces: Obteve 51.6%, mais que o dobro do desempenho de modelos concorrentes como GPT-4.0 e Claude. - Polyglot Benchmark: Dominou quase todos os modelos, exceto o OpenAI O1.
-
Eficiência revolucionária: - Desenvolvido com apenas 2.000 GPUs, comparado às mais de 100.000 usadas por outras empresas. - Modelo possui 671 bilhões de parâmetros, mas utiliza apenas 37 bilhões de cada vez, garantindo rapidez e eficiência. - Processamento de 60 tokens por segundo.
-
Custo-benefício e acessibilidade: - Disponível gratuitamente para uso em chat.deepseek.com. - Pode ser auto-hospedado. - API com preços competitivos até 8 de fevereiro: $0,27 por milhão de tokens de entrada e $1,10 por milhão de tokens de saída.
-
Impacto tecnológico: - Desempenho de ponta utilizando recursos otimizados, comparado a uma metáfora de "bater uma Ferrari com um Toyota".
Esse modelo redefine os padrões de eficiência e custo na inteligência artificial, especialmente em áreas como matemática e programação. Vale a pena explorar e acompanhar os avanços futuros.
7
6
5
4
3
1