
A DeepSeek é uma empresa chinesa de inteligência artificial fundada em 2023 por Liang Wenfeng, com sede em Hangzhou, Zhejiang. A empresa desenvolve modelos de linguagem de grande escala de código aberto, visando tornar a inteligência artificial geral (AGI) uma realidade. É financiada exclusivamente pelo fundo de hedge chinês High-Flyer.
Em 2 de novembro de 2023, a DeepSeek lançou seu primeiro modelo, o DeepSeek Coder, disponível gratuitamente para pesquisadores e usuários comerciais. Em 29 de novembro de 2023, apresentou o DeepSeek LLM, com modelos de 7 bilhões e 67 bilhões de parâmetros, desenvolvidos para competir com outros modelos de linguagem de grande escala da época, aproximando-se do desempenho do GPT-4.
Em maio de 2024, a empresa lançou o DeepSeek-V2, um modelo de linguagem que se destacou por seu custo-benefício, sendo mais barato que seus concorrentes, com um preço de 2 RMB para cada milhão de tokens gerados. Em dezembro de 2024, foi introduzido o DeepSeek-V3, com 671 bilhões de parâmetros, treinado em aproximadamente 55 dias a um custo de US$ 5,58 milhões, utilizando significativamente menos recursos em comparação com seus pares. Este modelo superou outros como o Llama 3.1 e o Qwen 2.5, igualando o GPT-4o e o Claude 3.5 Sonnet em testes de benchmark.
Em 20 de janeiro de 2025, a DeepSeek lançou os modelos DeepSeek-R1 e DeepSeek-R1-Zero, baseados no V3-Base. O R1-Zero foi treinado exclusivamente usando aprendizado por reforço, sem qualquer ajuste fino supervisionado. Esses modelos foram projetados para tarefas de inferência lógica, raciocínio matemático e resolução de problemas em tempo real.
A DeepSeek disponibiliza seus modelos e produtos através de diversas plataformas, incluindo um aplicativo móvel, uma interface de chat e uma plataforma de API para desenvolvedores. A empresa enfatiza o compromisso com o código aberto, permitindo que a comunidade acesse, modifique e utilize seus modelos livremente.
Recentemente, a DeepSeek ganhou destaque ao superar o ChatGPT como o aplicativo gratuito mais baixado na App Store dos EUA, indicando uma crescente influência no mercado de IA.
A empresa enfrentou críticas relacionadas a mecanismos de censura integrados em seus modelos, especialmente em tópicos politicamente sensíveis para o governo chinês. Por exemplo, o modelo se recusa a responder perguntas sobre os protestos da Praça Tiananmen de 1989, a perseguição aos uigures ou direitos humanos na China.