Críticas

A startup chinesa de IA DeepSeek ganha rápida popularidade global

chinese-ai-startup-deepseek-gains-rapid-global-popularity

Startup chinesa de IA DeepSeek A DeepSeek, Inc. rapidamente chamou a atenção global depois que seu chatbot alcançou o primeiro lugar nas paradas da App Store da Apple e do Google Play. O surgimento do DeepSeek, impulsionado por metodologias avançadas e econômicas de treinamento de IA, fez com que analistas de Wall Street e veteranos do setor questionassem a supremacia contínua dos Estados Unidos no setor de IA, bem como as implicações futuras para a demanda de processadores específicos de IA.

Essa popularidade repentina provoca a pergunta de como exatamente essa empresa, antes obscura, alcançou tal proeminência em um setor lotado e sobre quais bases ela foi construída. É interessante notar que a DeepSeek é apoiada financeiramente pela High Flyer Capital Management, um fundo de hedge chinês conhecido por integrar a inteligência artificial em suas estratégias de investimento.

Criada em 2015 pelo entusiasta de IA Liang Wenfeng, a High Flyer começou inicialmente como uma iniciativa de negociação quantitativa. Wenfeng, que explorou pela primeira vez métodos de negociação algorítmica durante seus anos acadêmicos na Universidade de Zhejiang, expandiu a High Flyer para um fundo de hedge completo em 2019, aproveitando algoritmos sofisticados de IA para pesquisa e investimento financeiro.

Em 2023, a empresa se separou de suas raízes financeiras, estabelecendo a DeepSeek como um laboratório de pesquisa independente totalmente focado no desenvolvimento de soluções inovadoras de inteligência artificial. Logo após sua criação, a DeepSeek se separou completamente, tornando-se uma entidade autônoma que rapidamente construiu instalações de dados proprietárias para avançar seus recursos e ambições de treinamento.

No entanto, seu crescimento e suas ambições internacionais não foram isentos de desafios significativos, principalmente devido às rigorosas restrições de exportação dos EUA que afetam a aquisição de hardware na China. Especificamente, a DeepSeek enfrentou obstáculos para acessar chips de primeira linha, como as poderosas GPUs H100 da Nvidia, forçando a empresa a confiar nos chips H800 da Nvidia, ligeiramente inferiores, especificamente sancionados para exportação para empresas chinesas.

Internamente, a DeepSeek priorizou a contratação de talentos mais jovens, recrutando pesquisadores de nível de doutorado diretamente das universidades de grande prestígio da China, conhecidas pela excelência em IA. Notavelmente, eles também integram equipes de diversas origens disciplinares para garantir que os produtos da empresa mantenham um entendimento e uma funcionalidade mais amplos em várias áreas de conhecimento, conforme destacado por um artigo recente de uma publicação renomada.

A rápida evolução dos modelos de IA da DeepSeek

A DeepSeek causou impacto publicamente com sua primeira linha de modelos, incluindo o DeepSeek LLM, o DeepSeek Chat e o DeepSeek Coder, inicialmente apresentados em novembro de 2023. No entanto, foi o lançamento subsequente de seus modelos DeepSeek V2, vários meses depois, que abalou significativamente o mundo da tecnologia, com avanços significativos em eficiência de custo e desempenho em comparação com as ofertas existentes dos concorrentes.

A chegada do DeepSeek V2 até mesmo forçou os principais concorrentes chineses, como ByteDance e Alibaba, a reduzir drasticamente os preços, com alguns serviços de modelo de IA tornando-se acessíveis gratuitamente depois disso. A dinâmica da empresa se acelerou ainda mais com o lançamento de seu modelo principal de terceira geração, o DeepSeek V3, em dezembro de 2024, posicionando-se como líder em tecnologia de IA acessível e de alto desempenho.

A DeepSeek afirma que as avaliações internas de benchmark sugerem que o mais recente DeepSeek V3 supera significativamente os modelos acessíveis ao público, como o Llama da Meta, e as opções proprietárias, como o GPT 4o da OpenAI. Reforçando ainda mais esse crescimento notável, em janeiro de 2025, a empresa lançou o DeepSeek R1, um modelo especializado de IA de raciocínio projetado para produzir respostas altamente precisas e meticulosamente consideradas, comparáveis em qualidade e precisão ao renomado modelo o1 da OpenAI.

Um ponto forte notável do modelo de raciocínio do DeepSeek, R1, é sua capacidade inovadora de autoverificação, que permite reduzir as imprecisões comuns frequentemente observadas nos modelos tradicionais. No entanto, sua precisão e minúcia aprimoradas contrastam com um tempo de geração de resposta um pouco mais longo, que se estende por vários segundos ou até minutos além das contrapartes padrão, embora melhore consideravelmente a confiabilidade em áreas tecnicamente exigentes, como ciência, física ou disciplinas matemáticas.

Apesar dos impressionantes avanços tecnológicos, existe uma desvantagem inerente associada aos modelos do DeepSeek devido às suas origens chinesas. As regulamentações de Internet do governo chinês exigem avaliações rigorosas do DeepSeek para garantir que as respostas sigam estritamente os valores políticos oficialmente sancionados, resultando ocasionalmente em respostas de chatbot altamente restritas sobre assuntos delicados, como a autonomia de Taiwan ou a Praça Tiananmen.

A análise de tráfego de março demonstra ainda mais o perfil crescente do DeepSeek, alcançando mais de 16,5 milhões de visitas ao site, apesar de o tráfego ter diminuído ligeiramente mês a mês. No entanto, sua pegada estimada de clientes permanece fortemente ofuscada pelo ChatGPT da gigante do setor OpenAI, que ultrapassou 500 milhões de sessões ativas semanais durante o mesmo período.

No momento, a DeepSeek permanece em sigilo em relação a uma estratégia de monetização definida, mantendo os produtos com preços abaixo do nível do mercado ou até mesmo lançando-os abertamente sem qualquer apelo financeiro para investimento de capital de risco, apesar do evidente entusiasmo dos investidores. Os representantes da empresa atribuem sua competitividade principalmente às otimizações de eficiência, embora os analistas externos continuem questionando os números de viabilidade financeira fornecidos.

Ainda assim, o envolvimento do desenvolvedor destaca o apelo do DeepSeek, com mais de 500 iterações derivadas do modelo R1 baixadas aproximadamente 2,5 milhões de vezes no Hugging Face, uma comunidade e plataforma para Modelos de IA hospedagem. Esse sucesso dramático atraiu reações de alto nível, incluindo uma queda notável de 18% na avaliação das ações da Nvidia em janeiro passado e comentários abertos de executivos seniores de empresas como Nvidia, Microsoft e Meta sobre considerações estratégicas ligadas à relevância crescente do DeepSeek.

Simultaneamente, as preocupações geopolíticas se destacam, fazendo com que várias organizações, incluindo os principais governos e instituições globais, proíbam totalmente os aplicativos DeepSeek em dispositivos oficiais. Os Estados Unidos examinaram publicamente o DeepSeek, enquanto o Estado de Nova York e a Coreia do Sul anunciaram proibições, citando possíveis preocupações com a segurança nacional e influência internacional indevida.

Portanto, apesar da proeminência crescente e do progresso tecnológico substancial, a incerteza obscurece a trajetória futura da DeepSeek em relação à regulamentação internacional, à dinâmica do mercado e à possível reação negativa em meio à concorrência geopolítica. O modo como a DeepSeek supera esses obstáculos acabará definindo sua viabilidade de longo prazo e seu impacto global na inovação da IA.

COMPARTILHAR

Adicionar um comentário

Isso fica melhor no aplicativo

Usamos cookies para melhorar sua experiência em nosso site. Se você continuar a usar este site, presumiremos que está satisfeito com ele.

Login / Registro

Participe da maior comunidade de IA e descubra as mais recentes ferramentas de IA, tutoriais úteis e ofertas exclusivas.