DeepSeek está se tornando a “pedra no sapato do ChatGPT":
1) Primeiro textos. Agora, estão investindo em imagens.
2) Algumas horas atrás, o novo modelo "Janus" foi lançado.
Aqui está tudo o que você precisa saber:
1) Capacidades multimodais:
Lida tanto com geração de imagens a partir de texto (resolução de 384x384) quanto com tarefas de análise visual.
2) Arquitetura escalável:
Disponível em versões de 1 bilhão e 7 bilhões de parâmetros (com o modelo de 7B sendo o carro-chefe).
3) Disponibilidade de código aberto:
Lançado sob a licença MIT para uso comercial.
4) Custo eficiente:
Treinado em algumas centenas de GPUs ao longo de 7 a 14 dias.
5) Estabilidade aprimorada:
Produz resultados mais consistentes que modelos anteriores, graças a técnicas de treinamento aprimoradas.
Disponibilidade e Integração:
-Demo hospedada: Disponível no Hugging Face Spaces.
-Instalação local: Pacote Python com API simples.
DeepSeek está mostrando ao mundo que a OpenAI e seus concorrentes americanos não têm uma vantagem específica.
DeepSeek é opensource, incrivelmente barato (96% mais barato) e pode ser executado localmente (hospedado nos EUA).
Nota:
O modelo Janus, desenvolvido pela DeepSeek e disponibilizado na
plataforma Hugging Face, ainda não está disponível para uso geral.
Atualmente, o modelo Janus-Pro-7B e outras variações estão em fases de
testes e desenvolvimento, com acesso limitado principalmente para fins
acadêmicos e de pesquisa.
0 Comentários