• AiDrop
  • Posts
  • 🤖 Claude 3.7: Demorou, mas voltou

🤖 Claude 3.7: Demorou, mas voltou

+ Os Casos de Uso: Sicoob, Call of Duty, Gov. do Reino Unido e mais...

Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: os pesquisadores do Google desenvolveram um sistema matemático de IA capaz de superar os medalhistas de ouro em competições internacionais de geometria. Enquanto o medalista olímpico humano resolveu, em média, 81.8% das questões das olimpíadas, o AlphaGeometry2 resolveu 84%.

No drop de hoje, repetindo a palavra “Reasoning” diversas vezes:

  • Anthropic: demorou, mas voltou - chegou o Claude 3.7

  • Nvidia e Arc: decifrando o código da vida

  • Vídeos de IA: caros ou uma pechincha?

  • Os Casos de Uso: Líderes de cibersegurança, Sicoob, Call of Duty, Honor, Perfect, Gov. do Reino Unido

  • Me explique como se eu fosse uma criança: Como são calculados os parâmetros de um modelo de IA?

Seu trabalho não será substituído por uma Inteligência Artificial, mas por alguém utilizando Inteligência Artificial. Quer ficar por dentro da década de avanços que rolam no universo de IA todas as semanas? Assina o AiDrop e te contamos tudo, sem tecniquês, todas as quintas-feiras no seu inbox.

Claude 3.7: demorou, mas voltou

anthropic, claude, llm, claude code, sonnet

A Anthropic não está em uma posição fácil. A OpenAI já virou top-of-mind e tem 50x mais poder de marca e distribuição. A xAI tem uma plataforma com centenas de milhões de usuários ao seu dispor. O Google tem uma quantidade infinita de dados e capital. Apesar das adversidades, a Anthropic seguiu firme na missão e lançou seu modelo mais inteligente até hoje, o Claude 3.7 Sonnet - chamado de Paprika.

O novo modelo demorou, mas não tardou nem desapontou:

  • Implementou o Reasoning, passando mais tempo pensando na resposta antes de responder;

  • O modo de pensamento estendido dá ao modelo um impulso adicional em matemática, física, seguimento de instruções, codificação e muitas outras tarefas;

  • Os usuários da API têm controle preciso sobre quanto tempo o modelo pode pensar;

  • No benchmark de Engenharia de Software, atingiu 70,3% de desempenho, contra os ~49% da concorrência (o1, o3-mini-high e DeepSeek R1);

  • Redução da censura, diminuindo esse comportamento em 45%.

Além dos recursos do modelo, a Anthropic lançou o Claude Code: uma interface criada para programadores e desenvolvedores adicionarem o LLM dentro do projeto, podendo editar códigos a partir de prompts de forma nativa. Nos primeiros testes, Claude Code concluiu tarefas em uma única execução que normalmente levariam +45 minutos de trabalho manual.

E para fechar com chave de ouro a bateria de novidades da não-mais-adormecida Anthropic, a empresa está levantando uma rodada de investimento que pode injetar U$ 3,5 bilhões no caixa e avaliá-la em U$ 61,5 bilhões.

🤖 Casos de Uso

  • Líderes de cibersegurança do setor financeiro afirmam estar usando IA para aplicações, representando 67% da parcela do setor.  

  • Sicoob adotou a IA generativa da DeepSeek, utilizando o modelo R1 para melhorar a interação com documentos do Sisbr.

  • Call of Duty admitiu estar usando assets gerados por IA dentro da franquia depois de um layoff de 1900 humanos em 2023.

  • Honor, empresa chinesa de celulares, usou IA para restaurar fotos históricas do Old Trafford, estádio do Manchester United.

  • Perfect usou IA para otimizar o recrutamento, reduzindo vieses e tornando as contratações mais eficientes.

  • Governo do Reino Unido lançou um guia de IA para melhorar o uso da tecnologia em serviços públicos.

Trending:

Seguindo a tendência, Alibaba lançou o QwQ-Max-Preview (versão de reasoning) para o seu modelo mais forte, Qwen-2.5-Max.

Você pode usar ele de graça na plataforma oficial, além de criar imagens e vídeos por lá.

Nvidia e Arc: decifrando o código da vida

nvidia, arc institute, evo 2, biologia, genética

Resolver contas de matemática, criar aplicativos sem precisar de código, gerar imagens e vídeos próximos da perfeição, ajudar no planejamento daquela viagem dos sonhos… A maioria dos casos de uso das versões iniciais de modelos de IA era relativamente sedutora. Relativamente porque, imagine quando as IAs criarem novos medicamentos, vacinas e curarem doenças. Na verdade, não precisa nem imaginar…

A Nvidia e a Arc Institute apresentaram o Evo 2: o maior modelo de ML de biologia (por treinamento computacional) de todos os tempos e um dos maiores modelos de ML de código aberto de todos os tempos, em qualquer categoria.

O novo e poderoso Evo 2 compreende o código genético para todos os domínios da vida:

  • Desenvolvido para analisar informações genéticas;

  • Treinado na Nvidia DGX Cloud;

  • Capaz de destrinchar DNAs, RNAs e proteínas de várias espécies;

  • Identifica variantes patogênicas, como as do BRCA1 (câncer de mama).

O que pode representar o maior avanço científico para a biologia até hoje, a Nvidia divulgou dois modelos, um de 7B e outro de 40B parâmetros, com janela de contexto de 1mi de tokens, suportando quantidades massivas de informações. E para a alegria de Jack Dorsey e de Zuckerberg: o modelo é open-source, disponível no BioNeMo e acessível para toda a comunidade científica e qualquer pessoa interessada

Nos primeiros testes, além de impactar a biotecnologia agrícola e o design de novos materiais, ele também já ajudou a anotar o genoma do mamute-lanoso, mostrando sua capacidade de interpretar a evolução genética.

Me explique como se eu fosse uma criança:

Como é feito o cálculo da quantidade de parâmetros de um modelo de IA?

Os parâmetros de uma IA são ajustes que definem como ela processa informações, calculados com base na quantidade de neurônios e conexões entre eles.

Um modelo com 40B de parâmetros já tem grande capacidade de análise, enquanto um com 2 trilhões pode lidar com volumes massivos de dados, mas exige muito mais poder computacional.

O número total de parâmetros é estimado multiplicando os neurônios de uma camada pelos da próxima.

Ex: Um modelo de 7B de parâmetros pode ter cerca de 30k neurônios/camada, conectados a outros 30k neurônios, resultando em quase 1B de parâmetros/camada (30k × 30k).

🤖 Novidades em IA

  • OpenAI disponibilizou o Operator para usuários ChatGPT Pro utilizarem ao redor do mundo, inclusive nosso Brasilzão.

  • Perplexity AI anunciou que está desenvolvendo o Comet, um navegador com IA integrada.

  • Grok 3 agora conta com Voice Mode na versão SuperGrok/Premium+ e conta com uma personalidade escrachada adicional.

  • 1X apresentou seu mais novo robô humanoide companheiro de casa para tarefas domésticas.

  • MidJourney fez um update na plataforma e agora os usuários podem criar pastas para salvar suas imagens - recurso novo para uma necessidade antiga.

  • Google anunciou o Gemini Code Assist, extensão para o VS Code, com 180k code completions por mês, de graça.

Vídeos com IA são tão caros?

veo 2, google, video gen, avengers, kling, sora

O revolucionário Charlie Chaplin foi um dos pioneiros do cinema mudo e em preto e branco. Quase cem anos após o lançamento de seus filmes, a indústria do audiovisual passa por mais uma transformação. Dessa vez, com abundância de cores, vozes, frames e um preço de dar arrepios inveja à indústria Hollywoodiana.

  • O Google, sem muito alarde, anunciou o preço do seu modelo de vídeo VEO 2: U$0,50 centavos por segundo.

  • Para fins de comparação, o custo de produção do último filme dos Vingadores (Avengers) foi de U$32.000 por segundo.

  • Já o modelo Kling 1.6, com resultados muito próximos, se manteve nos seus U$0,07/seg.

  • A OpenAI seguiu outro caminho e incluiu o Sora com +500 gerações mensais no seu plano de U$200/mês.

Provavelmente nenhum filme será produzido inteiramente usando IA e nem todos os segundos de vídeo de IAs gerados serão utilizados. Possivelmente, não haverá greves de roteiristas suficientes para convencer o financeiro a não optar por uma solução até ~99,998x mais barata.

cAIxa da Semana

  • Hailuo Chat, um LLM fresquinho para você usar no dia a dia.

  • IC Light V2, troque o plano de fundo e a iluminação das suas fotos.

  • Google Code Assist, tenha um parceiro de coding do seu lado.

  • AI Suit Up, gere retratos profissionais seus em poucos cliques.

  • ScanRelief, escaneie suas notas fiscais e planilhe usando a API da OpenAI.

MEME

A internet em ~3 dias

O que achou da edição de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

 

Natal chegou mais cedo

Você gostou do AiDrop e está aí, quietinho, sem contar para ninguém? Você é aquele tipo que guarda a última fatia de pizza só pra você, né? Indique a gente e, como recompensa (não, não estamos de brincadeira), vamos enviar PRESENTES direto para a sua casa.


Compartilha seu link de indicação nos stories do instagram, bota no grupo do zap e ainda chama a galera do LinkedIn pra te ajudar, vai!

Nesse momento, você tem 0 indicações.

Você precisa de mais 3 para ganhar cAIxa de ferramentas.

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau as assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

Antes de ir embora… arraste este e-mail para sua lista prioritária, assim você não perde nenhum drop e nós não travamos na alfândega da web caixa de spam. Ah, pode nos responder também, lemos tudinho.

Reply

or to participate.