• AiDrop
  • Posts
  • 🤖 IAdvogadas de defesa no tribunal virtual

🤖 IAdvogadas de defesa no tribunal virtual

+ Casos de uso da Hapvida, Cientistas, China, Google, Funti3r, Gamut e mais...

aidrop-logo

Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: o Google decidiu descer o sarrafo em anúncios fraudulentos e usou IA para detectar e suspender 39,2 milhões de contas em 2024 – mais do que o triplo do ano anterior.

No AiDrop de hoje, repetindo a palavra XPTO trocentas vezes:

OpenAi: os novos membros da família SOTA
 Google: quer falar com golfinhos usando IA
 Game Arena: as IAdvogadas de defesa no tribunal virtual
 Casos de uso: Hapvida, Cientistas, China, Google, Funti3r, Gamut
 Prompt Like a Pro: Faça seu próprio Action-Figure

divider
MODELO

Os novos membros da família SOTA

openai, o4, o3, codex cli, windsurf, copilot, código

capa-materia-1

Acompanhar todos os lançamentos da OpenAI esta semana tornou-se praticamente um trabalho de tempo integral. De novas ferramentas para desenvolvedores a novos modelos de reasoning, conheçam os novos brinquedinhos do ChatGPT:

Começando com a nova família o3 e o4 que, pela primeira vez, podem usar e combinar, de forma agenciada, todas as ferramentas do ChatGPT, incluindo pesquisa na web, Python, análise de imagens, interpretação de arquivos e geração de imagens:

  • o4-mini: mesmo preço do o3-mini na API porém trazendo melhor desempenho.

  • o4-mini-high: uma versão do o4-mini com mais esforço de pensamento. Ele não aparece na API, mas está na plataforma do ChatGPT.

  • o3-high: o modelo completo, antes somente utilizado no Deep Research.

O maior salto nessa geração de modelos foi a relação custo x performance, que ao longo do tempo conseguiu reduzir o custo de inferência do o3-high para abaixo do o1-high, mesmo com resultados consideravelmente melhores (e isso também vale para o o4-mini).

Além dos novos modelos, a OpenAI também lançou o Codex CLI, um agente de codificação local open-source que transforma linguagem natural em código funcional. Ao invés de usar códigos, basta descrever em palavras que o Codex CLI constrói, corrige, explica e dá vida aos projetos.

Mas não parou por aí. Rumores surgiram de que a OpenAI esteja em negociação para adquirir a ferramenta de codificação assistida por inteligência artificial Windsurf (anteriormente conhecida como Codeium) por ~US$ 3 bilhões, deixando a corrida contra dos assistentes de código ainda mais acirrada: Claude Code (da Anthropic, mais caro), Cursor (da Anysphere, avaliado em $10bi), GitHub Copilot (da Microsoft).

Como o próprio Sam já afirmou: se perguntarmos para os pesquisadores da OAI a definição de AGI, teríamos dezenas de respostas diferentes. Qualquer que seja a resposta, construir a primeira AGI segura é a principal missão da startup e tudo indica que ela esteja cada vez mais próxima. Chegamos no nível 4?

MODELO

Google falando com golfinhos

golfinhos, dolphin gemma, google, falando com animais

Golfinhos estão entre as criaturas mais inteligentes do planeta terra. Infelizmente, não são inteligentes o suficiente para se comunicar no idioma humano. Mas a barreira da comunicação entre humanos e golfinhos está prestes a acabar com esse novo projeto do Google, anunciado no dia nacional dos golfinhos, o DolphinGemma.

O primeiro modelo LLM construído com objetivo de falar com os animais, mais especificamente, entender e codificar e até falar a linguagem dos golfinhos. Ele possui ~400mi parâmetros e foi treinado usando décadas de gravações subaquáticas do projeto Wild Dolphin de Bahamas.

Com o SoundStream tokenizando sons com uma arquitetura enxuta o bastante para rodar direto em um celular Pixel 9, o DolphinGemma prevê o próximo clique do mesmo jeito que LLMs antecipam palavras. O resultado? Uma pesquisa de campo mais rápida e (muito) mais barata.

  • A base de dados reúne quatro décadas de áudio + vídeo vinculados a cada golfinho, criando uma árvore genealógica acústica sem precedentes;

  • O modelo reconhece em tempo real os signature whistles — “nomes próprios” usados por mães para chamar os filhotes;

  • Detecta pulsos de gritos furiosos de briga, permitindo mapear conflitos no grupo em segundos;

  • Capta os zumbidos típicos de cortejo, ou anúncios de ameaças, como um tubarão, abrindo novas frentes para estudos de comportamento;

  • Todo o processamento cabe em um Pixel 9 selado num colete de mergulho.

A mesma tecnologia alimenta o sistema CHAT: um kit de hidrofone + Google Pixel que, em tempo real, identifica quando um golfinho imita um “assovio‑palavra” e avisa o pesquisador via fones de condução óssea para entregar o objeto pedido (um lenço, alga, bola…). Essa troca rápida serve de reforço positivo e é o primeiro passo para um vocabulário compartilhado entre humanos e golfinhos. ​

Se der certo, a fronteira entre “ouvir” e “conversar” com a vida marinha pode ficar tão fina quanto os novos macbooks e o seu próximo mergulho pode se tornar um bom papo de boteco oceano.

P.S. Esperamos que nunca identifiquem um "Até mais, e obrigado pelos peixes"!

CASOS DE USO
  • Hapvida: adotou um sistema de IA que apoia médicos na classificação de doenças durante as consultas de urgência.

  • Cientistas: desenvolveram um sistema de IA para monitorar áreas perigosas ou inacessíveis em instalações nucleares, aumentando a segurança.

  • China: está integrando IA na sua reforma educacional, visando modernizar o ensino e personalizar a aprendizagem.

  • Funti3r: está usando IA para conectar talentos globais a empresas internacionais, melhorando recrutamentos.

  • Gamut Podcast Network: adotou a plataforma de IA da Magellan para otimizar crescimento e monetização de sua rede de podcasts.

trending

TabTabTab: a ferramenta que é o que a Apple Inteligência deveria ter sido.

Essa ferramenta injeta esteroides no Copiar e Colar do seu Mac, entendendo o contexto do que foi copiado e completando o que for colado de forma inteligente.

NOVIDADES EM IA
  • Claude: agora pode buscar na web na assinatura Pro e integrar sua conta do Google (calendário, e-mails etc).

  • Microsoft: Copilot agora pode realmente enxergar o que se passa na sua tela dentro do Edge.

  • Gemini: liberou o compartilhamento de tela dentro do Gemini Live para usuários gratuitos.

  • Grok: recebeu um update na memória e possui agora 128k de contexto para acumular sobre você.

  • ChatGPT: agora separa as imagens criadas em uma aba “Mídia” dentro da própria plataforma.

  • Meta: vai começar a treinar sua IA com dados de usuários da União Europeia, mas os usuários poderão optar por sair.

  • Google: adicionou o seu modelo de videos, VEO 2, dentro do Gemini, e agora a plataforma é capaz de gerar vídeos em até 720p.

LLMs

IAdvogadas de defesa no tribunal virtual

ia, benchmak lm game arena, advogado de defesa, tribunal

capa-materia-3

“Prever a próxima palavra com precisão é como conseguir adivinhar quem é o assassino no final do livro — se você acerta, é porque entendeu a história inteira”

Ilya Sutskever

Inspirados nesta definição do godfather dos LLMs, o time da Hao AI Lab decidiu criar um desafio para os modelos competirem entre eles, tentando descobrir quais teriam competência para se tornarem detetives profissionais, dando origem ao Benchmark LM Game Arena.

Inspirado no jogo Phoenix Wright: Ace Attorney, o teste funciona assim: o modelo assume o papel de advogado de defesa no interrogatório e precisa detectar contradições no depoimento da testemunha e apresentar a prova certa antes de gastar as cinco vidas disponíveis em cada caso.

Os 4 pesos pesados que entraram no ringue tribunal das LLMs foram:

  • o1: foi o primeiro colocado, chegando no Level 4 com uma vida sobrando, porém, custou 5x mais que o segundo colocado.

  • Gemini 2.5: o segundo colocado também chegou no Level 4, com zero vidas, e custou ~US$ 7, enquanto o o1 foi ~US$ 45.

  • GPT 4.1: chegou no Level 3 e praticamente empatou com o Claude3.7-Thinking.

  • Llama-4 Maverick: não conseguiu passar do Level 2, mas entregou o melhor custo-benefício para tarefas básicas.

Por que essa brincadeira é tão difícil para os LLMs? 

  1. Raciocínio de longo contexto: a pista que quebra o álibi pode ter surgido vinte diálogos atrás.

  2. Visão + linguagem: é preciso apontar a imagem exata que desmonta o depoimento.

  3. Decisão estratégica: pressionar, apresentar evidência ou esperar? Cada passo errado custa uma vida — e um mar de tokens.

No placar final, o Gemini definiu o conceito de “bom e barato”, com o o1 sendo um luxo (quase) desnecessário, e o tribunal virtual prova que não basta completar frases: é preciso entender a história inteira.

PROMPT LIKE A PRO

Transforme-se em um Action-Figure

A nova trend do ChatGPT é se transformar em um personagem com um kit de artefatos favoritos, teste com uma imagem sua!

# Uma foto de action-figure kit hiper-realista a partir da foto enviada.
## Os itens estão organizados com precisão em uma caixa de colecionador premium, com recortes personalizados em espuma, como gadgets de luxo ou equipamentos de lifestyle.
# A embalagem é [cor], evocando uma estética elegante.

O kit inclui:

- Um boneco da pessoa enviada
- Item 1
- Item 2
- Item 3

*Você pode usar esse prompt no ChatGPT se for usuário Free e no Sora se for Plus.

GAME: QUAL IMAGEM É GERADA POR IA?
alt-a

Alternativa A

alt-b

Alternativa B

Escolha a imagem gerada por IA!

Será que você acerta?

Faça Login ou Inscrever-se para participar de pesquisas.

divider

O que achou da edição de hoje?

Faça Login ou Inscrever-se para participar de pesquisas.

INDIQUE O AIDROP

Em um segundo, a IA muda tudo

Em outro, você poderia estar aprendendo sobre isso com o AiDrop. Então, se você está aí de bobeira, o que acha de compartilhar isso com seus amigos e colegas? Linkedin, Instagram, WhatsApp, até no Slack do escritório. Mais IA, menos ignorância.

DROPS

Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau as assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.

Reply

or to participate.