AiDrop
Posts
🤖 GPT, fazendo Siri e Alexa comer poeira

🤖 GPT, fazendo Siri e Alexa comer poeira

+ Meta Connect com Llama 3.2 e Agentes do Gemini

September 26, 2024

Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: o GPT-3 era como um aluno inteligente do ensino fundamental. O GPT-4 era o nível do ensino médio. Já o novo modelo de raciocínio supera os alunos de doutoramento em 50% das vezes, apresentando um desempenho sobre-humano pela primeira vez - Haider Dane Vahey.

No drop de hoje, repetindo a palavra IA 49x:

Meta Connect: os lançamentos do ano
Gemini at Work: os lançamentos do Google
OpenAI: fez a Siri e a Alexa comerem poeira
Novidades: Molmo, Gemini, Mistral
Os Casos de Uso: James Cameron, Ai-PCs, Spotify, Alibaba e Nvidia, Notion, Pathomiq_prad
Prompt Like a Pro: Melhore seu pitch de vendas com o AVM

Seu trabalho não será substituído por uma Inteligência Artificial, mas por alguém utilizando Inteligência Artificial. Quer ficar por dentro da década de avanços que rolam no universo de IA todas as semanas? Assina o AiDrop e te contamos tudo, sem tecniquês, todas as quintas-feiras no seu inbox.

Meta Connect: os lançamentos do ano

meta connect, rayban, zuckerberg, meta ai, llama

Mark Zuckerberg, o founder / ceo / jiujiteiro / surfista / bilionário / liberal / rei-genX, subiu aos palcos do seu evento, Meta Connect, para contar ao mundo os principais lançamentos do ano.

A Meta investe incríveis ~27% de toda receita em pesquisa & desenvolvimento, que somam +U$40bi ano, e os resultados deste ano não desapontaram:

Llama 3.2

Em quatro tamanhos, 1B, 3B, 11B e 90B, os dois menores servem para rodar em dispositivos portáteis e os dois maiores são multimodais. Agora, o Llama consegue interpretar imagens, áudios e vídeos.

→ Os modelos menores, por enquanto, suportam apenas textos e seus dados de treinamento são destilados dos Llama 3.1 8B, 70B e 405B.
→ O modelo 3B compete diretamente com o Gemma 2B e o Phi 3.5 Mini, com resultados similares à performance do Phi, que é superior e maior.
→ Destacando as novas habilidades de visão, o 11B superou os benchmarks do Claude 3 Haiku e o modelo 90B melhor que o GPT-4o-mini em diversos testes - um grande marco para os modelos open-source.

Meta AI

O chatbot - que ainda não está disponível no Brasil - atingiu 500 milhões de usuários mensais ativos e estará integrado em todas redes sociais da Meta fazendo todas as funções de um LLM multimodal: conversando em texto, áudio e gerando e editando imagens.

O AI Studio da Meta também está desenvolvendo clones digitais de influencers para conversar em chamadas de vídeo super-realistas. Além disso, os vídeos do Instagram terão o recurso de dublagem nativa, com sincronização labial e tudo mais.

Hardwares

Não faltou espaço para os novos devices:

- Quest 3S, é o headset de realidade virtual mais barato da Meta até agora, começando (nos EUA) por U$299.

- Ray-Ban, a nova versão do óculos inteligente ganhou novas funcionalidades como ajudar a lembrar coisas (como onde estacionou), traduzir falas em tempo real, responder perguntas sobre o que você está vendo e mais.

- Orion, o primeiro óculos de realidade aumentada da Meta, juntando o design do Ray-Ban com a aplicabilidade do Quest.

🤖 Casos de Uso

James Cameron, o cineasta por trás de Titanic e Avatar, agora faz parte do conselho da Stability AI.

AI-PCs deverão superar os PCs sem IA em 2026, e será algo difundido em 2028 com a expectativa de que pelo menos 60% dos PCs em 2028 tenham NPUs.

Spotify lança versão beta de recurso que cria playlists com IA através de uma descrição. No momento, só está disponível nos EUA, Canadá, Irlanda e Nova Zelândia.

Pathomiq_Prad é uma nova IA que pode identificar casos de câncer com maior risco de progressão rápida da doença.

Alibaba e Nvidia estão colaborando para desenvolver a direção autônoma de veículos, utilizando os modelos Qwen.

Notion lançou sua nova plataforma de IA, que permite fazer buscas, análises e conversas diretamente no app.

🤖 Novidades em IA

Molmo 7B e 72B são novos modelos open-source com visão, que brigam com os Llama 3.2 e com os Qwen 2.5, superando os maiores modelos diversos benchmarks.

Gemini 1.5 Pro recebeu um update com redução de custo em 50%, 2x velocidade de output e atraso 3x menor.

Mistral Small é o novo modelo da Mistral AI com 22B, ficando pouco atrás do Llama 3.1 70B.

2 dicas para deixar seu ChatGPT muito + inteligente

Oferecimento Adapta

Mesmo depois de 2 anos do lançamento do ChatGPT, você ainda sente que as respostas de Inteligência Artificial são muito genéricas? Talvez você esteja usando errado.

Por isso a Adapta, maior empresa de IA Generativa do Brasil, preparou duas dicas para deixar seu ChatGPT muito mais inteligente.

Dica #1: Dar contexto
Dê o máximo de informações como local, pessoas, sentimentos, referências etc.. sobre a situação em que a tarefa deve ser executada. Caso não tenha nada definido, experimente colocar "o que você precisa saber sobre mim ou essa tarefa para me ajudar?" no final do seu prompt.

Dica #2: Aquecer o seu ChatGPT
Poderíamos até tentar te explicar, mas após ensinar mais de 55.000 empresários a usarem melhor IAs, a Adapta disponibilizou uma aula gratuita sobre como "aquecer o ChatGPT".

Clicando aqui você tem acesso já!

Gemini at Work: os lançamentos do Google

gemini, agentes, multimodal, google, cloud, vertex

Sundar Pichai, o CEO que não esquece nenhum número de telefone que ele discou na vida, também subiu aos palcos durante o evento Gemini at Work para revelar ao mundo os últimos agentes de IA desenvolvidos pelo Google para uma lista VIP de clientes, e também não decepcionou:

Customer Agents → para responder clientes e resolver problemas, entendendo contextos do mundo real, com habilidade de conversação em voz natural e com respostas adaptadas. Alguns dos parceiros citados que estão utilizando esses agentes: Snap, Volkswagen, TIM Enterprise e o SUS.
Employee Agents → para produtividade, melhorando a colaboração entre o time e fazendo pesquisas para tarefas específicas, funcionam bem no Google Workspace, com o Gemini agindo nos documentos e legendando chamadas no Meet entre idiomas em tempo real.
Data Agents → para simplificar a interação com dados, servem para padronizá-los e aprimorá-los. Você pode, por exemplo, conversar com a sua planilha e tirar insights sobre ela. A Warner Bros utilizou Data Agents para reduzir 50% dos custos em legendas, sendo 80% mais rápida a produção.
Security Agents → para serviços de compliance, revisão e manuais de segurança, servem para garantir que vai dar tudo certo, criando playbooks passo-a-passo.
Creative Agents → para criar, explorar, organizar, transformar e polir ideias, os agentes criativos servem principalmente para criar mídia (redes sociais, e-mails, anúncios etc) para públicos segmentados. PODS, uma empresa de mudanças, fez um outdoor-tela em seus caminhões que as frases se modificam de acordo com a vizinhança que o caminhão passava.
Resultado? +60% visitas no site e +33% orçamentos feitos.

Ao contrário da Meta, que focou em lançamentos, o Google focou em mostrar como o Gemini e seus 2 milhões de tokens e integrações têm resolvido problemas de seus clientes em aplicações reais em diversos setores.

Talvez a maior promessa de impacto positivo da revolução da inteligência artificial esteja na área da saúde. Pensando nisso, falamos com um dos maiores especialistas sobre os temas de IA e Saúde, Guilherme Kato, CTO do Dr. Consulta:

Drop: Qual deve ser o principal driver de IA na área da saúde?

Kato: "O principal driver de Aplicações de AI na saúde para mim é o ganho de eficiência. Nossa área é dependente de um sistema que está ficando insustentável após aumentos sequenciais da inflação médica, uso exagerado dos planos e modelos de pagamento que favorecem o uso. Gerar eficiência para o sistema é tornar os negócios possíveis e aumentar o nível de atendimento e o acesso das pessoas a serviços de qualidade"

Drop: Pode nos dar exemplos práticos e reais disso?

Kato: "Já existem muitos casos de sucesso, mas vou destacar duas aplicações de IA que fizemos no dr. consulta. A primeira é a ferramenta Skala AI, que entende dados da população e direciona médicos para consultórios alinhados com a demanda por especialidades. O projeto aumentou de 65% para 85% a alocação das agendas dos centros médicos. A segunda é a Skala AI Gente, que foca na gestão de profissionais da saúde e reduziu 20% custo administrativo alocando profissionais gerais"

Drop: E daqui para frente, quais as mudanças mais significativas que podemos esperar?

Kato: Vejo que a principal mudança seria a forma como as pessoas interagem com o sistema de saúde. O ideal é tratar de saúde e prevenir a doença. Engajar as pessoas em alta escala nas linhas de cuidado seria impossível sem os agentes de AI, mas um alerta é importante: em saúde, não podemos perder a humanização.

Insights de IA é apresentado por Invillia. Quer inovar e acelerar o desenvolvimento de produtos e serviços digitais com o uso de IA? Conheça as soluções ->

PROMPT LIKE A PRO

Use o Advanced Voice Mode para praticar seu pitch de vendas, melhorar e receber dicas. Narre este prompt para ele e complete você mesmo:

Prompt:

Você é um especialista em treino de vendas, eu vou discursar o meu pitch de vendas para você e você irá avaliá-lo baseado em “valor”, “persuasão” e “clareza”.
Você está pronto para começar?

[Faça seu pitch de vendas completo]

Após a resposta, ele avaliará seu pitch e você poderá tirar dúvidas sobre as oposições que o cliente costuma ter em relação ao seu produto e te ajudará a derrubar as barreiras.

OpenAI: fez a Siri e Alexa comer poeira

openai, advanced voice mode, avm, siri, alexa

Depois de meses de espera e iterações a partir dos feedbacks de um grupo de beta-testers, a OpenAi finalmente liberou acesso ao esperado Advanced Voice Mode do GPT.

O recurso de voz/áudio/conversação já está disponível no mundo todo (menos Europa) para os usuários do ChatGPT Plus e Teams, traz 5 novas vozes (Scarlett Johansson não é uma delas), se comunica em 50 idiomas e é capaz de falar com sotaque solicitado.

Alguns exemplos criativos do que esse danado é capaz:

Em menos de 24h do lançamento oficial o AVM já é considerado melhor do que qualquer outro assistente virtual inteligente de voz, deixando a Siri e a Alexa parecendo os Incas e Astecas.

Ps1: Além do lançamento, a CTO Mira Murati, o CRO Bob McGrew e o VP Barret Zoph, também anunciaram, no mesmo dia, que estão de saída da OpenAi.

Ps2: a OpenAi também está prestes a mudar seu status de organização sem fins-lucrativos para organização com fins-lucrativos, o que deixaria o CEO Sam Altman com ~7% da empresa - que no valuation de U$150bi representaria +U$10bi.

O que achou da edição de hoje?

🤩 Baita | 😬 Marromenos | 🤢 Bléh

Faça Login ou Inscrever-se para participar de pesquisas.

Anuncie nos DROPS

Nossas newsletters são lidas por milhares de profissionais de tecnologia, investidores, gestores e líderes de negócios.
Falar com a equipe do DROPS →

Antes de ir embora.. tá curtindo o conteúdo e quer continuar recebendo? então arrasta esse e-mail para sua lista prioritária.

Reply

or to participate.