AiDrop
Posts
🤖 Microsoft: vai ter IA para todo mundo SIM

🤖 Microsoft: vai ter IA para todo mundo SIM

September 17, 2024

Hey, Droppers!

Na coluna ‘Ferrou’ de hoje: o lançamento dos novos modelo da OpenAi, o1, marcaram a primeira vez que um modelo de IA ultrapassou o QI humano médio, atingindo ~120 no teste de QI Mensa.

No drop de hoje, repetindo a palavra IA 52x:

OpenAI o1: os modelos de IA com raciocínio humano.
LLM Reflexivos: uma nova era de modelos
Microsoft: vai ter IA para todo mundo SIM
Os Casos de Uso: James Earl Jones, Microsoft, Slack, Canadá
Novidades: Luma Dream Machine, GemaGenO, DrawingSpinUp, Salesforce
Me explique como se eu fosse uma criança: Chain-of-Thought (CoT)

Seu trabalho não será substituído por uma Inteligência Artificial, mas por alguém utilizando Inteligência Artificial. Quer ficar por dentro da década de avanços que rolam no universo de IA todas as semanas? Assina o AiDrop e te contamos tudo, sem tecniquês, todas as quintas-feiras no seu inbox.

OpenAI o1: o primor das LLMs (até então)

openai, o1, strawberry, gpt, chain of thought

Se existe um sinal maior de que a Inteligência Artificial atingiu o mainstream do que Sam Altman e Bill Gates no especial da Oprah discutindo “AI e o Nosso Futuro” e a OpenAi aproveitando para lançar sua a nova série de modelos, não sabemos. Mas o fato é que tudo isso aconteceu:

o1, é o nome oficial dado ao projeto Strawberry, a evolução do último GPT-4o, que vem com os integrantes: o1 preview, o1-mini e modelo principal.

Com exceção do modelo principal, os demais já estão disponíveis para usuários Plus, Teams e via API para usuários nível 5, com os limites expandidos:

o1-mini: taxa limite aumentada em 7x, de 50 mensagens por semana para 50 mensagens por dia.

o1-preview: taxa limite aumentada de 30 mensagens para 50 por semana.

Eles foram pensados para passar mais tempo pensando antes de responder, utilizando o tempo para refinar sua resposta, reconhecendo os próprios erros e se auto-corrigindo antes de falar bobagem. Por isso, os cientistas da OAI afirmam que este é o primeiro modelo capaz de executar raciocínio humano e o modelo mais inteligente já criado. Nem uma semana de lançamento e o danado já conseguiu:

Se tornar o primeiro LLM a atingir 120 de QI
Obter a precisão de respostas em nível PhD
Estar entre as 11% melhores notas das Olimpíadas Matemáticas dos EUA (AIME)
Superar o GPT-4o → o melhor modelo (estatisticamente, até então)

Embora o o1-mini possua esse sufixo, ele não é menor que o o1-preview. Na verdade, sua database foi otimizada para raciocínio nas áreas de STEM (Ciência, Tecnologia, Engenharia e Matemática), enquanto o o1-preview é uma ‘palhinha’ do que o o1 completo é capaz de fazer em conhecimentos gerais como datas históricas, questionários e biografias, sem as habilidades completas de STEM.

Me explique como se eu fosse uma criança: CoT

Chain of Thought ou Cadeia de Pensamentos

O "Chain of Thought" é a técnica que permite o o1 "pensar em voz alta", analisando cada etapa antes de responder. Em vez de fornecer respostas imediatas, o modelo reflete sobre cada parte do problema, corrigindo erros e refinando seu raciocínio.

Essa abordagem resulta em respostas mais precisas e coerentes, aproximando-se da maneira humana de pensar. Ao decompor problemas complexos em partes menores e solucioná-las sequencialmente, o o1 alcança os desempenhos superiores apresentados.

🤖 Casos de Uso

James Earl Jones, ator que dava voz ao Darth Vader faleceu. Mas, antes disso, permitiu que sua voz fosse replicada por IA e pudesse continuar sendo usada.

Microsoft Copilot, mostra como 3 empresas líderes de mercado tem usado suas ferramentas de IA no planejamento estratégico.

Slack, quer se tornar o hub de aplicativos de IA e já tem integração com Salesforce, Adobe, Claude, entre outras.

Canadá, criou um sistema de alerta precoce de IA, que monitora sinais vitais e alerta equipes para intervir mais cedo e reduziu as mortes inesperadas de pacientes em 26%.

Uma nova era de modelos reflexivos

reflection, llama, chain of thought, llms

Um pouco antes do anúncio oficial da OpenAi, um outro tema ocupava as páginas de fofoca do X e do Reddit, o lançamento do Reflection 70B, um modelo que prometia superar o GPT, Claude e Gemini, criado a partir de um finetune do Llama 3.1 70B.

No entanto, após os testes iniciais, a promessa começou a se mostrar apenas uma promessa, já que a performance do Reflection era inferior à anunciada. Matt Shumer, o CEO da OthersideAi, ainda tentou arrumar a casa dizendo que havia um problema na API e liberou uma versão privada para testes - mas não funcionou, afinal, os outputs eram idênticos ao de modelos testados em paralelo (Claude, Gemini e GPT).

Essa ideia de um modelo utilizando CoT não era nova e depois do fracasso da Reflection e da OAI tomar a vanguarda dos modelos fechados pensantes, os heróis open-source também entraram em campo:

g1: Llama 3.1 70B: Utilizando o Groq, este protótipo reflexivo conseguiu atingir um resultado próximo a 70% do GPT-4o padrão.
Llama 3.1 Instruct O1 405B: Com o hardware da SambaNova utilizando o LLM mais poderoso da Meta, esse modelo consegue encurtar o tempo de pensamento com seus ~100 tokens/segundo no 405B.

A bola está contigo, Claude e Gemini!

🤖 Novidades em IAs

Luma Dream Machine abriu sua API, agora permitindo o desenvolvimento de aplicações com o seu modelo.

GameGenO é um modelo de geração de jogos de mundo aberto em tempo real a partir de prompts, treinado em jogos como The Witcher, Red Dead Redemption e GTA V.

DrawingSpinUp transforma desenhos 2D em rigs 3D com animações aplicáveis.

Salesforce lançou seu construtor de agentes chamado AgentForce, que permite criar bots capazes de agir por conta própria.

Tencent criou o GameGen-O, um gerador de videogame de mundo aberto que representa um “passo inicial notável” para a criação de videogames completos com IA.

Microsoft: vai ter IA para todo mundo SIM!

microsoft, copilot, excel, powerpoint, teams, outlook, word

Se ainda não tinha ficado evidente o quanto a Microsoft acredita que IA é a nova revolução da internet, a próxima geração do Copilot, anunciado esta semana, deixa isso claro: agora vai ter IA em quase todos aplicativos do 365, como Excel, PowerPoint, Teams, Outlook, Word e OneDrive.

Copilot Pages: a versão Microsoft do Notion, agora é colaborativa para trabalho em equipe, permitindo interação multiusuário em tempo real com IA em conteúdo editável.
Copilot Agents: assistentes avançados de IA que automatizam processos de negócios complexos, operando em segundo plano para executar tarefas de forma autônoma.
Agent Builder: Uma ferramenta no-code para criar agentes Copilot personalizados, facilitando o desenvolvimento de IA para usuários não técnicos.
PowerPoint: ganhou o Narrative Builder, que permite usuários descreverem o que esperam da apresentação e a IA faz o resto.
Outlook: ganhou o “Priorize meu Inbox” que resume as ações necessárias a serem executadas em um e-mail.

A Microsoft não quer que IA seja um privilégio apenas dos usuários técnicos. Ao contrário, quer aumentar o uso dos seus produtos, permitindo que até o tiozão do zapzap consiga criar planilhas com macro no excel sem escrever uma fórmula.

cAIxa da Semana

Gumloop, automatize qualquer fluxo de trabalho de navegação na web com IA.
Vic, processamento de faturas e pagamento de contas feitas com IA
FlutterFlow, construa apps rapidamente direto no seu navegador.
Naro, gere insights de marketing a partir das suas calls de vendas.
Squack, construa workflows de dados usando linguagem natural.

^{*todas as ferramentas possuem trial}

Você tem 0 indicações, faltam 3 para ganhar cAIxa de ferramentas

MEME

Ou copie e compartilhe seu link único: https://www.aidrop.news/subscribe?ref=PLACEHOLDER

O que achou da edição de hoje?

🤩 Baita | 😬 Marromenos | 🤢 Bléh

Faça Login ou Inscrever-se para participar de pesquisas.

Anuncie nos DROPS

Nossas newsletters são lidas por milhares de profissionais de tecnologia, investidores, gestores e líderes de negócios.
Falar com a equipe do DROPS →

Antes de ir embora.. tá curtindo o conteúdo e quer continuar recebendo? então arrasta esse e-mail para sua lista prioritária.

Reply

or to participate.