• AiDrop
  • Posts
  • 🤖 Quanto custa construir com o ChatGPT?

🤖 Quanto custa construir com o ChatGPT?

e os casos de uso do Google Cloud, Salesforce, Nvidia, Jamba, etc...

Hey, Droppers!

Assim como a Amazon conseguiu economizar 4500 anos de desenvolvimento, o AiDrop vai te economizar algumas centenas de horas com as últimas notícias sobre Inteligência Artificial em poucos minutos.
Para você não ficar de fora, estamos aumentando a frequência com que chegamos no seu inbox para 2x/semana. A partir de agora, nos encontramos todas as terças e quintas às 13h em ponto, lezgo?

Ah, conta pra gente o que achou no final da news?

como sempre, sem mimimi, no 0800, direto ao ponto!

Na coluna ‘Ferrou’ de hoje: Operadora de telecom nos EUA levou uma multa de U$1 milhão depois que deepfakes do presidente Biden ligaram para eleitores solicitando que ficassem em casa durante as primárias.

No drop de hoje, repetindo a palavra IA 61x:

  • ChatGPT: a comoditização dos LLMs

  • Lei SB 1047: regular ou liberar, eis a questão

  • Amazon: 4.500 anos de trabalho em algumas horas

  • Os Casos de Uso: Google Cloud, Jamba, Together AI, Nvidia e Mistral, Salesforce, Perplexity e Luma Labs

  • Me explique como se eu fosse uma criança: LLM destilada

Seu trabalho não será substituído por uma Inteligência Artificial, mas por alguém utilizando Inteligência Artificial. Quer ficar por dentro da década de avanços que rolam no universo de IA todas as semanas? Assina o AiDrop e te contamos tudo, sem tecniquês, todas as quintas-feiras no seu inbox.

Quanto custa construir com o ChatGPT?

chatgpt, custo, tokens, llm, commodities

via Elad Gil

O ChatGPT está por trás de grande parte dos produtos de IA lançados no mercado, de gigantes como a Apple e Microsoft, passando por famosos como Snap e Instacart até as recém-lançadas como Jasper e Caktus. Além de ser o primeiro modelo disponibilizado via API em larga escala, um outro motivo tem impulsionado o crescimento do uso:

O custo por 2 milhões de tokens (input + output) do ChatGPT diminuiu de U$180 para U$0,75 em 2 anos. Uma redução de 240x.

Mas não foi somente o ChatGPT que descobriu como baratear seus custos. Claude, Anthropic, Llama também estão na corrida pela diminuição de preços. E à medida que mais e mais players disputam pela mesma fatia de mercado, a teoria da comoditização dos LLMs ganha força:

  1. Intercambialidade: como os LLMs são treinados em fontes de dados disponíveis publicamente, existe a possibilidade de que eles se tornem amplamente intercambiáveis

  2. Acessibilidade: as barreiras para a construção de LLMs estão diminuindo, com mais equipes capazes de treinar modelos competitivos. Modelos de linguagem poderão em breve ser tão omnipresentes como a computação em nuvem, integrando-se em várias aplicações e serviços.

🤖 Casos de Uso

Google Cloud agora está disponibilizando na plataforma diversos containers da plataforma Hugging Face.

Jamba 1.5 do AI21Labs é o novo modelo com 256k de contexto nas versões Mini (12B) e Large (94B), com velocidade de inferência até 2.5x maior que modelos de tamanho similar.

Together AI, API de servidores baratos para o modelos abertos aumentará o preço de 1mi tokens do Llama 3.1 8b de $0,20→$0,40 e Llama 3.1 70b de $0,90→$1,80.

Nvidia e Mistral lançaram o modelo Mistral-NeMo-Minitron 8B, uma versão destilada do Mistral NeMo 12B, superando o Llama 3.1 8B em quase todos testes.

Salesforce apresentou seus dois agentes autônomos da plataforma, que podem responder conversas, e-mails e até fazer agendamentos.

Perplexity criou uma comunidade de criadores em parceria com Kale, permitindo que criadores ganhem dinheiro a partir de vídeos virais.

Luma Labs anunciou a versão 1.5 do Dream Machine, com maior aprimoramento nos textos em vídeo e melhor compreensão de prompts.

Trending:

O Cursor AI, um assistente de coding, está bombando nas redes sociais pela facilidade de uso. Até uma criança conseguiu desenvolver o próprio aplicativo usando a ferramenta.

Regular ou Liberar, eis a questão

regulamentação, ia, lei SB 1047, califórnia

As big techs conseguiram aproveitar bem o intervalo de tempo que os órgãos regulatórios tomaram para entender o quanto está em jogo. Mas o bem-bom pode estar perto do fim. O senador da Califórnia, Scott Wiener, propôs o projeto de Lei SB 1047, intitulado (em tradução livre) “Lei de Inovação Segura e Protegida para Modelos de Inteligência Artificial de Ponta”.

O SB 1047 visa regulamentar o desenvolvimento e a implementação das IAs com um conjunto de requisitos de segurança e responsabilidade para:


Modelos que possuam custo de desenvolvimento de pelo menos U$100mi.
Modelos com poder computacional superior a 1026 FLOPs.
Modelos que apresentem riscos à sociedade.
Modelos que gastarem pelo menos U$25mi em fine-tuning.

FLOPs, ou "Floating Point Operations per Second", medem quantas operações matemáticas com números decimais um computador pode fazer por segundo.

Por ex: somar 3,14 + 2,71 é uma operação matemática.

Em comparação, o GPT-4 está estimado com 1025 FLOPs, então quem está no alvo são empresas como as OpenAI, Anthropic, Google, Meta etc. mas não somente modelos originais.

Dentre as propostas do projeto estão:

  1. Criação de um órgão regulador: que supervisionará se os modelos de ponta estão seguindo na linha.

  2. Requisitos de segurança: implementar protocolos de desligamento rápido e de segurança.

  3. Auditorias e relatórios: obrigatório a contratação anual de auditores independentes.

  4. Responsabilidade por danos: a entidade é responsável por danos críticos causados à sociedade (como a criação de armas ou ataques)

  5. Proteções para denunciantes: denunciantes recebem proteção de sigilo quando reportam problemas e evitam o apelido de X9.

Este é somente o primeiro projeto do tipo em vias de ser aprovado (dentre os vários em debates e construção) e já divide a opinião dos titãs da IA, com os favoráveis como Elon Musk e Dario Amodei da Anthropic e os contrários como Sam Altman e Mike Snoop do Zapier.

Me explique como se eu fosse uma criança: LLMs Destilados

São versões menores e mais rápidas de modelos de linguagem de larga escala.

Imagine que você tem um livro enorme cheio de conhecimento, mas nem sempre precisa de todas as informações.

O processo de destilação seleciona o que é mais importante e útil desse livro e cria um resumo menor.

Um LLM destilado faz o mesmo: mantém as partes mais importantes do conhecimento do modelo maior, mas ocupa menos espaço e responde mais rápido.

Amazon: 4.500 anos de trabalho em algumas horas

devs, economia, produtividade, amazon q

A Amazon é conhecida por ser sua primeira cliente (usar seus produtos internamente antes de comercializá-los). Com a sua solução de IA, não seria diferente, o Amazon Q foi colocado em ação e economizou um total de 4.500 anos de trabalho de devs.

O Amazon Q foi projetado para facilitar a atualização de aplicativos, especificamente para migrar para versões mais recentes do Java.

Jassy explicou que, anteriormente, a atualização de um app para Java 17 poderia levar até 50 dev-days para ser feita, mas com o Amazon Q, o tempo reduzido foi para apenas algumas horas e 79% das revisões de código geradas automaticamente não precisaram de alterações, o que gerou uma economia anual de U$260 milhões.

Outras empresas otimizando o trabalho de desenvolvimento com IA:

1. GitHub Copilot: automatizou sugestões de código, reduzindo o tempo de codificação em 27%, gerando uma economia total em U$1bi anual para devs que usam a ferramenta.

2. IBM Watson: reduziu o tempo de debugging em 50%, o que impactou diretamente no custo da mão de obra e lançamento de produtos.

3. Adobe Sensei: automatizando a marcação e edição de imagens, estima-se uma economia de U$300mi anuais em mão de obra.

4. Shopify: o sistema de detecção de fraudes com IA sobrepôs o sistema manual (lento e, muitas vezes, impreciso), sendo estimada uma economia de U$100mi anuais.

5. Netflix: reduziu a rotatividade e aumentou assinaturas com recomendações automatizadas por IA no feed, impactando U$1bi.

cAIxa da Semana

  • (mkt) Voice-Gen AI, crie áudios com IA rapidamente.

  • (prod) QuickResume, faça seu currículo legível por ATS com IA.

  • (mkt) UndetectableGPT, humanize textos gerados com qualidade.

  • (doc) Documind, converse com os seus documentos

  • (personal) GuideToGo, seu assistente de viagens.

Indique o AiDrop e libere a cAIxa inteira!

Você tem 0 indicações, faltam 2 para ganhar cAIxa de ferramentas

MEME

O que achou da edição de hoje?

Login or Subscribe to participate in polls.

Conheça outros DROPS

 TechDrop : Notícias inteligentes - sem ser chatas - de tecnologia e negócios, todas as segundas, quartas e sextas, às 6h direto no seu inbox.

 MoneyDrop : o dinheiro fala, a gente traduz e desenha todas as terças e quinta, às 9h.

Anuncie nos DROPS

Nossas newsletters são lidas por milhares de profissionais de tecnologia, investidores, gestores e líderes de negócios.
Falar com a equipe do DROPS →

Antes de ir embora.. tá curtindo o conteúdo e quer continuar recebendo? então arrasta esse e-mail para sua lista prioritária.

Reply

or to participate.