- AiDrop
- Posts
- 🤖 Venda seu vídeo para treinar IAs
🤖 Venda seu vídeo para treinar IAs
+ Casos de Uso: Nvidia, SBT, Sony, Igrejas, HSPE e mais...
Hey, Droppers!
Na coluna ‘Ferrou’ de hoje: Um bot da OpenAI tentou fazer o download de centenas de milhares de imagens e dados de um site sem autorização, um tipo de ataque DDoS. Foram usados ~600 IPs para raspar dados. O resultado? Além do prejuízo de ficar offline após o site sair do ar, a conta da AWS vai disparar!
No drop de hoje, repetindo a palavra IA trocentas vezes:
Venda Seu Vídeo: A fome dos modelos não tem fim, mas os dados sim.
Sky-T1: Treinando uma IA por meros U$450
Design de Chips: de 8 semanas para 10 minutos
Os Casos de Uso: Bloomberg, Apple Intelligence, Nvidia, SBT, Sony, Igrejas, HSPE, Reino Unido, Grupo dos Sete, Setor de cobranças
Me explique como se eu fosse uma criança: Synthetic Data
Seu trabalho não será substituído por uma Inteligência Artificial, mas por alguém utilizando Inteligência Artificial. Quer ficar por dentro da década de avanços que rolam no universo de IA todas as semanas? Assina o AiDrop e te contamos tudo, sem tecniquês, todas as quintas-feiras no seu inbox.
A fome dos modelos não tem fim, mas os dados sim.
geração de vídeos, dados, treinamento, modelos, text-to-video
Gravou trocentas horas de vídeos durante uma viagem de férias e utilizar apenas 30 segundos de cortes para publicar na sua rede social é basicamente o resumo da vida dos criadores. Mas o seu conteúdo não utilizado pode, finalmente, ter um fim. O Google e a OpenAI estão comprando vídeos não publicados de influencers para treinar modelos de IA.
As empresas de IA estão pagando caro pelos minutos de gravação não utilizados. O preço varia de acordo com a qualidade e formato dos vídeos:
Entre U$1 e U$2: A maioria das filmagens, como vídeos não utilizados criados para redes como YouTube, Instagram e TikTok.
Entre U$3 e U$4: Vídeos filmados em 4K e filmagens não tradicionais, como vídeos capturados de drones ou usando animações 3D.
De um lado, todos os principais players de IA já lançaram suas próprias ferramentas de geração de vídeo realistas com IA. OpenAI com a Sora, Meta com MovieGen, Adobe com o Firefly, Google com o Veo - e todas elas, sem exceção, precisam de quantidades massivas de dados para treinar seus modelos.
De outro, os criadores de conteúdo costumam gerar centenas de horas de conteúdo gravado que nunca chega a ser utilizado e, além de não gerar receita, até então, gerava prejuízo com o armazenamento.
E já que tudo que você publica online está essencialmente disponível para os raspadores de IA, essa se torna uma maneira estruturada e legal de participar do jogo. Hate the game, not the player!
P.S.1: enquanto isso, a Meta está sendo processada por usar treinar secretamente sua IA em um notório banco de dados de pirataria.
🤖 Casos de Uso
Bloomberg Intelligence reportou que bancos globais podem sofrer uma redução de até 200 mil empregos nos próximos 3 a 5 anos.
Apple Intelligence não teve impacto significativo na venda dos iPhones 15 e 15 Pro Max.
Nvidia rebateu publicamente as leis reguladoras apresentadas por Biden antes do término do mandato.
SBT está aplicando IA para melhorar a resolução dos episódios de Chaves, mas os fãs não estão gostando.
Sony registrou uma patente de IA para oferecer uma experiência de gameplay mais responsiva aos consumidores, reduzindo input lag dos jogos
Igrejas estão testando ‘IA de Deus’ para aumentar a interação de fiéis com a religião, mas seu uso em sermões causa polêmica.
Hospital do Servidor Público Estadual implementou uma tecnologia IA em exames Raio-X, reduzindo a entrega de resultados de 1h para 5min.
Reino Unido apresentou o Plano de Ação para Oportunidades em IA, com medidas para fortalecer a infraestrutura e acelerar a indústria.
Grupo dos Sete (G7) pode se beneficiar da integração da IA através da gestão de recursos de forma eficiente, entre outros fatores.
Setor de cobranças adota IA generativa para prever comportamentos e conceder crédito com maior assertividade.
Trending: Self-Generating UI é um projeto de um usuário do X, no qual você pode pedir para o chat criar o próprio design que você está usando, personalizando para um design minimalista, médico, ou até temático. |
Sky-T1: Treinamento uma IA por meros U$450
novasky, llm, fine-tuning, U$450, open-source, o1-preview
Enquanto Musk subia no palco da CES2025 para dizer que “todo o suco que poderíamos espremer dos dados já está acabando”, dando a entender que a velocidade de evolução dos LLMs está próxima do seu pico, uma startup da Universidade de Berkeley, NovaSky, mostrou o outro lado da moeda: treinou um modelo completo gastando meros U$450.
Para fins de comparação:
2020: ChatGPT-3 custou entre U$2-4 milhões
2022: ChatGPT-4 custou entre U$41-78 milhões
2023: Gemini custou entre U$30-191 milhões
2025: Sky-T1 custou menos que U$450
O time da NovaSky utilizou 8 Nvidia H100, que custaram U$450 e levaram 19h de finetuning usando os dados do QwQ e aprimorados pelo GPT-4o-mini.
Apesar do seu tamanho relativamente minúsculo, a sua performance é capaz de competir diretamente com versões iniciais dos LLMs de renome, como a versão inicial do o1 - além de superá-lo em testes de matemática e código por 2-3%.
A tendência contínua indica que, embora o desenvolvimento de modelos avançados de IA tenha se tornado cada vez mais caro, inovações como o Sky-T1 demonstram uma mudança potencial em direção a soluções de treinamento em IA mais acessíveis.
P.S: Você pode conferir os weights do modelo no GitHub do projeto→
🤖 Novidades em IA
OpenAI depois de fechar seu setor de robótica, abriu vagas novamente, revivendo a equipe e demonstrando recuperar interesse na área.
Pesquisadores da AMD lançaram o Agent Laboratory, um framework para utilizar agentes LLM como assistentes de pesquisa, alcançando uma redução de custos de 84% em comparação com métodos anteriores.
Reddit lançou o Reddit Answers, seu buscador interno utilizando uma LLM para ter uma experiência melhor aos usuários, mas indisponível no Brasil.
xAI lançou o app standalone do Grok, somente para iOS e nos Estados Unidos - especula-se o fato do app ser lançado para o Grok 3.
Google apresentou o Daily Listen, a versão em áudio do Google Discover, trazendo novidades em podcast, ainda indisponível no Brasil.
Luma Labs apresentou exemplos do Ray 2, seu novo modelo de vídeos, que disputa com os RunWay, Kling 1.6 e VEO 2.
Me explique como se eu fosse uma criança: Synthetic Data
Synthetic Data ou Dados Sintéticos Os dados orgânicos são informações reais coletadas de pessoas, eventos ou sistemas. Dados sintéticos são criados artificialmente por IA para imitar dados reais, como textos, imagens ou registros numéricos. Eles surgem como solução à crescente dificuldade de obter dados reais, que estão se tornando escassos devido ao alto consumo em treinamento. Com a previsão de que dados textuais de alta qualidade possa acabar em breve, os sintéticos oferecem uma alternativa sustentável e funcional. |
Desenvolvendo Chips de IA: de 8 semanas para 10 minutos!
chips, ia, design inverso, otimização, tempo
Até agora, os humanos criaram chips capazes de suportar o desenvolvimento, treinamento e utilização da Inteligência Artificial. Daqui para frente, humanos podem ir para o banco de reservas. As próprias IAs estão desenvolvendo os chips para elas mesmas - e, de tabela, reduzindo o tempo necessário para projetá-los em até 99%!
Através da abordagem de “Design Inverso”, uma IA cria designs baseados na finalidade do chip, otimizando o trabalho de 8 semanas para até 10 minutos. Os resultados?
Filtros ultracompactos: Ocupam 10% do tamanho dos tradicionais, cobrindo frequências de 50–70 GHz.
Antenas 2,25x menores: Operam em bandas de 24 a 28 GHz sem perder eficiência.
Amplificadores 30% mais eficientes: Oferecem ganho de até 17,5 dB e suportam faixas comerciais do 5G.
Divisores e combinadores mais precisos: Ajustam sinal com até 90% de equilíbrio entre saídas.
O feito foi alcançado por pesquisadores da Universidade de Princeton em conjunto com o Instituto da Índia de Tecnologia, reduzindo o tempo e o custo de projetar novos chips sem fio e descobrindo novas funcionalidades para atender às crescentes demandas por melhor velocidade e desempenho sem fio.
cAIxa da Semana
Sigma Browser, AI-first browser, o navegador substituto do finado Arc.
Fashn.AI, substitua as roupas que você quiser em uma foto e faça vídeos.
Brand.dev*, puxe dados de uma marca através de uma API simplificada.
PortraitMaker*, faça fotos profissionais em casa, sem estúdio.
NinjaED, planeje seus estudos com eficácia.
*ferramentas que não possuem trial
Sabe aquele amigo que só usa o ChatGPT para pedir receitas? Ou o primo que acha que IA é “igual Alexa”? Tá na hora deles receberem o AiDrop.
Indique para quem ama aprender, vive de produtividade ou só quer saber a próxima ferramenta antes de todo mundo.
MEME
O que achou da edição de hoje? |
Faça Login ou Inscrever-se para participar de pesquisas. |
DROPS
Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau as assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.
Antes de ir embora… arraste este e-mail para sua lista prioritária, assim você não perde nenhum drop e nós não travamos na alfândega da web caixa de spam. Ah, pode nos responder também, lemos tudinho.
Reply