- AiDrop
- Posts
- 🤖 GenCast: prevendo o tempo com precisão
🤖 GenCast: prevendo o tempo com precisão
+ Casos de Uso: Meta, Japão, Restaurantes, Anduril, LATAM e mais...
Hey, Droppers!
Na coluna ‘Ferrou’ de hoje: cientistas descobriram que gritar com Chatbots de IA pode fazer você aliviar o estresse e se sentir melhor e não machucar os sentimentos da IA.
No drop de hoje, repetindo a palavra IA trocentas vezes:
Amazon: os 6 novos modelos do Projeto Olympus
Tencent: puxando a frente IA chinesa
Nvidia e AWS: entre tapas e beijos
GenCast: prevendo o tempo com precisão
Os Casos de Uso: Meta, Japão, Restaurantes, Anduril, LATAM, Editoras, Chrome, Death Clock
Prompt Like a Pro: Análise de Feedbacks
Seu trabalho não será substituído por uma Inteligência Artificial, mas por alguém utilizando Inteligência Artificial. Quer ficar por dentro da década de avanços que rolam no universo de IA todas as semanas? Assina o AiDrop e te contamos tudo, sem tecniquês, todas as quintas-feiras no seu inbox.
Olympus: os 6 modelos novos da Amazon
amazon, aws, re:invent, nova, olympus
A Amazon aproveitou o seu evento anual AWS re:Invent 2024 para mostrar que os rumores eram reais e o Projeto Olympus trouxe não um mas SEIS novos modelos de IA para casa:
Nova Micro: sendo exclusivo para texto/código, contém ~11b e é focado em baixa latência com um menor custo de inferência, com suporte a 128k de contexto, é superior ou igual ao Llama 3.1 8B.
Nova Lite: o primeiro multimodal, capaz de processar textos, imagens e vídeos de até 30min, com 300k de contexto, supera o GPT-4o mini em 17 de 19 benchmarks.
Nova Pro: o mais forte até o momento, multimodal com todos os recursos do Lite mas ~90B, especializado em fluxos de agentes multimodais. Superior ou igual aos GPT-4o, Gemini 1.5 Pro e Claude 3.5 Sonnet.
Nova Prime: o modelo mais avançado da linha (será lançado no Q1 2025), multimodal com estimados ~470B. Focado em tarefas de raciocínio, promete ser um dos mais potentes até hoje.
Nova Canvas: modelo text-to-image, sem benchmarks de performance comparativa, possui uma criação de 512px até 1440p (ou 4 megapixels) e incluirá um editor de imagens.
Nova Reel: modelo text-to-video, baseado na mesma qualidade do Canvas, gera vídeos de até 6s em 720p a 24FPS, com comandos em prompt e possui mais de 20 movimentos de câmera.
*estimativas de parâmetros baseadas na performance comparativa
Após deixar a concorrência de cabelos em pé, a Amazon disse que seus planos são de expandir todos seus modelos: vídeos de até 2 minutos, contexto de até 2 milhões, torná-los modelos “any-to-any” (qualquer forma de interpretação) e também fazer o Nova Speech-to-speech, para o possível upgrade das Alexas.
🤖 Casos de Uso
Meta está buscando parcerias com desenvolvedores de energia nuclear para construir usinas nos EUA até o início da próxima década.
Japão vai usar IA para combater pirataria de animes e mangás e proteger os direitos autorais dos criadores
Griletto, Montana Grill, Jin Jin e Croasonho, são os restaurantes usando IA para análise das pesquisas e melhoria da experiência do cliente.
Anduril a startup usando IA para criação das novas armas de defesa militar, fechou uma parceria com a OpenAI.
LATAM está usando IA não apenas para melhorar a experiência do usuário, mas também para otimizar recursos e automatizar processos.
Editoras estão usando IA para aumentar e otimizar a edição e distribuição, batendo recorde em velocidade de produção de livros.
Chrome vai usar IA para fornecer resumos rápidos de avaliações de lojas e sites visitados na web, verificando se um eCom é confiável ou não.
Death Clock está usando IA em seu aplicativo para prever a data da sua morte.
🤖 Novidades em IA
OpenAI criou um Tracker da API que monitora o uso de tokens por minutos/horas/dias, com diversos filtros como gasto/api, ID do projeto, ID do usuário, modelo e mais
ShowUI, novo modelo 2B vision-language-action, uma versão open-source do Computer Use da Anthropic, sendo até 30x mais barato que o Claude.
Google DeepMind apresentou o Genie 2, uma engine IA que cria mundos 3D controláveis a partir de uma única imagem.
Krea AI mostrou uma demo do seu novo editor de imagens com IA e convidou os usuários a experimentarem a Beta.
v0 agora permite que usuários pagos possam importar designs do Figma e iniciar o código a partir de prints.
Pixtral Large entrou no Top 8 no Vision Arena, tornando-se o melhor modelo open-source com interpretação de imagens.
Google Labs lançou o GenChess, um tabuleiro de xadrez com peças customizadas por prompt para cada jogador, mas está indisponível no Brasil.
Trending: Dora.AI é uma plataforma de desenvolvimento text-to-website, com elementos 3D e smart layouts para fácil edição. Com poucos prompts você pode criar uma super-landing-page, e com o cadastro já vem com alguns créditos gratuitos. |
Tencent: puxando a IA chinesa para frente
tencent, china, ai, hunyuan, gamegen-O
A gigante tech chinesa, Tencent - conhecida pelo WeChat, Riot Games, Epic Games - jamais assistiria os avanços de IA do Ocidente sem fazer nada. A primeira investida foi a Hunyuan Large, um modelo de 398B parâmetros que se destacou em benchmarks. A segunda foi o lançamento do GameGen-O, uma engine que cria jogos em tempo real com IA. Agora, a bola da vez foi um modelo para geração de imagens, vídeos e áudios.
O HunyuanVideo é um modelo de 13B parâmetros que gera:
Para dar inveja a qualquer shampoo 3 em 1, o novo modelo agrega (a) geração de áudio como narrações, efeitos sonoros de ambiente, mescla de imagens estáticas com movimentos de vídeos e dá vida a personagens inanimados.
PROMPT LIKE A PRO
Você tem muitos feedbacks de usuários/clientes mas queria fazer mais do que só acumulá-los? Aqui vai uma sugestão:
# A partir dessa lista de feedbacks em anexo, faça uma tabela com os campos [ex: "Nome", "e-mail", "telefone","feedback"].
# Identifique o humor e objetivo dos comentários dos [usuários/clientes]
# Crie uma padronização na tabela para poder contabilizar o número de [elogios, críticas, sugestões etc.]
Nvidia e AWS: entre tapas e beijos.
amazon, nvidia, chips, trainium2
Ao longo dos dias no AWS re:Invent não houveram somente novidades relacionadas a modelos de IA, também teve renovação de votos entre Amazon e Nvidia, que já é uma antiga parceira da Amazon antes de se tornar pop, fornecendo os GPUs da AWS.
Dentre as novidades da parceria, estão:
DGX Cloud na AWS: plataforma da Nvidia que oferece treinamento e personalização de modelos de IA usando H100 e H200, agora estará integrado na AWS.
Novas instâncias de servidores: os servidores virtuais agora terão novas bancadas para treinamento de modelos, inferência e cargas de trabalho gráficas.
Projeto Rainer: foi revelada a colaboração para o desenvolvimento de um supercomputador com 16k Nvidia H200, capaz de processar 65 exaflops (1018).
Collab com Startups: aproveitando as conexões da Amazon, a Nvidia mostrou que está em parceria nova com o Perplexity, Baseten e LILT.
AI Blueprints: para facilitar a implementação de IA nas empresas com 1-click, foram feitos diversos templates de fácil acesso, como: análise de vulnerabilidades, busca em vídeo e agentes de sumarização.
Na saúde: também foram mostrados avanços em biotecnologia na união de conhecimentos para descoberta de medicamentos com mais velocidade.
Apesar das declarações públicas de amor, como em qualquer outro relacionamento, nem tudo são flores. A Amazon também lançou a segunda versão do seu próprio chip Trainium2, que compete diretamente com os da Nvidia.
GenCast: Prevendo o Tempo com Precisão
previsão do tempo, gencast, google deepmind
No filme de volta para o futuro, o Doc Brown conseguia ver a previsão do tempo em seu relógio com precisão de segundos. O futuro retratado no filme aconteceria em 2015. Erraram por 9 anos e alguns dias de precisão já que o Google DeepMind acaba de lançar o GenCast.
O primeiro modelo de IA de previsão do tempo do Google era capaz de fornecer uma estimativa única e melhor do clima futuro, porém, sem muita exatidão.
O segundo modelo de IA, adora uma abordagem probabilística e faz 50 ou mais previsões de como o clima pode mudar, mostrando a probabilidade de diferentes cenários.
O modelo foi treinado com +40 anos de dados históricos que incluía variáveis como temperatura, velocidade do vento e pressão em várias altitudes - aprendendo padrões climáticos globais.
Sendo testado contra o principal sistema tradicional e utilizando somente uma TPU v5 do Google Cloud, o GenCast:
É capaz de gerar um único cenário de 15 dias em 8 minutos em um único chip TPU;
Demonstrou 97,2% de superioridade em precisão e chegou a 99,8% em previsões acima de 36 horas;
Mede dados não somente de temperaturas mas também fenômenos naturais como ciclones, ondas de calor e outros;
Ele também pode fornecer previsões superiores das trajetórias de ciclones tropicais, com até 5 dias de antecedência.
As aplicações e potenciais impactos variam desde planejamento de energia renovável, agricultura, segurança alimentar e melhoria em respostas a desastres. Como se não fosse notícia boa o suficiente, o GenCast é open-source!
Imagem IA da semana
Prompt: 3D miniature scene, summer, countryside, endless field, several farmers are harvesting wheat, they are happily working. Bright colors, bold color schemes, miniature landscapes with the sky as the background, and dreamy realism style scenes are all rendered using wide-angle lenses and depth of field, creating a paper art illustration style with axial shift photography effects and ultra clear details. The colors are bright, the color scheme is bold, and the foreground is blurry --ar 9:16 --style raw --stylize 250 --v 6.1
Modelo: MidJourney 6.1
O que achou da edição de hoje? |
Faça Login ou Inscrever-se para participar de pesquisas. |
DROPS
Elevando o QI da internet no Brasil, uma newsletter por vez. Nós filtramos tudo de mais importante e relevante que aconteceu no mercado para te entregar uma dieta de informação saudável, rápida e inteligente, diretamente no seu inbox. Dê tchau as assinaturas pagas, banners indesejados, pop-ups intrometidos. É free e forever will be.
Antes de ir embora… arraste este e-mail para sua lista prioritária, assim você não perde nenhum drop e nós não travamos na alfândega da web caixa de spam. Ah, pode nos responder também, lemos tudinho.
Reply