Velocidade 2,5x maior e preços agressivos miram devs corporativos
Microsoft – Na última quinta-feira (3), a gigante apresentou três modelos internos de inteligência artificial que prometem reduzir custos e tempo de processamento para empresas que já rodam cargas no Azure.
- Em resumo: MAI-Transcribe-1, MAI-Voice-1 e MAI-Image-2 chegam ao Foundry e ao MAI Playground com performance recorde.
Transcrição, voz e imagem em ritmo recorde
Segundo a companhia, o stack recém-liberado opera em clusters de GPU H100 no Azure, permitindo que o MAI-Transcribe-1 converta fala para texto em 25 idiomas a uma velocidade 2,5 vezes superior ao Azure Fast e, nos próprios testes, supere o Whisper da OpenAI e o Gemini do Google em quase todos os cenários. Já o MAI-Voice-1 transforma texto em 60 segundos de áudio em apenas um segundo, enquanto o MAI-Image-2 dobra a velocidade da geração visual anterior, tudo isso com tarifas que partem de US$ 0,36/hora de áudio, US$ 22 por milhão de caracteres e US$ 5 por milhão de tokens de prompt. De acordo com análise da MIT Technology Review, a oferta de preços agressivos pode redefinir o chão de custo para aplicações multimodais de IA.
“O MAI-Voice-1 gera áudio a partir de texto e consegue produzir 60 segundos de fala em um segundo.” — Documentação oficial da Microsoft.
Autossuficiência em IA e impacto de US$ 13 bi
Os modelos são a primeira entrega pública da equipe de superinteligência criada por Mustafa Suleyman em 2025, um movimento estratégico para tornar a empresa menos dependente da OpenAI, apesar do aporte superior a US$ 13 bilhões na parceira. A renegociação de outubro de 2025 liberou a Microsoft para criar modelos de fronteira, mantendo, porém, acesso privilegiado ao portfólio GPT até 2032.
Analistas lembram que, além de competir com o ecossistema OpenAI, Redmond também pressiona rivais que operam infraestrutura própria, como Google Cloud e AWS, ao oferecer velocidade elevada em GPUs de última geração interligadas por InfiniBand de 400 Gb/s — topo de linha em baixa latência para treinamento distribuído. Esse avanço pode impulsionar setores como call centers inteligentes, geração de conteúdo em massa e automação de design, segmentos que, segundo a Gartner, devem movimentar mais de US$ 300 bilhões até 2027.
O que você acha? Os preços e a velocidade anunciados mudam suas expectativas para projetos de IA? Para mais análises, acesse nossa editoria especializada.
Crédito da imagem: Divulgação / Microsoft