Superposition Blog

A revolução da revolução da Inteligência Artificial

Cover-AI-saude.png

Recentemente, fabricantes de processadores anunciaram novos processadores para o consumidor final chamados NPU (Natural Processing Unit). Esses processadores são especializados em processamento de treinamento de IA de linguagem natural diretamente no computador do usuário.

Esse movimento é similar ao que aconteceu com as GPUs que foram incorporadas aos computadores pessoais inicialmente para fazer processamento gráfico de jogos e que hoje são utilizadas para diversos fins, incluindo treinamento de IA e mineração de criptomoedas.

A diferença entre NPUs e GPUs é que GPUs, apesar de serem processadores especializados, são especializados em um tipo de processamento matemático genérico enquanto NPUs são especializados em um tipo de processamento ainda mais específico. Na prática, isso significa que GPUs podem ser usados para vários fins e que NPUs apenas para a função que foram criadas. NPUs acabam sendo são mais baratas de produzir e consomem menos energia, algo importante num mundo em que as vendas para usuário final de computadores laptops e notebooks já são maiores do que as de computadores desktop.

Os processadores NPU serão a base de co-pilots de IA incorporados ao sistema operacional como o recém lançado Windows Co-pilot. A existencia de uma NPU no computador do usuário permite que modelos IA sejam treinados, ajustados finamente (fine-tuning) e acessados no próprio computador do usuário evitando a necessidade de que todo o modelo IA esteja rodando na nuvem e sendo acessado via API.

Isso é importante para que o processamento de IA ganhe escala. Hoje, modelos de IA muito acessados geram um custo computacional muito grande. Uma estimativa de Abril/2023 mostra que o sistema da OpenAI e seu ChatGPT custa $700k por dia! Com o processamento acontecendo parcialmente ou mesmo majoritariamente, no computador do usuário, será possível criamos soluções de IA muito mais escaláveis e poderosas.

O surgimento das NPUs já é, por si só, uma revolução dentro da revolução IA. Mas existe outra revolução que está por vir: o surgimento do WebNN (Web Neural Network API) recém lançado pelo w3c, ainda com status de Candidate Recommendation Draft.

Da mesma forma que o WebGPU permitiu que fossem criadas aplicações web que acessassem recursos das GPUs e que, por exemplo, jogos com gráficos mais complexos pudessem rodar dentro do navegador, agora o WebNN vai permitir que uma aplicação web possa acessar recursos de hardware especializados em IA (NPUs) possibilitando a criação de web apps com IA aplicada de fato.

Conclusão

Ainda estamos no inicio de toda a revolução IA. As NPUs ainda precisam desbravar um caminho de market share para serem relevantes e amplamente disponíveis e o WebNN ainda precisa evoluir para um padrão final adotado, mas não deixem de acompanhar essa pequena grande revolução dentro da revolução.

fabio_Seixas_3a650dabf0.png
Fabio Seixas
CEO
Compartilhe isso

VAMOS TRABALHAR JUNTOS

ENTRE EM CONTATO

Softo - USOrlando, FL, USA7345 W Sand Lake RD

Softo - BrazilRio de Janeiro, RJ, BrazilAvenida Oscar Niemeyer, 2000

get-in-touch@sof.to
Softo information map

1/3