Superposition Blog

Coral NPU: quando a IA embarcada deixa de ser conceito e vira stack

Durante anos, falar em inteligência artificial embarcada significava quase sempre falar de uma ideia promissora, mas sem lastro real. A maioria dos dispositivos rodava versões simplificadas de "AI", com baixa acurácia e dependência total da nuvem. O termo "edge computing" ficou preso a buzzwords. Faltava stack, faltava arquitetura, faltava direção clara.

Com o lançamento da Coral NPU em 15 de outubro de 2025, o Google mudou esse cenário de forma definitiva. Sem incrementalismo, sem meio-termo. O que antes era um conjunto de peças soltas, silício, frameworks, drivers, modelos, tornou-se uma plataforma integrada, open-source e pronta para uso em escala. Rodar IA embarcada finalmente virou algo viável, acessível e reproduzível.

IA embarcada deixou de ser experimento, virou produto

A Coral NPU vai muito além de um simples chip. Ela representa um stack completo e aberto:

  • Runtime programável em C com SDKs nativos para LiteRT (sucessor do TensorFlow Lite), PyTorch e JAX via MLIR/IREE
  • Arquitetura 100% RISC-V (RV32IM + extensões vetoriais RVV 1.0 via Zve32x)
  • Todo o código disponível no GitHub, sob licença permissiva, modular e sem travas proprietárias

Nota importante: O núcleo de matriz (matrix execution unit) ainda está em desenvolvimento e será liberado no GitHub ainda em 2025. O lançamento inicial inclui o núcleo escalar RISC-V e a unidade de execução vetorial completos e funcionais.

Desempenho e consumo

O design de referência entrega 512 GOPS com consumo típico de ~6 mW a 1 GHz. Esses números permitem rodar transformers e LLMs compactos diretamente em:

  • IoT
  • Wearables
  • Fones TWS
  • Câmeras inteligentes
  • Óculos AR
  • Qualquer dispositivo que antes mal suportava uma rede neural simples

Já em produção comercial

A arquitetura já está rodando em produção na linha Synaptics Astra SL2610 (cinco famílias pin-to-pin compatíveis: SL2611, SL2613, SL2615, SL2617 e SL2619), os primeiros SoCs do mundo com a Coral NPU integrada.

O subsistema Torq T1 NPU combinado com a Coral NPU alcança até 1 TOPS.

  • Amostras disponíveis desde 15 de outubro de 2025
  • Disponibilidade geral prevista para o segundo trimestre de 2026

Filosofia: tornar a nuvem opcional

A Coral NPU foi criada com um propósito claro: filtrar, interpretar e agir na borda.

Ao processar localmente:

  • Reduz drasticamente tokens enviados à nuvem
  • Elimina latência
  • Corta consumo energético
  • Eleva a privacidade a padrão de design

A inteligência local passa a ser a camada primária de decisão. A nuvem vira exceção, não regra.

Esse modelo descentraliza a IA de forma estrutural, criando uma rede de inteligência distribuída mais rápida, mais segura e mais sustentável por padrão. A decisão acontece onde o dado nasce.

Verticalização total: do silício ao framework

Enquanto outras big techs escalam horizontalmente clusters e infraestrutura de nuvem, o Google verticaliza:

  • Android como sistema operacional de borda
  • LiteRT/TensorFlow como framework unificado
  • Coral NPU como motor de execução local open-source

Essa integração elimina intermediários e entrega aos desenvolvedores controle total de cada camada. O código permanece público, a arquitetura é extensível e o ecossistema cresce com parcerias estratégicas, como a VeriSilicon (anunciada em 13 de novembro de 2025), que acelera adoção em óculos AR, smart home e aplicações always-on com LLMs na borda.

A borda virou protagonista

Essa mudança de paradigma tem caráter estrutural.

A IA embarcada ganhou:

  • Eficiência extrema
  • Ferramentas maduras
  • Linguagem comum
  • Uma visão cristalina de onde agrega valor: exatamente onde os dados nascem, no sensor, no microfone, no wearable, no dispositivo.

Ao colocar poder computacional real na borda, a Coral NPU constrói um novo tipo de infraestrutura: aquela em que o “inteligente” mora no mundo físico, não apenas nos data centers.

Infraestrutura crítica começa na borda

O lançamento da Coral NPU vai além de performance ou open-source. Trata-se de posicionamento estratégico.

A inteligência artificial está deixando rapidamente de ser uma funcionalidade isolada para se tornar a infraestrutura invisível do nosso cotidiano. Para isso, precisa estar presente o tempo todo, em todo lugar, com latência zero, consumo irrisório e total autonomia.

O stack que o Google entrega com a Coral representa a resposta mais pragmática e completa a esse futuro.

A IA embarcada deixou de ser experimento e passou a ser infraestrutura crítica.

Com esse movimento, o edge ganhou protagonismo absoluto. E redefiniu o que podemos construir.

Referências

fabio_Seixas_3a650dabf0.png
Fabio Seixas
CEO
Compartilhe isso

VAMOS TRABALHAR JUNTOS

ENTRE EM CONTATO

Softo - USOrlando, FL, USA7345 W Sand Lake RD

Softo - BrazilRio de Janeiro, RJ, BrazilAvenida Oscar Niemeyer, 2000

get-in-touch@sof.to
Softo information map

1/3