Coral NPU: quando a IA embarcada deixa de ser conceito e vira stack

Durante anos, falar em inteligência artificial embarcada significava quase sempre falar de uma ideia promissora, mas sem lastro real. A maioria dos dispositivos rodava versões simplificadas de "AI", com baixa acurácia e dependência total da nuvem. O termo "edge computing" ficou preso a buzzwords. Faltava stack, faltava arquitetura, faltava direção clara.
Com o lançamento da Coral NPU em 15 de outubro de 2025, o Google mudou esse cenário de forma definitiva. Sem incrementalismo, sem meio-termo. O que antes era um conjunto de peças soltas, silício, frameworks, drivers, modelos, tornou-se uma plataforma integrada, open-source e pronta para uso em escala. Rodar IA embarcada finalmente virou algo viável, acessível e reproduzível.
IA embarcada deixou de ser experimento, virou produto
A Coral NPU vai muito além de um simples chip. Ela representa um stack completo e aberto:
- Runtime programável em C com SDKs nativos para LiteRT (sucessor do TensorFlow Lite), PyTorch e JAX via MLIR/IREE
- Arquitetura 100% RISC-V (RV32IM + extensões vetoriais RVV 1.0 via Zve32x)
- Todo o código disponível no GitHub, sob licença permissiva, modular e sem travas proprietárias
Nota importante: O núcleo de matriz (matrix execution unit) ainda está em desenvolvimento e será liberado no GitHub ainda em 2025. O lançamento inicial inclui o núcleo escalar RISC-V e a unidade de execução vetorial completos e funcionais.
Desempenho e consumo
O design de referência entrega 512 GOPS com consumo típico de ~6 mW a 1 GHz. Esses números permitem rodar transformers e LLMs compactos diretamente em:
- IoT
- Wearables
- Fones TWS
- Câmeras inteligentes
- Óculos AR
- Qualquer dispositivo que antes mal suportava uma rede neural simples
Já em produção comercial
A arquitetura já está rodando em produção na linha Synaptics Astra SL2610 (cinco famílias pin-to-pin compatíveis: SL2611, SL2613, SL2615, SL2617 e SL2619), os primeiros SoCs do mundo com a Coral NPU integrada.
O subsistema Torq T1 NPU combinado com a Coral NPU alcança até 1 TOPS.
- Amostras disponíveis desde 15 de outubro de 2025
- Disponibilidade geral prevista para o segundo trimestre de 2026
Filosofia: tornar a nuvem opcional
A Coral NPU foi criada com um propósito claro: filtrar, interpretar e agir na borda.
Ao processar localmente:
- Reduz drasticamente tokens enviados à nuvem
- Elimina latência
- Corta consumo energético
- Eleva a privacidade a padrão de design
A inteligência local passa a ser a camada primária de decisão. A nuvem vira exceção, não regra.
Esse modelo descentraliza a IA de forma estrutural, criando uma rede de inteligência distribuída mais rápida, mais segura e mais sustentável por padrão. A decisão acontece onde o dado nasce.
Verticalização total: do silício ao framework
Enquanto outras big techs escalam horizontalmente clusters e infraestrutura de nuvem, o Google verticaliza:
- Android como sistema operacional de borda
- LiteRT/TensorFlow como framework unificado
- Coral NPU como motor de execução local open-source
Essa integração elimina intermediários e entrega aos desenvolvedores controle total de cada camada. O código permanece público, a arquitetura é extensível e o ecossistema cresce com parcerias estratégicas, como a VeriSilicon (anunciada em 13 de novembro de 2025), que acelera adoção em óculos AR, smart home e aplicações always-on com LLMs na borda.
A borda virou protagonista
Essa mudança de paradigma tem caráter estrutural.
A IA embarcada ganhou:
- Eficiência extrema
- Ferramentas maduras
- Linguagem comum
- Uma visão cristalina de onde agrega valor: exatamente onde os dados nascem, no sensor, no microfone, no wearable, no dispositivo.
Ao colocar poder computacional real na borda, a Coral NPU constrói um novo tipo de infraestrutura: aquela em que o “inteligente” mora no mundo físico, não apenas nos data centers.
Infraestrutura crítica começa na borda
O lançamento da Coral NPU vai além de performance ou open-source. Trata-se de posicionamento estratégico.
A inteligência artificial está deixando rapidamente de ser uma funcionalidade isolada para se tornar a infraestrutura invisível do nosso cotidiano. Para isso, precisa estar presente o tempo todo, em todo lugar, com latência zero, consumo irrisório e total autonomia.
O stack que o Google entrega com a Coral representa a resposta mais pragmática e completa a esse futuro.
A IA embarcada deixou de ser experimento e passou a ser infraestrutura crítica.
Com esse movimento, o edge ganhou protagonismo absoluto. E redefiniu o que podemos construir.
