Google sangat menjaga rahasia TPU-nya, yang dikembangkan sebagai bagian dari inisiatif cloud DeepMind, tetapi telah mengungkapkan beberapa hal menarik.
Kemampuan utamanya adalah tingkat output 45 token per detik yang "terdepan di industri". Itu cepat; 30 token per detik cukup cepat untuk melampaui pembaca tercepat sekalipun.