

TabFM
google · 3× · last seen Jul 03, 2026
TabFM ist ein von Google Research am 30. Juni 2026 vorgestelltes Foundation Model für tabellarische Daten, das Klassifikation und Regression als In-Context-Learning-Problem behandelt und dadurch kein datensatzspezifisches Training, Hyperparameter-Tuning oder Feature-Engineering mehr benötigt. Das Modell nutzt eine Hybrid-Architektur aus abwechselnder Zeilen-/Spalten-Attention (ähnlich TabPFN) und einem kausalen ICL-Transformer (ähnlich TabICL) und wurde ausschließlich auf hunderten Millionen synthetischer, mittels struktureller Kausalmodelle generierter Datensätze trainiert. Die Modellgewichte sind auf Hugging Face und der Code auf GitHub verfügbar; eine Integration in BigQuery über einen SQL-Befehl "AI.PREDICT" ist für die kommenden Wochen angekündigt, aber noch nicht produktiv verfügbar.
Features
| Deployment (Self-Hosted/Cloud) | Self-host via GitHub repo (CPU-only JAX or CUDA 12 GPU variant); planned cloud usage via BigQuery AI.PREDICT |
| Throughput/Latency | Evaluated on TabArena (38 classification, 13 regression datasets, 700–150,000 samples); prediction in a single forward pass without training |
| License | Source code Apache 2.0 (GitHub); model weights under separate TabFM Non-Commercial License v1.0 (Hugging Face) |
| Platform | Available on Hugging Face and GitHub; integration into Google BigQuery (AI.PREDICT) planned for the coming weeks |
| Protocol Compatibility | scikit-learn compatible API (fit/predict); planned SQL access via BigQuery AI.PREDICT command |
| Release Date | June 30, 2026 (Google Research blog announcement) |
| Supported Models/Providers | One model (TabFM v1.0.0) with JAX and PyTorch backend; scikit-learn compatible Classifier/Regressor API |