

TabFM
google · 3× · zuletzt 03. Juli 2026
TabFM ist ein von Google Research am 30. Juni 2026 vorgestelltes Foundation Model für tabellarische Daten, das Klassifikation und Regression als In-Context-Learning-Problem behandelt und dadurch kein datensatzspezifisches Training, Hyperparameter-Tuning oder Feature-Engineering mehr benötigt. Das Modell nutzt eine Hybrid-Architektur aus abwechselnder Zeilen-/Spalten-Attention (ähnlich TabPFN) und einem kausalen ICL-Transformer (ähnlich TabICL) und wurde ausschließlich auf hunderten Millionen synthetischer, mittels struktureller Kausalmodelle generierter Datensätze trainiert. Die Modellgewichte sind auf Hugging Face und der Code auf GitHub verfügbar; eine Integration in BigQuery über einen SQL-Befehl "AI.PREDICT" ist für die kommenden Wochen angekündigt, aber noch nicht produktiv verfügbar.
Features
| Deployment (Self-host/Cloud) | Self-Host via GitHub-Repo (CPU-only JAX oder CUDA-12-GPU-Variante); geplante Cloud-Nutzung via BigQuery AI.PREDICT |
| Durchsatz/Latenz | Evaluiert auf TabArena (38 Klassifikations-, 13 Regressionsdatensätze, 700–150.000 Samples); Vorhersage in einem einzigen Forward-Pass ohne Training |
| Lizenz | Quellcode Apache 2.0 (GitHub); Modellgewichte unter separater TabFM Non-Commercial License v1.0 (Hugging Face) |
| Plattform | Verfügbar auf Hugging Face und GitHub; Integration in Google BigQuery (AI.PREDICT) für die kommenden Wochen angekündigt |
| Protokoll-Kompatibilität | scikit-learn-kompatible API (fit/predict); geplanter SQL-Zugriff via BigQuery-Befehl AI.PREDICT |
| Release-Datum | 30. Juni 2026 (Google Research Blog-Announcement) |
| Unterstützte Modelle/Provider | Ein Modell (TabFM v1.0.0) mit JAX- und PyTorch-Backend; scikit-learn-kompatible Classifier/Regressor-API |