Key points are not available for this paper at this time.
Alors que les entreprises commencent à développer et déployer des charges de travail de science des données complexes à grande échelle, le besoin de mécanismes permettant une science des données de niveau entreprise (par exemple, conformité ou audit) est devenu plus prononcé. Dans cet article, nous présentons Geyser, un système de provenance extensible pour les charges de travail de science des données qui peut servir de fondation pour une science des données de niveau entreprise. Notre système prend en charge à la fois la provenance statique et dynamique, sur une large gamme de scripts de science des données, guidé par une base de connaissances d'API de science des données. Nous démontrons la large applicabilité du système en utilisant diverses applications industrielles : extraction de provenance, conformité des modèles, linting de modèles, versionnage de modèles et détection de poisoning. Une vidéo de la démonstration est disponible à l'adresse https://aka.ms/geyserdemo.
Psallidas et al. (Sun,) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: