Key points are not available for this paper at this time.
データサイエンスは進化によって特徴づけられます:データサイエンスは探索的であるため、結果は瞬間瞬間で進化します;また、共同作業が可能であるため、結果は作業が手を変えると共に進化します。既存のツールはデータサイエンティストがコードの変更を追跡するのを支援しますが、コードがデータに生み出す反復的な変化を理解するためのサポートはあまり提供されていません。私たちは、データセットの違いを視覚化するアイデアを探索的データ分析のコア機能として探求しました。この概念を「ループ内の差分(DITL)」と呼んでいます。私たちは16人のプロのデータサイエンティストを対象としたユーザー調査でDITLを評価し、データを操作する際に彼らの行動の意味を理解するのに役立つことが分かりました。これらの発見を要約し、このアプローチが異なるデータサイエンスのワークフローに一般化できる方法について議論します。
Wang et al. (Wed,) はこの問いを研究しました。