情報検索(IR)システムによって提供される内容は、既存の社会的バイアスやステレオタイプを反映する可能性があります。このようなバイアスは、検索結果においてのステレオタイプをさらに確立し、強化する結果を招く可能性があります。IRシステムの検索結果におけるジェンダーバイアスの研究を促進するために、私たちは118のバイアスに敏感な中立的検索クエリから成る新しい徹底的に監査されたデータセットであるGender Representation-Bias for Information Retrieval (Grep-BiasIR)を紹介します。このクエリセットは、検索結果におけるジェンダーのバイアス表現が社会的に問題視される可能性がある、幅広いジェンダー関連のトピックをカバーしています。各クエリは1つの関連文書と1つの非関連文書が付随しており、その文書は女性、男性、中立の3つのバリエーションで提供されます。このデータセットはhttps://github.com/KlaraKrieg/GrepBiasIRで入手可能です。
Kriegら(Sun,)はこの問題を研究しました。