データ解析ワークフローの再現性検証に関する論文がGigaScience誌に掲載されました
2023. 05. 11 /
当センターの大田 達郎 客員准教授らによる論文 “A workflow reproducibility scale for automatic validation of biological interpretation results” がGigaScience誌に掲載されました。 論文はオープンアクセスで下記URLからご覧いただけます。 https://doi.org/10.1093/gigascience/giad031
バイオインフォマティクスの分野では、データ解析ワークフローの再現性が重要な課題となっています。最近の技術の進歩により、ワークフローの実行は再現可能になりましたが、再現された結果の評価方法は不十分です。この研究では、再現性の評価尺度として、結果の生物学的な解釈を表す特徴値に基づいた「再現性スケール」を提案しています。また、この評価尺度を用いた結果の自動評価のためのシステムも開発しました。実験では、実際の研究プロジェクトやバイオインフォマティクスの分野でよく遭遇するユースケースを使用して、アプローチの有効性を示しました。このアプローチにより、再現性の評価をより細かく行うことができ、結果の同一性だけでなく、生物学的な解釈の一致も考慮できます。これにより、再現性に関するより具体的な議論が可能となります。
ソフトウェアは GitHub で OSS として公開されています。 https://github.com/sapporo-wes/tonkaz