データ解析ワークフローの品質管理に関する論文がGigaScience誌に掲載されました
2023. 02. 24 /
当センターの大田 達郎 特任助教らによる論文 “Workflow sharing with automated metadata validation and test execution to improve the reusability of published workflows” がGigaScience誌に掲載されました。 論文はオープンアクセスで下記URLからご覧いただけます。 https://doi.org/10.1093/gigascience/giad006
生命医科学分野、特にゲノム科学分野では様々なソフトウェアを組み合わせた一連の処理 = ワークフローを用いてデータ解析を行うことが一般的ですが、複雑なワークフローの構築や実行は困難です。データ解析におけるコスト削減のため、また論文発表されたデータ解析の透明性を高めるため、ワークフローの公開と共有が進んでいますが、公開されているワークフローの維持は開発者に委ねられており、しばしば手間がかかります。論文では、自動テストを通してワークフローの品質を維持し、再利用性の高いワークフローを共有する手法とその実装について解説しています。
ソフトウェアは GitHub でOSSとして公開されています。 https://github.com/sapporo-wes/yevis-cli