ハッカソンとバイオハッカソン

最近ハッカソンという言葉が巷で広がり始めているようなので、まとめておくことに。なお、ここに書かれている内容は筆者の個人的な思いであり、バイオハッカソンのオーガナイザーや主催者を代表しているものではないことを予めお断りしておく。

さて、日経ビジネスwebR25の記事を読んでみると、これまでDBCLSが中心として進めてきたそれとは少々スタイルが異なるものであることが分かる。DBCLSでは、様々な組織の協力を頂きながら、バイオハッカソンという名称で2008年から毎年ハッカソンを開催している。バイオハッカソンでは約一週間、原則として朝から晩まで食事以外は全て開発もしくは開発のための議論に時間が充てられる。開発成果に対する優劣はつけず、また賞品の授与も無い。ハッカソン全体の進み方はこうだ。最初に参加者間で課題を幾つか出し合い、それぞれに対応したチームが構成され作業が開始される。その後は適宜情報共有のためのセミナー的な場が同時並行的に、興味のある人が集まる形で開催されながら開発や議論が続く。そして最終日に成果を報告する形式となっている。なお、ハッカソンに先立ち、シンポジウムが行われているが、ハッカソンではないのでここでは記述しない。参加者については、2008年の第一回から数回はハッカソンのオーガナイザーが国内外を問わずにテーマに沿う活動を進めていると判断される招聘者を決定し、招待に応じて頂いた方に参加して頂いていたが、最近は予算の都合もあり、原則海外居住者は招聘で国内からの参加については事前登録さえすれば自費で誰でも自由という方針で運営されている。参加者の多くは学術機関に所属する研究者やシステム開発者である。

2012年に開かれたバイオハッカソンで作業にいそしむ参加者

2012年に開かれたバイオハッカソンで作業にいそしむ参加者

ハッカソンで新しい企画を練り上げ、期間中に集中的に開発して一段落付ける課題もある一方で、普段の業務で感じている問題点の中から外部関係者と直接交流することで解決への糸口が得られるものや、通常業務ではなかなか確保できない、ある程度まとまった開発時間を必要とする課題が出ることも多い。期間中、参加者は一つのチームだけに加わるのも良いし、複数のチームに跨がって自分の関われる部分に貢献するのも良いという自由でオープンな方針で作業が続けられる。ハッカソン期間中だけで目的の作業が終わらないこともあり、通常業務に戻ってからも連絡をとったり、小規模な会議を開いたりしながら作業が続くこともある。特に2010年からは国内で作業を継続している人々を対象としたハッカソンが国際的な交流が中心であるメインのバイオハッカソンの数ヶ月後に行われている。得られた成果のまとめとしてこれまで各ハッカソン開催後にそれぞれ一報の論文を発表しているが、2011年の開催分からは概要論文のほかにもチーム単位で論文を発表する動きも始まっている。

また、期間中には初めて顔を会わす人々との交流と息抜きを兼ねてバーベキューやちょっとした観光を楽しめる時間が用意されている。2012年は会場が富山市であったことから、地域を代表する祭り「おわら風の盆」や世界遺産の五箇山立山に行くツアーなどが企画された。このようにバイオハッカソンでは単にプログラミングを満喫できるだけでなく、様々なイベントを通じて参加者間の相互理解が進められるような仕掛けがなされている。

バイオハッカソンを最初に開催することを決めた動機は、様々な生命科学系のデータベースを利用するオープンソースのプログラムが開発されている中で、複数のデータベースやプログラムを横断的に利用しようとすると相互運用性の問題に直面することだったと記憶している。データ形式やプログラムの出力形式の標準化がされると望ましいわけで、それならば世界各地で実務を担当している開発者を一堂に集めて知識共有を進めることで効率的に問題の解決が出来るのではないか、ということだった。2008年当時は我々のセマンティックwebに対する勉強不足もあり、まずはSOAPRESTという、プログラムによるデータの融通を行う際の大きな枠組みとしてAPIの仕様をある程度共通の設計で行いましょう、という話で進めていくことになった。その後、リンクトデータ、リンクトオープンデータといった考え方が、生命科学の情報を扱う人々の間でも注目されていたことや、SOAPの有用性に対する問題が明らかになって来たこと、そしてResource Description Framework (RDF)を利用したデータベースの統合が我々の携わるプロジェクトのミッションになったことなどから、複数のデータベースを横断的に利用する際の作業の効率化に繋がる環境をセマンティックweb技術を利用して提供するために必要な課題が主体になってきた。例えば、RDF規格に基づくデータベースやSPARQLによる問合せに対応したインターフェースの構築、必要なオントロジーの整備などが含まれる。

バイオハッカソンに参加する動機としては、もちろん、招待されたから、あるいは業務が関連しているから、はたまた開催場所が良いから? というのもあるだろうが、それだけでなく、この場を利用してより良いサービスやツールを開発したい、という純粋な気持ちが働いている部分も大いにあるのではないかと感じる。昨年(2012年)の夏に行われたバイオハッカソンは国内参加者、すなわち自発的参加者の数が過去最高を記録した。「重要だからやる。」「好きだからやる。」「面白いからやる。」という気持ちに裏打ちされた動機がもたらす成果は、報酬により動機付けされた場合よりも良い結果をもたらす類いの課題があることが知られているが、まさにバイオハッカソンで扱われる課題がそれに該当すると思われ、そこに多くの参加者がいることは、本イベントの開催意義の大きさを感じさせる。

今年で6回目を迎えるバイオハッカソン2013は6月下旬に東京文京区にあるDBCLSで開催される。テーマは引き続きセマンティックwebを利用した生命科学分野のアプリケーションやデータの標準化、相互運用性の向上である。先立つシンポジウムも東京スカイツリーのあるソラマチ スペース634で行われる。いずれも事前登録さえ済ませれば参加費は無料で参加可能なので興味のある方は是非!