2025年冬CCS特集:第2部総論(技術動向)

データ駆動型研究の基盤で電子ノート浸透、奈良先端大が取り組み

 2025.12.03−データ駆動型研究の基盤として電子実験ノート(ELN)の導入および利活用が進展している。新しいデータは実験から得られることが多いため、データを集める入り口として、またデータを蓄積して利活用するプラットフォームとして、ELNが適していると考えられるためだ。このことは、基礎研究から産業応用まで幅広い研究を進める大学にも当てはまることで、すでに研究室単位では多くの大学でELNの活用が進んでいるとみられている。そうした中、今回は奈良先端科学技術大学院大学(NAIST)の取り組みに注目したい。全学レベルでELNを研究活動のハブにしようとしており、研究DX(リサーチトランスフォーメーション=RX)の推進を通して、研究シーズの社会実装をデジタル技術で加速させる方針を打ち出している。

                     ◇       ◇       ◇

◆◆フィジカルとサイバー融合、研究手法のパラダイム変革◆◆

 ELNは、もともと知的財産保護の観点で製薬企業などを中心に活用されていた「紙の実験ノート」を電子的に置き換えたもの。研究データの一元管理(実験条件、生データ、解析結果などのひも付け)ができる機能が、データ駆動型研究を進める際のプラットフォームになるとしてあらためて注目され、製薬業だけでなく、化学・機能材料、食品・化粧品、さらには大学などのアカデミック分野にまで裾野が広がってきている。

 奈良先端大では、次世代のRX(リサーチトランスフォーメーション)を人工知能(AI)とデータ、リモート化・スマート化を組み合わせた価値創造であると位置づけており、そのためにはフィジカルとサイバーの研究環境が融合することが重要だとしている。とくに、設計・合成・計測をつなぐ「RXサイクル」を基盤とした研究活動において、ELNはあらゆる情報やデータを蓄積し共有する仕組みとなり、フィジカルとサイバーを橋渡しする役割を担う。(別図参照)

 具体的な取り組みとして、奈良先端大は「データ駆動型サイエンス創造センター」(船津公人センター長/特任教授)を設立し、文部科学省の教育研究組織改革事業に採択された「RXプラットフォーム構築事業」(2023年度〜2027年度)としてプロジェクトを進めている。とくに、AIが実験計画を担い、ロボティクスによって実験が自動化するという時代に突入し、RXサイクルの回転が速くなっていることから、ELNとリモート計測の整備が2つの柱になっているという。とりわけ、船津教授は「RXサイクルでデータが流れることが重要で、このデータの流れが研究の仕方と人の意識の改革へとつながる。データにものを語らせるには、何のために何をしたいのかという、研究者の学術的・社会的視点からの価値観が強く求められる」と指摘する。「奈良先端大は、RXサイクル実装とELN活用による研究の仕方のパラダイム変革を大学・研究機関・産業界ともに推進していきたい」としている。

 今年1月、奈良先端大は文部科学省の「地域中核・特色ある研究大学強化促進事業(J-Peaks)」(2025年度〜2029年度)に採択された。とくに、奈良先端大は東南アジア5カ国における15の大学と連携するなど国際色の豊かさが特徴であり、卒業後は日本で就職したいという留学生も多い。そのため、RXサイクルを活用する研究感覚を備えた人材という意味で、「RXプラットフォーム構築事業」との両輪で進めていくことが今回の骨子となっている。

                     ◇       ◇       ◇

◆◆「使うことによる価値こそ議論」、オープンソース型を選定◆◆

 さて、肝心のELNの選定だが、全学利用という前提から、やはり費用の面が気になったという。「できるだけ低コストで使い勝手の良いものを探した結果、フランスで開発されたオープンソース型のelabFTWをみつけた」(船津教授)。Deltablot社から提供されている製品だが、サポート費用だけで利用でき、ライセンス料金はフリー。SaaS(サービスとしてのソフトウエア)またはオンプレミスでホスティングして使用できるが、奈良先端大は現状クラウド環境で運用している。

 船津教授は、「使用感や価格、データ管理やセキュリティ管理の問題、過去の紙による研究資産の問題などを考えると、ELNはそもそも導入ハードルが高く、ELNにネガティブな意見・感覚を持つ研究者もいる。しかし、世の中はデータ駆動の考え方で確実に前進しており、デジタル情報としてデータを蓄積する文化を大学からつくり、学生の就職や民間との共同研究を通して社会への普及を目指す使命は、大学として重要。使わない理由を考えるのではなく、使うことによる価値を考え議論すべきだ」と述べる。

 elabFTWの導入は、2022年5月から物質創成科学領域の15人(教員5人、学生10人)でスモールスタートし、「データ駆動型サイエンス創造センター」(DSC)による運用管理のもと、2024年6月にクラウド化、同年12月に全学への普及を目指した学内講習会を実施し、今年3月には「第1回NAIST電子ラボノートフォーラム」を開催している。第2回は来年3月13日に実施する予定だ。

 現在の利用は、物質創成科学領域全体に広がり、ユーザー数は250人(教員50人、学生200人)に拡大。さらに、今年7月に行った学内バイオサイエンス領域に対するワークショップ開催などの取り組みにより、ユーザー数は400人を超えつつある。奈良先端大には全体で教員200人、学生1,100人が存在するが、残る情報科学領域はそもそも実験ノートにあまりなじみがないことを考えると、全学展開にほぼめどがつきつつあるともいえるという。

 ELNとしてのelabFTWだが、使いやすいシンプルなGUI(グラフィカルユーザーインターフェース)を備え、定額の保守契約だけでユーザー数は無制限、データ管理やシステム管理の機能も考慮されており、情報漏洩対策やアカウント管理などのセキュリティ面にも不安はない。また、アプリケーションプログラミングインターフェイス(API)を用いたデータの入出力が容易で、AIや機械学習によるデータ活用にも柔軟に対応できる。導入初期には、協力研究室との意見交換を頻繁に行い、課題の洗い出しや検討を過不足なく実施。導入を検討している研究室に対して個別説明会を開いて疑問点や懸念点、要望などを丁寧にヒアリングした。また、学内組織の垣根を越えて部署および研究室が連携し合い、ELN運用環境を構築していったことも、導入がうまく進んだ要因だったと考えられる。

                     ◇       ◇       ◇

◆◆実験機器と連携、データ収集を自動化◆◆

 研究のフィジカルとサイバーを橋かけし、実験データをDXに活用するには、データベース化を想定してELNを運用することが不可欠で、データが個人帰属から離れ、共有利用が可能になることでデータ駆動型科学が有効になる。ただし、研究分野や内容によっては研究サイクルが回る速度が異なるため、どの段階の実験データであっても一元的に管理できる仕組みが必要。多様な実験でFAIR(データが見つけやすい、アクセスしやすい、相互運用しやすい、再利用しやすい)なデータの蓄積が可能なプラットフォームの確立を目指している。そこで、学内および学外の共用実験装置や計測機器からデータを回収するソフトウエア、あるいは自動合成機などに対しベイズ最適化で得られた実験条件を指示し、データを回収するソフトウエアなども自前で開発している。また、AIを利用して実験記録動画から作業内容のフローチャートを自動生成するという研究も行われている。ELNへの記録を自動化することも可能になるという。昭和のころには、研究者がプログラムを書くのは仕事ではなく、評価もされないという時代があったが、「時代が完全に変わった。いまはソフトの仕様がデザインできる人、ソフトを書ける人は重宝され、ありがたがられている」(船津教授)という。

 実験や試験依頼もELNを介して行うことができ、分析結果も自動的にELNに登録される。実際に装置を扱う担当者は、「測定が終わって、いちいちメールを出す手間が省けるのは助かっている。そのぶん、レスポンスが早くなったと思う」「測定に際して、試料の情報をすぐに参照できるのが良い。紙の依頼書よりも、簡単・便利で間違いが少ない」などのコメントが得られているということだ。

 船津教授は物質の創成に必要な機能を、「何をつくるか」(分子・材料設計)、「それはつくっても良いか」(環境・人体への有害性評価)、「どうつくるか」(合成経路設計、反応生成物予測)、「それはできたか」(物質構造の測定・解析)、「製品としてどうつくるか」(製造プロセスの開発・制御)、「どう物質循環させるか」(ゼロエミッションシミュレーション)−といった要素に分けて、そのライフサイクルを研究テーマとしてきた。

 「これからは個々の要素の深化も大切だが、相互のダイナミックな連携がますます重要になる。データの蓄積・解析に基づくAIの活用、それによる実験の自動化/自律化により、すべてがつながる未来がみえてきている。一方で、大学研究室には学生が書いた日報や月報がたまっている。それを大規模言語モデル(LLM)に読み込ませることにより、LLMに何か尋ねると、各研究室が長年蓄えてきた知識から示唆や答えを与えてくれるということもあり得ると考えている。研究室固有の知識を生かすようなかたちで、ELNとLLMが連携する未来もある」と船津教授。さらなる未来を見据えている。