top of page
特徴

Datachemical LAB Case Study Interview

From the research and education fields

25156493_m.jpg
対談

Professor Tatsuya Oshima

×

Shogo Yoshimaru

Professor, Chemistry and Life Science Program, Faculty of Engineering, University of Miyazaki

Data Chemical Co., Ltd. Representative Director and CEO

LOGO.png

background

"No-code x Materials Informatics" spreading to research and education

-Using AI in educational programs: University of Miyazaki's challenge to develop students' ability to think with data-

Materials informatics (MI), which is essential for accelerating material development, is now spreading not only in industry but also in education.
However, MI education requires high hurdles, such as specialized knowledge and programming (such as Python), and introducing it into the curriculum is not easy.
In this interview, Professor Tatsuya Oshima of the Faculty of Engineering at the University of Miyazaki will discuss a case in which he used the no-code MI tool "Datachemical LAB" in his own laboratory and university lectures, allowing students to "set their own problems and verify hypotheses using AI."
Practical education that develops the ability to "think with data" - what is the background, real results, and outlook for the future? Be sure to take a look at the cutting edge of digital transformation in education.

キャンディーコットン
LOGO.png

Cast introduction

大島先生

出演者

大島 達也 先生
宮崎大学 工学部
化学生命プログラム 教授

吉丸

インタビュアー

吉丸 昌吾
データケミカル株式会社
代表取締役CEO

1. What prompted you to start using machine learning in your research?

吉丸(司会)

本日はお時間をいただき、ありがとうございます。早速ですが、貴学でのDatachemical LAB導入から約3年が経ちました。まずは先生の研究における活用についてお伺いさせてください。

大島先生

私の研究は金属塩化物錯体の溶媒抽出に関するものなんですが、従来は金属錯体の設計が重要な研究に焦点が当たりがちでした。一方、私の研究対象は、溶媒そのものの物性が金属抽出において重要なパラメータとして効いてくる系であることに気づき、そこから溶媒のデータを集めて整理する方向に意識が向いていきました。
最初は溶解度パラメータを使って定性的に抽出能力を整理していたんですが、「もう少し踏み込めるのでは」と思い、抽出率を定量的に予測できないかと考えたんです。

吉丸

そこから機械学習に取り組み始められたのですね。

大島先生

ええ。ただ、当時はPythonでコードを書くのが前提でして、私も含めて情報系出身ではない研究室ですから、やっぱり継続的にやっていくには難しさがあったんです。そんな中でDatachemical LABがリリースされて、「これならいける」と。そこから研究室での機械学習活用は一気に広がりました。

_NTK7390.jpg

2. Student-led machine learning expands through the use of Datachemical LAB

吉丸

Datachemical LABを導入されてからの変化はいかがでしたか?

大島先生

一番大きかったのは、「プログラミングが要らない」ことですね。そこが学生にとって非常に大きなハードルを取り除いてくれたと思います。化学系の学生にとって、Pythonを1から勉強してモデルを構築するのはハードルが高い。でもDatachemical LABなら、素養がなくても取り組める。
結果的に、うちではもうPythonに戻るという選択肢はなくなりました。機械学習をやるならDatachemical LABでやる、という方針でやっています。

吉丸

成果にも繋がっているんでしょうか?

大島先生

最初に取り組んだ抽出率の予測モデルで、決定係数が0.94くらいの精度が出たところから始まって、今は学生が扱うデータ量も増えていますし、検証方法も変わってきました。現在は決定係数が0.98〜0.99と、かなり精度の高いモデルも構築できています。

_NTK7375.jpg

3. Results seen in the educational field and the reality of data utilization

吉丸

貴学とは、教育面での連携を目的に、弊社との間で連携協定を締結させていただいております。その一環で、今年は教育でもDatachemical LABを実際にご活用いただきました。

大島先生

はい。宮崎大学・工学部ではDX教育の取り組みが進んでいて、今回その実験演習の中でDatachemical LABを活用しました。これまでは、学生にPythonでコードを書かせるという構想もあったのですが、時間や技術的な制約が大きくて現実的ではありませんでした。

吉丸

Datachemical LABならそこをカバーできるということですね。

大島先生

ええ、今回は「有機化合物の水溶解度予測」をテーマに、モデル構築から検証までを一通り学生に経験させました。多くの学生にとっては、通常の学生実験とは全く違う体験だったようです。
特に、CSVでデータを瞬時に取得できるとか、構造式から特徴量を抽出して予測するという流れは、新鮮だったようで、「こんなことができるのか」と驚いている様子もありました。

[Exercise content]

Prediction of logS (water solubility) of organic compounds

Using the structures (SMILES notation) and water solubility data of 800 existing organic compounds as learning data, we performed machine learning predictions using the following steps.

① Descriptor calculation : 208 molecular descriptors are generated using the RDKit from the structures of organic compounds in the training data.

Preprocessing : Select features, remove unnecessary descriptors, and organize the data into one suitable for analysis.

3) Data visualization : Understanding data features using heat maps of correlation coefficients and scatter plots

Prediction of logS (water solubility) of organic compounds

④ Model building and prediction : Build a predictive model using the training data and predict the logS of the compound each participant selected as their research subject.

⑤ Verification : Compare the predicted results with literature values and consider the relationship with the structure.

Experimental exercise using Datachemical LAB

Experimental exercise using Datachemical LAB

4. Experimental Science and Machine Learning: How to Deal with "Data Shortage"

吉丸

研究や教育での機械学習活用の課題はどういったところにあるとお考えですか?

大島先生

データ量は課題ですね。実験系の研究って、基本的にデータの数が限られてしまうんですよね。ハイスループットで数万件データを取るような研究と比べると、どうしても条件が厳しい。
我々がやっている金属抽出の溶媒探索は、溶媒のスクリーニングにより比較的多いデータが収集できるテーマだったので、機械学習と相性が良かった。だから今は、どんなテーマなら現実的にデータが取れて、モデル化に向いているのかを常に考えながら進めています。

吉丸

やはり、テーマの特性や研究の現実に即して、どれだけデータが取れるかを見極める視点が重要になるのですね。まさに、そういった「データが限られている現場」でこそ、Datachemical LABが貢献できると考えています。少量のデータでも精度の高い予測が可能となるよう、様々な機能の改良を重ねてきました。今後も研究・教育の現場と連携しながら、この分野の可能性を広げていきたいと思っています。

5. How to deal with AI and machine learning: The attitude students need

吉丸

最後に、これからデータサイエンスを学んでいく学生さんに向けて、一言いただけますか?

大島先生

まず、AIや機械学習を過信しないことですね。今回の学生実験でも、予測精度は良かったとはいえ、完全に一致するようなモデルではありませんでした。でもそれでいい。むしろ、「うまくいかないこともある」と体験することが大事なんです。

吉丸

なるほど、それが使いこなすということなんですね。

大島先生

そう思います。機械学習も統計学の延長線上にあるものなので、結果がすべてではないし、そこからどう考えるかが大切です。AIが発達してデータサイエンスの重要性が増していくので、従来の理論科学的なアプローチ一辺倒ではなく、統計的手法を積極的に取り入れる姿勢が不可欠になってきます。なので学生には、「AIを使いこなす」という意識を持ってほしいですね。うまく使えば確かに強力な武器ですが、振り回されるものではありません。そういった“距離感”を持って、主体的に取り組んでもらいたいと思います。
また、今後は教育現場での活用を視野に、より実践的なパッケージ教材の開発にも取り組んでいきたいと考えています。

吉丸

素晴らしい取り組みだと思います。弊社としても大学教育の中でより広くDatachemical LABを活用できる機会を提供していきたいです。先生の教材開発へのお取り組み、ぜひ当社としてもご協力させてください。

大島先生

是非お願いします。

吉丸

ありがとうございました。先生の研究と教育に真摯に向き合う姿勢に、私たちも大いに刺激を受けました。

大島先生

こちらこそ、ありがとうございました。

_NTK7559.jpg

Currently, we are offering paid academic users the opportunity to use Datachemical LAB for educational purposes.

bottom of page