TOP>技術/研究>化学/材料>自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および生成AI時代における材料開発への応用の可能性

65 of 76

2025/09/25(木) 13:00 ON AIR

株式会社AndTech

2025年9月25日開催

自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および生成AI時代における材料開発への応用の可能性

材料科学分野における言語処理の応用、大規模言語モデルを活用した専門分野におけるQAシステムの開発、ゼロベースで機械学習などを社内展開するために不可欠な研究データの記録や活用について解説！

質問OK 初～中級者向け返金保証

49,500 円(税込)

販売終了

複数名でのお申込みについて

視聴時間: 4時間5分詳細へ

販売期間: 終了

商品コード: ivkW10QG

視聴期間/スケジュール

以下の期間でライブ配信を行ないます。

2025/09/25 13:00 から 2025/09/25 17:05 まで

イベント概要

★202５年9月25日WEBでオンライン開講。物質・材料研究機構　吉武氏、株式会社TDAI Lab　福馬氏、シュレーディンガー株式会社　石崎氏が、【自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および生成AI時代における材料開発への応用の可能性】について解説する講座です。

■本講座の注目ポイント

★材料科学分野における言語処理の応用、大規模言語モデルを活用した専門分野におけるQAシステムの開発、ゼロベースで機械学習などを社内展開するために不可欠な研究データの記録や活用について解説！

カリキュラム/プログラム

【本セミナーの主題および状況・本講座の注目ポイント】

■本セミナーの主題および状況（講師より）

★ビッグデータ、AI、機械学習などといった情報処理技術の進展によりマテリアルズインフォマティクス(MI)という形で膨大な数の実験や論文を解析して材料の製造方法を予測することで材料開発の効率を向上させる取り組みが活発化しております。

★自然言語処理や大規模言語モデル（LLM）による報告書からのデータ抽出が実用化に近づいておりますが、Excel方眼紙のような自由なフォーマットからの抽出は正確ではありません。

■注目ポイント

★自然言語処理技術の種類による活用法の違い、材料関連分野の文書の種類による言語処理技術活用の違いとは！？

★大規模言語モデルを活用した専門分野におけるQAシステムの開発とファクトチェックの仕組みを紹介！

★データ活用で先行する製薬研究を参考にゼロベースで機械学習などを社内展開するために不可欠な研究データの記録や活用について説明！

講座担当：牛田孝平

≪こちらの講座は、WEB上での開催のオンライン講座になります≫

【第1講】生成AI時代の材料科学分野における言語処理の応用展望：マテリアルズインフォマティクスの一部として

【時間】 13:00-14:15

【講師】物質・材料研究機構／オムロンサイニックスエックス／MatQ-lab　NIMS特別研究員 / プロジェクトリサーチャー / 個人事業主　吉武　道子　氏

【講演主旨】

　以下のような事柄について、概要を理解していただき、自社で展開する際の参考にしていただく。
　生成AI時代に材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。

【プログラム】

１．概観
　1.1 マテリアルズインフォマティクス
　　物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
　1.2 対象とする文書の種類と特徴
　　論文、特許、書籍、安全・規制に関わる法的文書、社内文書
　1.3 求められる処理の種類と特徴
　　文書分類、検索（目的文書の抽出）、情報の抽出（文中の特定情報の抽出）、文書の関連性、情報の関連性、知識グラフ
　1.4　生成AIが得意なこと・不得意なこと

２．言語処理の種類と活用
　2.1 単純な統計処理（処理は生成AIがプログラム作成）
　　・WordCloudなど：文書群の概観
　　・TF-IDEなど：文書群の分類や大規模言語モデルの拡張への利用
　2.2　単語・文のベクトル化（処理は生成AIがプログラム作成）
　　・Word2Vec、Doc2Vec：文書群の分類や大規模言語モデルの前処理や拡張への利用
　2.3　文法ベース（大規模言語モデルの前処理にも使われている）
　　・品詞解析
　　・構文解析／照応解析
　2.4　大規模言語モデル（生成AIの基盤）
　　・アテンション付きトランスフォーマー：GPTやBERT
　　・大規模言語生成モデル

３．材料関連分野に特化したモデル
　3.1　様々なモデル
　　・Word2Vec系：Mat2Vec
　　・BERT系：SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
　　・モデル作成時の条件に注意
　3.2　言語生成AIの材料分野応用
　　・Q＆A、プロンプトエンジニアリング、添付ファイルからの情報抽出
　　・RAG（Retrieval-Augmented Generation）：検索拡張生成
　　・KAG（Knowledge-Augmented Generation）またはGraphRAG: 知識拡張生成
　3.3　言語生成AI時代の材料分野のモデル評価指標
　3.4　材料知識グラフ

４．マルチモーダル化
　4.1　画像などテキストとは種類の異なるデータとテキスト（自然言語）のデータとの組み合わせ
　4.2　材料科学分野の画像と画像読み取りを要する問題の同時入力と回答
　4.3　材料科学分野の画像出力を要する問題の入力と回答

５．各自の用途に合った材料AIボットの自作
　毎回問い合わせの文章を入力しなくても、材料名とか特性を入れ替えるだけなど、レシピ作成AI的に使えるAIボットの自作方法

【質疑応答】

【キーワード】

文書の種類・目的別処理、材料特化型モデル、言語生成AIの自社知識適応、マルチモーダル化

【講演のポイント】

最先端の大規模言語モデルの基礎となる様々な技術には、目的によってはそれぞれの技術単体あるいは組み合わせが文書処理に有効な場合がある。時と場合に応じて、材料科学へ応用するのにどの言語処理技術を用いたらよいかがわかる。

【習得できる知識】

・自然言語処理技術の種類による活用法の違い
・材料関連分野の文書の種類による言語処理技術活用の違い
・統計処理（深層学習を含む）言語処理の特徴と活用
・言語生成AIの材料分野への応用例や自社情報の組み合わせ方
・マルチモーダル化（画像データとの組み合わせ）

【第2講】大規模言語モデルを活用した専門分野におけるQAシステムの開発とファクトチェックの仕組み（仮題）

【時間】 14:25-15:40

【講師】株式会社TDAI Lab　代表取締役社長　福馬　智生　氏

【講演主旨】

※現在、講師の先生に最新のご講演主旨をご考案いただいております。完成次第、本ページを更新いたします。

【プログラム】

※現在、講師の先生に最新のご講演プログラムをご考案いただいております。完成次第、本ページを更新いたします。

はじめに
1.　背景知識
　1.1　どうやって言葉を覚えた？
　1.2　さらにAIは進化する

2.　専門知識・最新知識への対応
　2.1　知識の外挿
　　2.1.1　コンテキストを用いた応答の例

3.　コンテキスト長さの限界
　3.1　再帰的要約（Recursive Summarization）
　3.2　検索との組み合わせ
　3.3　ツールの紹介

4.　ファクトチェック
　4.1　Hallucination
　4.2　ファクトチェックの仕組み
おわりに

【質疑応答】

【第3講】自然言語処理、大規模言語モデルによる活用可能なデータの収集に向けた課題と商用パッケージソフトを活用したインフォマティクス基盤構築

【時間】 15:50-17:05

【講師】シュレーディンガー株式会社　エンタープライズ・インフォマティクス部 / ストラテジック・デプロイメント兼ビジネス開発マネージャー　石崎　貴志　氏

【講演主旨】

　材料研究では、月報や報告書への文書としての記録が中心で、活用を前提としたデータの記録や蓄積、特に失敗データの記録は少ない。近年、自然言語処理やLLMによる報告書からのデータ抽出が実用化に近づいているが、Excel方眼紙のような自由なフォーマットからの抽出は正確ではない。本講演では、データ活用で先行する製薬研究を参考に、データ記録・蓄積、データ加工、付加価値計算、幅広いユーザによる活用を可能にする仕組みについて解説する。

【プログラム】

１．マテリアルズ・インフォマティクスの現在地
　1.1　MI向けソフトウェアの歴史
　1.2　企業研究における一般的なMIの課題
　1.3　データ駆動型研究

２．データの記録
　2.1　登録システム（付番管理）
　2.2　電子実験ノート/ELN
　2.3　アッセイデータ管理システム

３．データの活用
　3.1　研究で生じるデータの種類
　3.2　Pythonなどによるデータ処理
　3.3　データ計算システム

４．データ駆動型研究の実現のために
　4.1　商用パッケージソフトか自社開発か
　4.2　製薬研究で使うソフト
　4.3　ソフトウェアベンダーの事情

【質疑応答】

【キーワード】
マテリアルズ・インフォマティクス、データ駆動型研究、電子実験ノート、機械学習、データの利活用、研究DX、社内開発

【講演のポイント】
ゼロベースで機械学習などを社内展開するために不可欠な、研究データの記録や活用について、先行する製薬会社での例を説明する。またパッケージソフトを使うメリット・デメリットについて知ることで、自社に適した手段を選択できるようになる。

【習得できる知識】
・研究データの記録のベストプラクティス
・電子実験ノートの概要
・研究データの活用方法
・パッケージソフト導入と自社開発の利点・欠点

詳細

受講対象者の職種/職位

本テーマに関心のあるに携わる研究開発者・技術者・事業担当者

受講レベル

初～中級者向け
※受講レベルについて

受講についての補足

※領収書をご希望の方は、ご購入後にDeliveru（デリバル）にログインをして、領収書をダウンロードしてください。

※当講座では、同一部署の申込者様からのご紹介があれば、何名でもお1人につき16,500円で追加でお申し込みいただけます (申込者様は正規料金、お2人目以降は16,500円となります)。
2名以上の場合は、ファシオ・セミナー事務局までご連絡ください。

質問方法

セミナー担当 webinar@andtech.co.jp

配布資料

なし

※資料がある場合、動画の視聴ページからダウンロードができます。
※視聴期間の終了後はダウンロードできなくなります。

修了証の発行

なし

※「あり」の場合、動画の視聴ページからダウンロードができます。
※視聴期間の終了後はダウンロードできなくなります。

提供方法

Zoom配信

講師のプロフィール

講師名

経歴

第1部　物質・材料研究機構／オムロンサイニックスエックス／MatQ-lab　 NIMS特別研究員 / プロジェクトリサーチャー / 個人事業主　吉武　道子　氏

第2部　株式会社TDAI Lab　代表取締役社長　福馬　智生　氏

第3部　シュレーディンガー株式会社　エンタープライズ・インフォマティクス部 / ストラテジック・デプロイメント兼ビジネス開発マネージャー　石崎　貴志　氏

2005年味の素株式会社に入社し、当時のライフサイエンス研究所で遺伝子組換え作物の研究に取り組む。
2008年アクセルリス株式会社（現在のダッソー・システムズ）に入社し、材料研究向けデータサイエンス・ソフトウェアのビジネス開発に携わる。日本や韓国・中国・南アジア向けの技術営業として活躍。
2021年シュレーディンガー株式会社に入社し、データ駆動型研究推進アプリ「LiveDesign」などの市場開拓や導入支援に従事。