化学で機械学習

Python

Psi4とRDKitが動くJupyter Lab環境をDockerで構築してみた

Dockerを使い、Psi4とRDKitが導入済みのJupyter Lab環境を構築する方法を解説。ライブラリの依存関係や競合問題を解決し、再現性の高い化学計算・ケモインフォマティクスの研究開発環境を容易に準備する手順を紹介します。
プログラミング

Python(RDKit)で学ぶ特徴量選択:多重共線性を解消し、信頼できる物性予測モデルを構築する

先日RDKitを用いた機械学習で「多重共線性」というものを学びました。本記事では、相関行列とVIF(分散拡大係数)を使い、情報の重複した特徴量を科学的に選択・削除する具体的な手順をPythonコード付きで解説します。モデルの予測精度と解釈性を向上させる実践的テクニックが学べます。
プログラミング

【RDKit機械学習入門】特徴量エンジニアリングで予測精度を上げてみる

「RDKit機械学習入門」シリーズ第2回。予測精度を向上させる鍵「特徴量エンジニアリング」を実践します。TPSAや水素結合といった化学的特徴量をモデルに追加し、化合物の水溶解度(logS)予測の精度が向上する過程をPythonコード付きで分かりやすく解説します。
化学で機械学習

【RDKit機械学習入門】Pythonで化合物の水溶解度を予測してみよう

RDKitとscikit-learnを用いてSMILESから水溶解度(log S)を予測するQSARモデルをPythonで構築。特徴量計算から線形回帰による評価まで、化学・創薬初心者にもわかりやすく解説します。
スポンサーリンク