機械学習

プログラミング

【機械学習初心者向け】Space Titanicで基本的な特徴量エンジニアリングをしてみた

この記事では、人気のKaggleコンペティション「Space Titanic」を題材に、データクリーニングから最初の機械学習モデルを提出するまでの一連の流れを、ステップバイステップで解説します。第一弾では「とりあえず手を動かして、機械学習を...
化学でデータサイエンス

DockerでRDKitが使えるケモインフォマティクス環境構築【py3Dmol・PubChemPyも】

DockerとVS Codeでrdkit・py3Dmol・PubChemPyが動く再現性の高いケモインフォマティクス環境を構築する手順を詳しく解説。Dockerfile、docker-compose、Jupyter連携、2D/3D分子表示まで一気に学べます。
プログラミング

pandasとXGBoostで行うデータ前処理と予測モデル構築【タイタニック編①】

Titanicコンペデータセットを題材に、データの欠損補完、特徴量変換、XGBoostによる予測までのプロセスを紹介します。
プログラミング

StratifiedKFoldによる交差検証の手順を解説【タイタニック編②】

タイタニックデータを題材に、StratifiedKFoldによるクロスバリデーションの仕組みと実装方法を初心者向けに解説します。
スポンサーリンク