Skip to content

Commit

Permalink
Merge pull request #354 from oracle-japan/develop
Browse files Browse the repository at this point in the history
Update the OCI tutorilas:23bb3c119d7c649d165c9e25c9d544d27d507cc6
  • Loading branch information
fwiw6430 authored Feb 19, 2024
2 parents 1bd134a + 23bb3c1 commit 8233d90
Show file tree
Hide file tree
Showing 3 changed files with 337 additions and 0 deletions.
12 changes: 12 additions & 0 deletions _pages/hpc.md
Original file line number Diff line number Diff line change
Expand Up @@ -33,6 +33,7 @@ HPC/機械学習ワークロードを実行する際に有益なテクニカルT
- **[クラスタ管理](#3-3-クラスタ管理)**
- **[機械学習](#3-4-機械学習)**
- **[ソフトウェア環境](#3-5-ソフトウェア環境)**
- **[その他](#3-6-その他)**

4. **[OCI HPC関連情報リンク集](#4-oci-hpc関連情報リンク集)**
HPC/機械学習ワークロードを実行する際に有益なテクニカル情報を提供するウェブサイトの情報を集めています。
Expand Down Expand Up @@ -232,6 +233,10 @@ HPC/機械学習ワークロードを実行する際に有益なテクニカル

このカテゴリは、HPC/機械学習ワークロードを実行する環境を構築する際に必要となる、プログラム開発環境(コンパイラ、MPI)やリソース管理・ジョブ管理システム(ジョブスケジューラ、コンテナランタイム)等のソフトウェア環境を構築・整備する際に有益なテクニカルTipsを集めています。

- **[その他](#3-6-その他)**

このカテゴリは、以上の何れのカテゴリにも属さないテクニカルTipsを集めています。

## 3-1. クラスタ・ネットワーク

- **[クラスタネットワーキングイメージを使ったクラスタ・ネットワーク接続方法](/ocitutorials/hpc/tech-knowhow/howto-connect-clusternetwork/)**
Expand Down Expand Up @@ -348,6 +353,13 @@ HPC/機械学習ワークロードを実行する際に有益なテクニカル
**OpenMPI** で作成したアプリケーションのHPC/GPUクラスタに於ける実行は、計算リソース有効利用の観点から通常ジョブスケジューラを介したバッチジョブとして行いますが、ジョブスケジューラが **[Slurm](https://slurm.schedmd.com/)** の場合、 **[PMIx](https://pmix.github.io/)** を使用することでMPIアプリケーションの起動や通信初期化のスケーラビリティを向上させることが可能です。
本テクニカルTipsは、 **PMIx** を使用する **Slurm** 環境での利用を前提とする **OpenMPI** 構築方法を解説します。

## 3-6. その他

- **[ベアメタル・インスタンスのカーネルダンプ取得方法](/ocitutorials/hpc/tech-knowhow/kdump-on-baremetal/)**

カーネルダンプは、Linuxカーネルに関連する問題を解析する際に重要な情報ですが、ルートファイルシステムを含む **ブート・ボリューム** をiSCSI接続する **ベアメタル・インスタンス** は、 **仮想マシン・インスタンス** と比較してその取得に特別な準備が必要です。
本テクニカルTipsは、 **ベアメタル・インスタンス** でカーネルダンプを取得し、これをcrashコマンドで読み込むまでの手順を解説します。

***
# 4. OCI HPC関連情報リンク集

Expand Down
Loading

0 comments on commit 8233d90

Please sign in to comment.