Skip to content

Instantly share code, notes, and snippets.

@DaisukeMiyamoto
Last active March 6, 2021 20:30
Show Gist options
  • Save DaisukeMiyamoto/43d7c262f6d78acc0b38640c796c9793 to your computer and use it in GitHub Desktop.
Save DaisukeMiyamoto/43d7c262f6d78acc0b38640c796c9793 to your computer and use it in GitHub Desktop.

myPresto5 Screening Tutorial on AWS ParallelCluster with SGE

  • 2020/10/30 EBS容量設定を増加
  • 2020/08/07 ドキュメント作成

このドキュメントは参考情報として提供されるものであり、動作は保証されない。

AWS ParallelCluster 上で、myPresto5.0 in silico screening tutorial v5.0 180112(以下、元ドキュメント)を実行する手順について、元ドキュメントからの変更点について記載する。

set up AWS ParallelCluster

以下の手続きはAdministrator権限を有したIAM Userが、Cloud9上で実行することを前提として記載する。key-pairについては事前に作成しておくこと。 また、ParallelClusterのバージョンは、2.8.1で検証を行った。

install AWS ParallelCluster

sudo pip install aws-parallelcluster

create config file for AWS ParallelCluster

以下の内容のファイルを、~/.parallelcluster/config として作成する。<KEY_NAME>, <VPC_ID>, <MASTER_SUBNET_ID>, <COMPUTE_SUBNET_ID> については適時置き換えること。

  • ~/.parallelcluster/config
[aws]
aws_region_name = us-east-1

[global]
cluster_template = default
update_check = true
sanity_check = true

[aliases]
ssh = ssh {CFN_USER}@{MASTER_IP} {ARGS}

[cluster default]
key_name = <KEY_NAME>
base_os = centos7
scheduler = sge

master_instance_type = c5.xlarge
compute_instance_type = c5.12xlarge
max_queue_size = 20

master_root_volume_size = 1000

vpc_settings = default
dcv_settings = dcv1

tags = {"Project": "ParallelCluster-myPresto"}

[vpc default]
vpc_id = <VPC_ID>
master_subnet_id = <MASTER_SUBNET_ID>
compute_subnet_id = <COMPUTE_SUBNET_ID>

[dcv dcv1]
enable = master

create cluster

pcluster create mypresto-cluster

connect to the cluster by NICE-DCV

以下のコマンドにより、NICE-DCVによるリモートデスクトップアクセス用URLが生成される。

pcluster dcv connect -k <KEY_NAME>.pem mypresto-cluster

set up screening pack

元ドキュメントの中の、MTS法によるスクリーニングをベースとして記載する。 手順の通り、screening_pack YYMMDD .tar.gz及び、screening_data YYMMDD .tar.gzをParallelCluster上のHome directoryにアップロードする。

install screening_org_server

スクリーニング用プログラムとしては、screening_org_serverを使用するため、以下の手順でインストールを行う。

cd screening_packYYMMDD
cp -r screening_org_server screening_org
bin/install.sh

modify job scheduler commands

インストールが完了したら、実際の手順(5. MTS法 実行手順 screening_org_serverの場合)を実施する前に、以下のファイルを書き換える。

  • screening_org/base/bin/make_grid.csh

    • before
    bsub -i ${protein_name}.inp -o make_grid_${protein_name}.log -q qall -J "G_${protein_name}" ${sievgene}  
    
    • after
    qsub -b y -N "G_${protein_name}" -cwd -o make_grid_${protein_name}.log "${sievgene} < ${protein_name}.inp"
    
  • screening_org/base/bin/make_docking_score.csh

    • before
    bsub -o D_${docking_name}.log -q qall -J D_${docking_name} $CMD 
    
    • after
    qsub -b y -cwd -o D_${docking_name}.log -N D_${docking_name} $CMD  
    
  • screening_org/base/bin/run_group_MTS.pl

    • before
    system("bsub -o $output_file -i $input_file -q $que -J D_$code $CMD");   
    
    • after
    system("qsub -b y -o D_${code}.log -N D_${code} -cwd \"$CMD < $input_file\"")
    

また、以下のコマンドにより、screening_org/base/bin/RUN_docking.plに実行権限を付与する。

chmod +x screening_org/base/bin/RUN_docking.pl

calculation

元ドキュメント、「5. MTS法 実行手順 screening_org_serverの場合」について、指示通り実施する。

Visualization

手順完了後、myPresto Portalをインストールし、ターゲットタンパク質のPDBファイル及び、base/top/に出力される.mol2ファイルを読み込み、表示する。

@DaisukeMiyamoto
Copy link
Author

image

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment