Remrinのpython攻略日記

python3に入門しました。python3についてあれこれとサンプルコードとか。

テストデータ(3) アミノ酸 コドン表

m-RNAからアミノ酸へのコドン表
 

bases = "UCAG"
codons = [b1+b2+b3 for b1 in bases for b2 in bases for b3 in bases]
aminoacids = "FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG"
codon_dict = dict(zip(codons, aminoacids))
print(codon_dict)

#sort to display   
s = sorted([(k, v) for k,v in codon_dict.items()], key=lambda x:codons.index(x[0]))
for i, ele in enumerate(s):
    print("'{}':'{}', ".format(ele[0], ele[1]), "\n"*(i%4 == 3), end="")

 
コドン表

codon_dict={
'UUU':'F',  'UUC':'F',  'UUA':'L',  'UUG':'L',  
'UCU':'S',  'UCC':'S',  'UCA':'S',  'UCG':'S',  
'UAU':'Y',  'UAC':'Y',  'UAA':'*',  'UAG':'*',  
'UGU':'C',  'UGC':'C',  'UGA':'*',  'UGG':'W',  
'CUU':'L',  'CUC':'L',  'CUA':'L',  'CUG':'L',  
'CCU':'P',  'CCC':'P',  'CCA':'P',  'CCG':'P',  
'CAU':'H',  'CAC':'H',  'CAA':'Q',  'CAG':'Q',  
'CGU':'R',  'CGC':'R',  'CGA':'R',  'CGG':'R',  
'AUU':'I',  'AUC':'I',  'AUA':'I',  'AUG':'M',  
'ACU':'T',  'ACC':'T',  'ACA':'T',  'ACG':'T',  
'AAU':'N',  'AAC':'N',  'AAA':'K',  'AAG':'K',  
'AGU':'S',  'AGC':'S',  'AGA':'R',  'AGG':'R',  
'GUU':'V',  'GUC':'V',  'GUA':'V',  'GUG':'V',  
'GCU':'A',  'GCC':'A',  'GCA':'A',  'GCG':'A',  
'GAU':'D',  'GAC':'D',  'GAA':'E',  'GAG':'E',  
'GGU':'G',  'GGC':'G',  'GGA':'G',  'GGG':'G'}

 

1 letter 3 letters 英語名 日本語名
A Ala Alanine ラニ
C Cys Cysteine システイン
D Asp Aspartic Acid アスパラギン
E Glu Glutamic Acid グルタミン酸
F Phe Phenylalanine フェニルアラニン
G Gly Glycine グリシン
H His Histidine ヒスチジン
I Ile Isoleucine イソロイシン
K Lys Lysine リジン
L Leu Leucine ロイシン
M Met Methionine メチオニン
N Asn Asparagine アスパラギン
P Pro Proline プロリン
Q Gln Glutamine グルタミン
R Arg Arginine アルギニン
S Ser Serine セリン
T Thr Threonine スレオニン
V Val Valine バリン
W Trp Tryptophan トリプトファン
Y Tyr Tyrosine チロシン

 
・開始コドン
 AUGはメチオニンを指定するが、同時に開始コドンにもなっている、
 タンパク質合成が完了すると最初のメチオニンは切り離される。
 
・終止コドン
 UAA, UAG, UGA
 
・タンパク質合成
 DNA→(転写)→m-RNA前駆体→(スプライシング)→m-RNA→(翻訳)→タンパク質

参考:
Pythonで辞書の初期値をまとめて登録する方法 | Nana-Korobi