티스토리 뷰
https://doi.org/10.1146/annurev-biochem-063011-092449
나노바디 연구를 위한 전반적인 구조 및 기능, 생물학적 특성들과 applications들에 대한 reivew 페이퍼로 25년 2월 기준 citation을 2400회를 기록중인 Nanobody에 대한 바이블같은 리뷰 논문이다. 읽어가며 차근차근 개념을 정리하자. 나도 매번 Ab, Nb 구조들은 약어로 나타내는 통에 하도 헷갈려서 안되겠어서 정리하는 겸사 읽어본다.
1. Introduction


Mammals (포유류)에서는 2개의 Identical한 Heavy Chain(HC)과 2개의 Identical Light Chain (LC)으로 이루어져있는 Immunoglobulin-Gamma (IgG) 가 상당히 well-establish 되어있고 highly conserved되어있다. Figure1을 보면 나와있지만 IgG에도 sub type이 존재하는 것을 알 수 있다.
가장 대표적인 Ab 타입은 IgG1이다. 다음과 같은 특징들은 꼭 기억해두자
- 일반적으로 LC은 2개의 Domain (VL, CL)으로 HC은 4개의 Domain(VH, CH1, CH2, CH3)으로 이루어져있다.
- LC와 HC 모두 N-terminal 부분에 highly variable polypeptide로 이루어져있고 이 부분을 각각 Variable Domain of Heavy Chain, Variable Domain of Light Chain이라는 의미에서 (VH, VL)으로 표기한다.
- VH와 VL을 제외한 나머지 부분은 Constant Region of Heavy Chain/ Light Chain으로 CH, CL로 표기한다. 이 부분들은 Variable Region에 비해 상당히 conserved 되어있다.
- VH와 VL을 묶어서 Variable Fragment (Fv)로 표기하며 Antigen을 인지하는데 가장 중요한 부분이 된다.
- antigen binding Fragment (Fab)은 2개의 Variable domain과 2개의 Constant domain으로 구성된다. (VL, CL, VH, CH1)
- crystallizable Fragment (Fc)는 HC의 CH2-CH2, CH3-CH3 쌍으로 이루어져있다.
- CH의 마지막 2개 (CH2, CH3)는 immune cell들을 recruitment하거나 effector functions에 중요한 역할을 한다.
Mammals에서 별난 형태의 Antibody를 갖는 동물이 있는데 바로 낙타류(Camelidae)의 동물들이다. 얘들은 별나게도 Human의 Ab와 구조가 동일한 IgG1 타입 외에도 Heavy chain으로만 이루어진 Heavy Chain Antibodies (HCAbs)라는 형태의 Ab를 가진다. 이 HCAbs는 IgG2와 IgG3로 2개의 subtype이 존재한다. 이것들은 특이하게도 CH1이없고, Light Chain이 없다. IgG2는 IgG3보다 hinge 부분이 더 길다. HCAbs의 HC의 끝부분에는 Heavy Chain Antibody Variable Regeion (VHH) 라는 이름의 기능적으로 IgG1의 antigen binding Fragment (Fab)와 동일한 Antigen binidng 역할을 하는 부분이 존재한다. HCAb의 VHH는 single variable domain으로 antigen binding 여부를 쉽게 파악할 수 있다. 항원을 낙타류에 찔러넣어 immunizing을 한 뒤 blood를 뽑아내서 B-cell을 얻고 항원을 재차 주입하여 VHH를 많이 만들게 한 뒤 phage display등을 이용해서 panning하면 된다.
이런 VHH를 target antigen-specific하게 recombination하여 만든 것이 바로 Nanobody (Nbs) 또는 single domain Antibody (sdAb)라고 한다. 지금부터 Nb에 대한 여러 특성, 구조, therapeutic application 등을 자세히 알아보자
2. STRUCTURAL FEATURES OF HEAVY-CHAIN ANTIBODIES AND NANOBODIES
2.1. Heavy-Chain Antibody Subisotypes in Sera of Camelids
낙타류의 HCAbs의 가장 큰 특징은 다음 두가지다
- Light Chain이 없다
- CH1이 없다
따라서 기존의 conventional Ab가 갖는 보통의 단백질 크기인 150KDa보다 작은 90KDa정도의 크기를 가지며 이것은 hidden target으로 접근하는데 더 유리한 특성이 될 수 있다. 반면, 짧아진 길이 때문에 하나의 항체가 두가지 항원 부위에 다중 결합하는 cross-link 능력은 상실하는 경우가 보통이라고 생각된다고 한다. 근데 또 이것도 IgG2 같은 경우는 Pro-Gln으로 이루어진 긴 hinge가 CH1의 기능을 대체하여 어느정도 VHH 사이의 거리를 멀리 두게 만들어서 보완이 가능할 것으로 생각하기도 한단다 (Figure 1의 왼쪽 그림 참고)
심지어 각각의 IgG subtype들 마다도 isotype이 나누어져있다고 한다는데 (예를들어 IgG2a, IgG2b등) 정확한 연구는 어렵다고 한다. 워낙 비슷한데다가 구분도 잘 안된다나보다. 생성모델을 통한 Nb분야에서 이런 class subtype을 고려하는 것은 어느 정도 필요해보이긴 하므로 생각은 해봐야 할 문제인 것 같다.
중간중간 protein A/G가 등장하는데 뭔지 몰라서 ChatGPT를 통해 살짝 정리해보았다. 참고하자

- Protein A와 Protein G는 항체의 Fc 영역에 결합하는 세균 유래 단백질로, 항체 정제 및 연구에서 필수적인 도구
- Protein A는 특이성이 좁지만 인간 IgG1, IgG2, IgG4 서브클래스에 강하게 결합하며, Protein G는 더 넓은 인간 IgG3 및 인간 제외 동물의 IgG 전체 범위에 결합이 유리함
여러 Subtype의 IgG를 만들 수 있는 생성모델 platform을 제작하는 것은 충분히 유의미한 contribution이 될 수 있다고 생각되었다.
2.2. Sturcture of VHH

VHH의 Variable domain의 서열 다양성은 특히 3개의 Hypervariable region인 CDR1,2,3에서 상당한 수준으로 나타나며 상대적으로 conserved되어있고 constant한 서열을 갖는 Framework (FR) 1~4에 의해 나누어져 있다. Figure2를 참고하자. 3차원적인 구조로 보자면 4개의 FRs는 9개의 beta-strand 구조로 구성되며 그 사이사이에 연결을 위한 loop들과 CDR1, 2, 3가 존재하고 있다.
Antibody 구조에서 중요한 요소인 di-sulfide bond가 conserved되어 있는 부분이 보인다. Cys23-Cys94 사이의 disulfide가 그것이다. 또 트립토판 (Trp)가 존재하는게 보이는데, Trp는 트립토판으로 큰 방향족(aromatic) 곁사슬을 가진 아미노산이며 단백질 구조에서 종종 핵심적인 안정화 요소로 작용한다고 한다. 여기서 Trp는 이황화 결합 부위(Cys23-Cys94) 근처에 위치하여, 수소 결합, 방향족 상호작용(π-π stacking , pi-pi stacking) 또는 소수성 상호작용(hydrophobic interactions)을 통해 구조를 더욱 안정화한다고 한다. (20개 아미노산들의 특성을 공부할 필요가 있어보인다. 아미노산 선호도를 어떻게 구성할지를 모델에 input할 때 도움이 되는 배경지식을 제공할 것 같다.)
이 논문의 단점이라고 해야하나.. 용어 정리가 조금 정신없는 느낌이다 굳이 HyperVarialbe regions을 약어로 (HV)로 표기해놓고는 3개의 HV 부위는 또 각각 H1, H2, H3로 명명하겠단다. 헷갈린다 그냥 CDR1,2,3로 애초에 정해놓고 이야기하면 좋겠는데 약간 불만족스러운 부분이다. 나는 앞으로 그냥 CDR1~3와 FR1~4로 표기하겠다.
CDR1~3의 서열변이는 상당한 수준으로 나타나지만 CDR3를 제외하고는 length variation은 매우 제한적으로 나타난다고 한다. 또 보통 CDR1과 CDR2의 경우 alpha-Carbon의 위치의 변동성이 적어서 어느정도 고정된 위치나 형태의 루프만을 형성할 수 있다고 알려져 있다. (이 부분 상당히 중요해 보인다, 다른 생성모델들에서 과연 이런 부분까지 고려했던 논문들이 있는지 찾아봐야할 필요가 있겠다. 이것은 biological information을 이용한 충분히 좋은 contribution이 될 수 있겠다.) 다시말해 어느 정도의 구조는 conserved되어 있으므로, CDR3 loop의 length와 key residues를 알고 있다면 그 antibody의 구조를 예측하는데 큰 도움이 된다고 한다.
Conventional Ab에는 VH VL에 각각 3개씩의 CDR이 있고 이부분이 Antigen과 binding하기 위한 600~900 Å정도 면적의 paratope를 제공한다. 이렇게 생성된 paratope 부위는 cavity (구멍), groove (홈), flat 형태로 보통 나뉘며 각각은 small molecule, linear peptide, Larger Antigen과 결합하는데 주로 이용되는 structure라고한다. 해당 내용은 2002년도 연구를 기반으로 작성 되어있어서 조금 신뢰하기는 애매한데 이런 paratope의 형태와 interaction 관계는 조금 찾아보고 연구할 때 적용할 필요가 있어보인다. (https://doi.org/10.1016/s0065-3233(02)61004-6)
conventional VH와 카멜라이드의 VHH는 거의 유사한데 약간 다른부분은 FR2와 CDRs에서 발생한다고 한다. 보통 conventional Ab의 VH에서는 Val47, Gly49, Leu50, Trp52가 상당히 conserved되어있는 형태로 나타나며 소수성을 띄고 이 부분들을 통해서 Light chain과 interaction을 하는 경향을 보이는데 VHH에서는 대부분 이 부분이 작거나/친수성인 Phe42, Glu49, Arg50, Gly52로 바뀌어 나타나는 경향을 보인다고 한다. (Figure2 참고) 이런 변화가 VL과의 interaction을 방해하고 결합력을 떨어트리다보니 HCAbs에서는 LC이 붙지 못하고 HC만 남은 형태로 나타난다고 한다.
실제로 mouse의 VH가 VL과 함께 interaction하지 않는 경우 sticky하여 insoluble한데, 이런 VH도메인의 몇몇 AA를 VHH처럼 치환하면 어느정도 solubility가 돌아오는 것을 볼 수 있었다고 한다. 이 연구는 VHH의 구조적 안정성을 보여주는 좋은 예시라고 한다. (Camelising’ human-antibody fragments: NMR studies on VH domains, 1994)
또 single chain variable Fragment (scFv)에서 VL을 떼어내고 VH만 남겨서 항체로 사용해보려는 연구도 있었는데, 아무래도 VL을 떼어내면 구조적으로 불안정해서 매우 점성이 높아지고 solubility가 낮아졌다고 한다. 그래서 기존에 VH위에 존재하는 VL과의 interaction을 하던 부위인 interface에 mutation을 줘서 VH domain만으로 구조적으로 안정성을 띄는 항체를 찾아보려는 노력도 했었다고 한다. (https://doi.org/10.1074/jbc.m708536200) 최적의 치환을 찾아냈고 나름대로 좋은 solubility를 보이는 peptide를 찾았으나 낙타류의 VHH와 동일한 구조를 갖지는 않았다고 한다. 다시말해 자연에는 여전히 수많은 VHH 구조가 될 수 있는 후보들이 더 많이 남아있다고 생각할 수 있다. (이것을 생성모델로 만드는 것이 나의 목표)
또 다른 VH와 VHH의 큰 구조적 차이는 CDRs에서 나타난다고 한다. VL이 없기 때문에 conventional Ab와 달리 Heavy chain의 CDR1~3에서만 antigen-interaction이 발생한다. (VH에서는 VH와 VL 각각 3개씩의 CDR이 있으므로 6개의 interaction spot이 있는것) Large Antigen과의 interaction을 제공하기위해서는 최소한 600~800 Å정도 되는 binding paratope 면적이 필요한데 VHH는 비록 VH보다 CDR수는 3개 적지만 더 긴 CDR loop를 갖는다고한다. 특히 CDR1과 CDR3에서 차이가 두드러진다고 한다. (Figure2참고) 이렇게 Extended 되어있는 형태의 CDR loop를 이용해서 적은 수의 CDR로 antigen과 binding해야된다는 단점을 보완한다.
근데 또 한편으로는 너무 Extended 되어있는 CDR loop는 엔트로피 관점에서는 antigen과 binding하기에 좋은 조건은 아니라고 한다. Extended CDR loop는 large flexibility를 제공하지만, 이것이 오히려 Antigen과의 tight한 binding에는 방해가 되는 요소라고한다.
그러나 낙타류의 VHH에는 놀랍게도 CDR1과 CDR3에 Cys가 pair로 존재하는 경우가 많은데, 이 두 Cys가 서로 internal disulfide bond를 형성(Figure2의 노란색 라인)하면서 CDR1과 CDR3의 flexibility를 제한하고 이것이 antigen과의 binding에 문제가 되지 않도록 하는 요소가 된단다. 또 대부분의 경우(90%)는 CDR1과 CDR3에서 나타나지만 몇몇 VHH는 CDR3와 FR2에서의 disulfide bond를 형성하는 경우도 있다고 한다.
반면 또 라마류의 VHH에는 이런 internal disulfide bond가 별로 안나타난단다. 그럼 어떻게되느냐? 아까 Extended CDR loop에 의해 나타나는 large flexibility가 문제가 된다하지 않았는가? 놀랍게도 라마류에서는 이 문제를 회피하기 위해 낙타류보다 훨씬 짧은 CDR loop 길이를 갖는단다. 참 신기하지 않은가? 생물학의 세계는 절대로 그냥 나타나는 것이 없다 분명히 본인들에게 유리한 성질을 찾기 위해 발전하고 진화한다. 도대체 그 과정이 어떻게 이뤄지는지는 오직 신만이 알고 있지 않을까 하는 생각이 자연스레 들게된다.
VHH에서 CDR1의 경우는 30, 32, 33에 거의 항상 Cys가 고정되어있다고 한다. 반면 CDR3에 나타나는 Cys는 어떤 위치이던 관계없이 잘 나타난다고 한다.
그 외에도 다양한 특징들을 언급하고 있는데 너무 국소적인 특징들이라 생성모델에 하나하나 적용할 수는 없어보여 여기까지만 정리하고 넘어간다.
'Background > Biology' 카테고리의 다른 글
나노바디 생산 및 디자인 가이드 (0) | 2025.02.07 |
---|---|
나노바디 (Nanobody)리뷰 (2) 생물/화학적 특징 (0) | 2025.02.06 |
Antibody Antigen Generative Modeling (3) Modularity (0) | 2025.01.31 |
Antibody Antigen Generative Modeling (2) Learnability (0) | 2025.01.28 |
Antibody Antigen Generative Modeling (1) Introduction (0) | 2025.01.23 |
- Total
- Today
- Yesterday
- 3B1B따라잡기
- marginal likelihood
- 나노바디
- 최대우도추정
- kld
- elementry matrix
- 선형대수
- MatrixAlgebra
- 백준
- 3b1b
- 베이즈정리
- 파이썬
- nanobody
- 인공지능
- MLE
- manimtutorial
- 오일석기계학습
- eigenvector
- Manimlibrary
- Matrix algebra
- MorganCircularfingerprint
- ai신약개발
- variational autoencoder
- manim
- 제한볼츠만머신
- 이왜안
- manim library
- kl divergence
- 기계학습
- eigenvalue
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |